Archive for the ‘dictionary’ Category

Babylon-Proで洋書を読む

水曜日, 9月 10th, 2003
[`evernote` not found]
Facebook にシェア

以前、銀河ヒッチハイク・ガイドについて語った時、PDF版はテキストのコピーが不可になっていると書いた。テキストをコピーできないんじゃ電子辞書を引けないと思っていたのだが、いい手があることに気付いた。
それは、情報収集ソフト「Babylon-Pro」を使うというもの。Babylon-Proは、マウスクリックだけで(ドラッグで選択する必要もない)単語や熟語を翻訳できるソフトだ。以前は翻訳ソフトと銘打っていたが、データベースから情報を引っ張ってくる用途なら何にでも使えることから、情報収集ソフトというようになったらしい。
Babylon-Proのユニークな点は、単語を認識するのにOCR技術を使っていること。つまり、テキストデータではなく、画像データに書かれた単語でも読み取れる。テキストのコピーを許可していないPDFであっても、Babylon-Proなら翻訳できるわけだ。読み取るソースは、別にPDFでなくても画像なら何でもいい。Quicktionaryといい、イスラエルの技術ってすごい……(やはり軍事技術と関係があるのだろうか)。
原書をスキャナで読み込み、OCRソフトでテキスト化すれば電子辞書が使えて便利だろうなと思ったことがあるが、テキストデータ化の面倒くささに挫折(で、QuicktionaryIIの世話になる)。ところが、Babylon-Proなら、スキャンして画像データにするところまででいい(それでも面倒くさいのは間違いないけど)。
今度、洋書を読む時はこの方法を試してみるか(→試してみたが、認識率が実用的ではなかった……)。

(2004年6月10日追記)
文書内容のコピーを不許可にしたPDFを作り、Babylon-Proで単語を引こうとしたところ、「この文書は Acrobat Reader により保護されており、Babylonの読み取りができないようになっています。」というメッセージが……。がっかり。

スーパー・ニッポニカをEPWINGに変換

水曜日, 8月 6th, 2003
[`evernote` not found]
Facebook にシェア

EB series support pageで、スーパーニッポニカ Toolkit 1.0が公開された。このツールは、小学館のスーパー・ニッポニカ2003 DVD-ROM Windows版Amazon)および2001[ライト版] Windows版Amazon)のデータをEPWING化できる。こうすれば、EPWING対応の検索ツールを使うことで、複数辞書の串刺し検索も行えるようになる。スーパー・ニッポニカが欲しくなってきたが、39,000円はちと高い。2003[ライト版]を早く出してもらいたいものだ。

EPWINGへの変換ツール

月曜日, 7月 14th, 2003
[`evernote` not found]
Facebook にシェア

一口に電子辞書といっても、そのデータ形式はさまざまだ。『ランダムハウス英語辞典』Amazon)は独自形式。『新明解国語辞典第五版』など、数多くのラインナップを揃えているシステムソフト電子辞典シリーズも1社だけの独自形式だ。
これに対して、EPWINGというのは、電子出版、電子辞書向けの共通フォーマットであり、サブセットがJIS X4081として制定されている。
技術的にどのフォーマットが有利なのかわからないが、EPWING準拠の辞書ビューアはいろいろなプラットフォームで発表されているし、1つの辞書ビューアで複数辞書の串刺し検索ができるから、私としてはやはりEPWING準拠の辞書を使いたい。
EB series support pageは、EPWING関連のツールが充実している。JIS X4081形式の辞書を作成できる「EBStudio」をはじめとして、システムソフト電子辞典→EPWINGの変換を行う「dessed-Win32」などは、非常に重宝しそうだ。また、『小学館スーパーニッポニカ2001ライト版』付属の国語大辞典を変換できる「小学館国語大辞典Toolkit」も発表され、さらにはスーパーニッポニカ本体の変換も予定しているとのことなので、完成がとても待ち遠しい。

銀河ヒッチハイク・ガイド(その3)

日曜日, 7月 13th, 2003
[`evernote` not found]
Facebook にシェア

(前回からの続き)
liff.pngDouglas Adamsは、『銀河ヒッチハイク・ガイド』以外にもいろいろ妙な本を記している。その1つが、“THE DEEPER MEANING OF LIFF”(John Lloydとの共著)。”A dictionary of things that there aren’t any words for yet”なんてキャッチが付いているが、これは日常生活で適当な言葉がない物事に、てきとーな言葉を当てた辞典だ。
例えば、”Yetman”という単語が載っているので、意味を見てみると……

A Yesman waiting to see who it would be most advantageous to agree with.

「誰に賛成するのが一番有利かタイミングを計っているイエスマン」とでも訳せばいいのか。ま、確かにそんなことを一語で表す言葉はないわな。こんな言葉がぎっしり詰まっている。あと、所々に語の意味を説明するイラストが挿入されているのだけど、どうでもいいようなことを百科事典のような真面目さで解説しているのがたまらなくおかしい。
『銀河ヒッチハイク・ガイド』シリーズでも、変な意味を割り当てられる言葉というのがいっぱい出てくる(というか、変な言葉しか出てこない)。例えば、主要キャラクターの1人、Fordの少年時代のあだ名は”Ix”(イックス)というのだが、これはベテルギウス第5惑星語で”boy who is not able satisfactorily to explain what a Hrung is, nor why it should choose to collapse on Betelgeuse Seven.”「フラングがいかなるものかちゃんと説明できないし、フラングがなぜベテルギウス第7惑星を衝突相手に選んだのかもわからない少年」(風見 潤訳)という意味だそうな。

電子辞書道楽(その5)

金曜日, 7月 11th, 2003
[`evernote` not found]
Facebook にシェア

(前回からの続き)
thesaurus2003.pngキャッチコピーを考える場合など、類義語をぱっと見たいだけなら、『デジタル類語辞典2003シソーラス』(ジャングル)というソフトもなかなか便利。単語を入力すると、関連する単語が「同義語」「広義語」「狭義語」「関連語」「反義語」というカテゴリー別に表示される。なお、単語の意味を調べたいなら別途辞書ソフトを使う必要がある。私が愛用しているJammingとの連携も可能だ。
しかし、同社が発売している『デジタル類語辞典2003シソーラス+校閲/推敲支援システム』はかなり不満。機能に不満とかではなく、15,800円のバージョンはなんと1200文字までしか校閲できない! これは400字詰め原稿用紙たったの3枚ですよ? 推敲が必要な文章はふつうもっと長いものだと思うが……。9万8,000円の『Professional版』ならこういう制限はないのだが、それなら1200文字までの制限版はいっそ体験版として配布すべきではないか。私は『デジタル類語辞典2003』ユーザーだったので、『+校閲/推敲支援システム』へのアップグレードの案内が来た時、嬉々として申し込んだのだが、実際の製品が来てかなり凹んでしまった。いや、Webページにも案内のDMにも1200文字という制限は書かれているから、それをきちんと確認しなかった私が全面的に悪いのだけど。

電子辞書道楽(その4)

水曜日, 7月 2nd, 2003
[`evernote` not found]
Facebook にシェア

(前回からの続き)
試しに、ランダムハウス英語辞典Amazon)に収録されている単語から、綴りの長いものを探してみることにした。
Jaammingの[環境設定]→[全体]→[最大表示数]を「50000」くらいにする。前方一致検索で「a」と入力すれば、「a」で始まる単語がすべてリストアップされる(言い忘れたが、JammingではEPWINGなどの辞書と同じようにランダムハウス英語辞典も扱える)。[Ctrl]+[B]を押して、リストの単語をクリップボードにコピーし、テキストエディタなどに貼り付ける。これを「a」から「z」まで繰り返せば、ランダムハウス英和辞典に含まれる見出しがすべてコピーできる。アクセント記号付きのアルファベットは外字で表示されているので、テキストエディタに貼り付けると化けてしまうが、まあとりあえずここでは無視しておく(検索結果をインデックスで表示すれば文字化けは起こらないが、その場合慣用句のスペースも詰めて表示されるので、どこまでが1単語かわからなくなる)。できたテキストデータから、音節の区切り(0xa5)と「ランダムハウス英語辞典」という文字列は削除しておいた。

この見出しリストを、次のようなRubyスクリプトに通す。これは、単語を文字数の多い順に並べるための超適当なスクリプトだ(スペース・カンマで区切られた項目は、最初のスペース・カンマの直前までを1つの単語としている)。

(さらに…)

電子辞書道楽(その3)

月曜日, 6月 30th, 2003
[`evernote` not found]
Facebook にシェア

(前回からの続き)
小学館のランダムハウス英語辞典Amazon)が届いたので、ちょっといじってみた。さすが、34万5000語は伊達じゃない。慣用句がとにかく豊富だし、英米の文献に登場する固有名詞もきっちり網羅している。一般的な英和辞書では、”memento”を「記念の品」くらいにしか説明していないが、ランダムハウス英和辞典では「記憶、記念唱:ミサ典文中の2つの祈りの一方;生ける者と死せる者のためにそれぞれささげる祈りで、Memento (remember)で始まる。」という意味も記載されている。また、日本語からも項目を引けるため、和英辞典としてもかなり使えそうだ。

英和辞典に突然興味を持ったのは、サイゾー7月号「町山智浩のUSAカニバケツ」で紹介されていた全米スペル大会のことを知ったから。その大会では、”onychophagia”(咬爪(こうそう)癖)なんて単語が出題されて、それの綴りを正確に答えるのだそうな。そういえば、世界で一番長い英単語は、”pneumonoultramicroscopicsilicovolcanoconiosis”(珪性(けいせい)肺塵(はいじん)症)だと聞いたことがある。ほかにもこういう変な単語があるかと思い、英和辞典で遊びたくなったのだ。(続く)

電子辞書道楽(その2)

金曜日, 6月 27th, 2003
[`evernote` not found]
Facebook にシェア

(前回から)
注文していた電子辞書(小学館のランダムハウス英語辞典)が届かなかったので、類語辞典について。
類語辞典は、言葉を意味的に分類し、近い意味にあるもの同士をまとめたものだ。角川類語新辞典では、「天文」「表情」「要求」といった100の項目に言葉を分類している。ちょっと言い回しを変えたい時とか、キャッチコピーなんかを付ける時にとても重宝している。私は以前、紙の類語国語辞典(角川類語新辞典のコンパクト版(かな?))を使っていた。意味分類で言葉が並べられているから、他の言葉との差異がわかりやすく、自分の言葉の世界を広げていける。また、同じ言葉が複数の項目に分類される場合もあるが(例えば「波」は物理的な波動のほか、情勢を表す時にも使われる)、類語国語辞典では個々の説明文中にも飛び先がきちんと付けられているから使いやすい。
ただし、どの類語辞典にも共通する欠点だと思うが、言葉を引く時、どうしても二度手間になる。一般的な国語辞典なら読みで引けば一発で言葉の意味がわかるが、類語辞典は読みを索引で調べ、説明のあるページに飛ぶという手順を踏む必要がある(分類項目表から言葉を調べる方法もあるが、こちらはあまり使われないだろう)。
ところが、電子類語辞典なら読みを入力すれば一発で説明文に飛べる!普通の国語辞典と同じ感覚で使えるのだ。角川類語新辞典の電子版は発売がかなり古く、今では取り扱っているところは少ないが、使ってみる価値はあると思う(3万円もしたが……)。もっとも、初期に出た電子辞典だけあって、こなれていないところもある。例えば、説明文の中に別の項目への飛び先があっても、これをクリックして飛ぶことができなかったりするのが、残念なところではある(検索ソフトの機能でカバーはできるけど)。

(さらに…)

電子辞書道楽(その1)

水曜日, 6月 25th, 2003
[`evernote` not found]
Facebook にシェア

編集という仕事柄か、辞書が好きだ。最近は紙の辞書はまったく使わず、電子辞書だけ。これなら場所を取らないし、コピーアンドペーストで引用も簡単、Webの辞書を調べるのも楽だ。
検索ツールとしては、JammingのWindows版とMac OS X版の両方を使っている。で、Jammingで利用している辞書は、以下の通り。

スーパー統合辞書1998(広辞苑第五版、研究社 新英和・和英中辞典、漢字源、現代用語の基礎知識1998年版、必携用字用語辞典)
類義語使い分け辞典
・角川類語新辞典
The Jargon File
不明解略語辞典
CG用語辞典
世界大百科事典
新明解国語辞典第五版
英辞郎

世界大百科事典と新明解国語辞典第五版、英辞郎以外はEPWING形式だ。英辞郎は、@niftyからダウンロード(@nifty会員なら無料でダウンロードできる)したものをJamming付属のユーティリティでコンバートして使用している。
こんなに辞書を入れてどうするかといえば、それはもちろん……えーと……趣味。辞書の執筆者達がきちんと整理した情報の空間をただよう快感というのか。これは、情報のごった煮のWebとはまた違った楽しみがある。検索ソフトを使えば、複数の辞書を串刺し検索することも簡単にできるから、大量の辞書だってタンスの肥やしにはならないのだ。
辞書は無味乾燥な情報が詰まっているかといえば、さにあらず。新明解国語辞典は、一言多くて読み物としてもけっこう楽しめたりする
私自身としては、角川類語新辞典が気に入っているし、よく使う。さらに最近、ある記事を読んだために、また新しい辞典を注文してしまった。(続く)

久しぶりのQuicktionaryII

水曜日, 6月 18th, 2003
[`evernote` not found]
Facebook にシェア

QuicktionaryII.jpg洋書を読む必要ができたので、数ヶ月ぶりにQuicktionaryIIを引っ張り出してきた。恥ずかしながら、原書の小説は最後まで読み通せたことがない。ハリー・ポッターの原書も最初の20ページ程度で挫折してしまった。ただ、自分がバックグラウンドの知識を持っている分野なら、100%はわからなくてもある程度は理解できる。それでも、知らない(+忘れた)単語は山のようにあるので、電子辞書が欠かせない。
QuicktionaryIIというのは、ペン型のスキャナ電子辞書。買ったのはもう3年以上前になるだろうか。前バージョンのQuicktionaryをPC雑誌のレビューのために試用する機会があり、なかなか気に入ったのでQuicktionaryIIが発表されたと同時にメーカー(WizCom)のページで注文した。
個人的には、非常に満足している製品だ。一般的な米英の書籍、雑誌の本文ならかなりの確率で認識できる。語彙数も約25万5000語だそうで(見出し語は2万8000語)、それほど不満は感じない。もうちょっと動作速度がきびきびしていればうれしいが、ストレスを感じるほどの遅さでもない。
しかし、この製品、売れなかったんじゃないかと思う。

(さらに…)