Babylon-Proで洋書を読む


以前、銀河ヒッチハイク・ガイドについて語った時、PDF版はテキストのコピーが不可になっていると書いた。テキストをコピーできないんじゃ電子辞書を引けないと思っていたのだが、いい手があることに気付いた。 それは、情報収集ソフト「Babylon-Pro」を使うというもの。Babylon-Proは、マウスクリックだけで(ドラッグで選択する必要もない)単語や熟語を翻訳できるソフトだ。以前は翻訳ソフトと銘打っていたが、データベースから情報を引っ張ってくる用途なら何にでも使えることから、情報収集ソフトというようになったらしい。 Babylon-Proのユニークな点は、単語を認識するのにOCR技術を使っていること。つまり、テキストデータではなく、画像データに書かれた単語でも読み取れる。テキストのコピーを許可していないPDFであっても、Babylon-Proなら翻訳できるわけだ。読み取るソースは、別にPDFでなくても画像なら何でもいい。Quicktionaryといい、イスラエルの技術ってすごい……(やはり軍事技術と関係があるのだろうか)。 原書をスキャナで読み込み、OCRソフトでテキスト化すれば電子辞書が使えて便利だろうなと思ったことがあるが、テキストデータ化の面倒くささに挫折(で、QuicktionaryIIの世話になる)。ところが、Babylon-Proなら、スキャンして画像データにするところまででいい(それでも面倒くさいのは間違いないけど)。 今度、洋書を読む時はこの方法を試してみるか(→試してみたが、認識率が実用的ではなかった……)。

(2004年6月10日追記) 文書内容のコピーを不許可にしたPDFを作り、Babylon-Proで単語を引こうとしたところ、「この文書は Acrobat Reader により保護されており、Babylonの読み取りができないようになっています。」というメッセージが……。がっかり。

コメント

zokkon
はじめまして。いつも何かと参考にしています。 いいこと聞きました。ありがとうございます。すごいなー Babylon-Pro。
Tats_y
ボランティアで作られた辞書が使えるとか、会社のデータベースから情報を引っ張ってこられるとか、すごく機能アップしてますね。 辞書作成ツールが無料で提供されていますから、個人住所録を辞書化するとか、いろいろ遊べそうです。米国の郵便番号簿はBabylonサイトにアップされていますが、日本用のがないので誰か作らないかな(←自分でやれって)
kamicup
ずいぶん前、無料だった頃に使っていました。アプリケーションに関係なく使える便利さが良いですよね。
Tats_y
数字をクリックした時は、貨幣換算になるとか、よく考えられてますね(度量衡やタイムゾーンの変換も可能)。 数字の前後にある単位も判別して変換してくれると、さらにうれしいんだけどなあ。
Tats_y
補足です。 単位がアルファベットの場合であれば、かなり自動判別してくれます。時刻やMB、mmといった単位もOKでした。