インタビューア待望の音声認識技術、2?3年以内に登場か?

カテゴリ: itgeneral

録音したインタビューや講演を原稿にする「テープ起こし」は本当に本当に心から面倒くさい(最近はICレコーダーが主流だが、やっぱりテープ起こしというようだ)。 長めの取材記事はいったんすべての録音内容を起こし、それから構成を練って原稿を書く方が結果的に作業効率がよいようだ(私の場合)。マイクロソフトのOneNote 2003Office 2004 for Macに含まれるWord 2004には、入力していたメモの内容と同期できる音声メモ機能が備わっているから、確認したい部分をすぐ呼び出せる……が、講演ならともかく、インタビュー中に相手の顔も見ずに、キーボードをカチャカチャ打つことは不可能。IT業界にはそういうことに慣れている人もいるかもしれないが、普通の人なら失礼に感じるだろうし、私自身も落ち着いて話を聞けない。

テープ起こしを業者に頼んでもいいのだが、専門的な用語は聞いた本人が起こさないと訳がわからなくなってしまう。音声認識ソフトは新聞記事の読み上げ程度なら役に立つが、インタビューではまったく使い物にならない。 というわけで、けっきょく、[おこしやす](http://www12.plala.or.jp/mojo/)や[自作のAppleScript](http://www.binword.com/blog/archives/000238.html)を使って、テープ起こしにいそしむことになる。

しかし、「会議の発言、瞬時に文書化 NECが新ソフト開発」という朝日新聞の記事が! 

NECは、雑音がある会議での発言など、従来技術では文書に変換することが困難だった人間の会話を、瞬時に文書にする技術を開発した。これまでの技術では、一人の話し手が一語一語はっきりと話した場合などだけ正確に文書にできた。新技術は、複数の人が普通に会話しても文書にできる。2?3年以内にパソコン向けに実用化をめざす。

これはすごい。しかも、大がかりなシステムではなく、パソコンレベルで使えるらしい。録音内容によってはどうやっても聞き取れなくて想像で補うしかないことも多いから、自分でざっと聞き直すことは必須だとは思うが。これが使い物になるのであれば、バンバン取材記事も受けられる。けど、原稿料を値切られないようにしないと。

コメント

のだいくこ
いつもblogを楽しみにしてます。 この記事、心が激しく揺さぶられました。私も効率が悪いとは知りつつも、全部おこしてから構成を決める派であり、インタビュー中は集中したいので。 以前購入したVia Voiceはよけい時間がかかった(笑) NECへの期待が高まりますね〜。
yunnan
仕事柄企業ヒアリングに録音をさせてもらうことがあります・・・が。書き起こしをアルバイトさんに頼んだら2時間を1日かかりました。業者だともっと早いんですかね?2時間分のフルの書き起こし×10回分だと読むのも大変で、結局2人で行って1人が書記をやるようになりましたけど・・・(会社によってはもっと多いこともあるし) できれば「あのですね、こういうことがあるじゃないですか、ほら」みたいのはすっ飛ばしてくれる機能があるともっとうれしい・・・
Tats_y
やっぱり全部起こしますよね! 無駄なことしてるかもなーと気にはなっていたので、同じことをやっている人がいてほっとしました。私もViaVoiceやらドラゴンスピーチやらを出るたびに胸躍らせながら買って、落胆してきました……。>のださん あ、もちろん上記のソフトは、音声メモや新聞・書籍の読み上げ等ではなかなかの認識精度です。念のため。 2時間を丸一日というのはちょっと時間がかかってるかもしれませんね。内容にもよりけりでしょうけど、余計な言葉はすっ飛ばして(ニュアンスをメモしておくのはインタビュー記事で重要だったりしますが)テープ起こしすれば、素人でも録音時間の2倍程度で何とかなるんじゃないかなー。>yunnanさん 「おこしやす」や拙作テープ起こし支援スクリプトは、キーボードから手を放さずに音声データの再生・停止ができるのでなかなか便利ですよ。 業者でも必要な作業時間はそんなに変わらないと思うんですけど、実際に発注したことがないんで、ちょっとわからないです。しかし、調べてみるとどこもけっこうなお値段しますね……。記事では「テープ起こしを業者に頼んでもいいのだが」なんて偉そうに書きましたが、こんなにお金がかかっては取材記事をやってられません。 トラックバックをいただいたAs mind is suitable...さんのブログによると、NECのシステムは映像検索に特化したものになるみたいですけどね。どうなんだろう。