iPhoneの音声入力で原稿を書いてみるとかなり実用的

| 2012年3月26日 | 0 Comments

私がパソコンを使い始めた、そうWindows95の頃、まだ音声認識入力は正直なところ「興味深いオモチャ」レベルだった(香取慎吾のTVCMが懐かしい)。しかし、昨今、音声認識技術は凄まじく進歩している。以前は高額なアプリケーションを必要とした処理が、今では無料のスマートフォンアプリで可能だ。しかも認識精度も劇的に向上している。

ポイントはクラウドだ。従来はパソコンの中で行っていた処理を、すべてクラウド側の高機能サーバに任せることで、端末側の性能に頼ることなく認識率の向上を実現している。

例えば、私のiPhoneに入っているアプリ「Dragon Dictation」の認識精度は、無料アプリであるにもかかわらず、実演してみせると誰でも「ほぅ!」と驚いてしまうレベルだ。

また、最新のiOSはネイティブアプリで音声入力をサポートするようになった。認識率は「Dragon Dictation」にやや劣る感触だが、やはりアプリを切替える手間なしに直接呼び出し、直接テキスト挿入できるメリットはとても大きい。

さて、こうなると、必ず考えるのが、この音声認識でブログなどの原稿が書けないだろうか?ということだ。確かにフリック入力は素晴らしい。しかし、やはりそれなりの長さの文章を書いたり、推敲したりとなると、キーボードが欲しい。だが日常シーンではキーボードを広げられないことも少なくない。口述した方が速いこともある。

という訳で。早速、試してみることにする。

アプリケーションは先程の「Dragon Dictation」を主に、iPhoneのネイティブ機能を補完的に利用する。まず適当に書きたい内容を思い浮かべたら、後はひたすらiPhoneに向かって語る。構成や順序にはあまり悩まず、とにかく思いつくままに話すのがミソ。編集は後でパソコンでする前提だ。

実際にやってみると、予想以上に誤認識が少ないことに驚く。多少の早口や、逆にどもってもきちんと拾う。これなら十分に実用レベルだ。喋り方を少し工夫してやると更に快適。個人的には、ほんの少しペースを落として、やや長めにまとめて話す。文節で心持ち音を切ることが効果的だった。

これが音声入力だけの原稿実物。一切、キーボードから訂正していないのだから、こうして見ると驚きだ。

その一方、折角ここ迄出来るのだから、ぜひ個人用辞書が欲しいとも感じた。例えば私は「Microsoftのグループウェア製品であるSharePoint Serverのコンサルタントでシンプレッソ・コンサルティング株式会社の代表」だが、これを「Dragon Dictation」が単独で正確に認識・変換するのは流石に無理がある。

また、クラウドである以上、仕方ないことではあるのだが、電波状況が悪いと利用できない。これは地味に重大な問題だ。通信量については測定していないので判らないが、定額制でないと不安なのは間違いないだろう。

とは言え、この原稿も結局、七~八割方はiPhoneでの音声入力だ。現時点での結論としては「充分実用的」と言えるだろう。

私の場合、今のことろ、一番この音声入力が活きるシーンは「移動中に原稿(のベース)が書ける」ことなのだが、問題は携帯(スマホ)に向かってブツブツ呟いている姿がとてもに怪しい、ということに尽きる。こればかりは、技術が多少進歩したとしても、どうしようもなさそうだ。

その為、もし万が一見かけたら、生暖かく見守りつつスルーして頂けるとありがたい。

音声入力 音声認識 自動翻訳161
Filed in: レビュー
×

Post a Comment