最近、再び話題の人工知能にとって、やはり人々が期待しているのはコンピュータの持つ「人間らしさ」かと。
そもそも、コンピュータ・システムは「演算」、「制御」、「記憶」においては人間の力を遥かに超えた能力を持っているのですが、これの入出力の部分で、まだまだ人間との融合が難しく思われているのかも知れません。
昔、アニメや特撮なんかで出てきたコンピューターって、例えば「バビル二世」に出てきたものは塔の上の水晶球がピカピカ光って言葉を話していたりしておりましたが、当時の実際のコンピュータってものは音声認識なんて夢のまた夢みたいな感じで、パンチカードシステムだったりしました。
ところが最近のコンピュータは音声認識も随分と技術が進んで、ジャイアントロボや電人ザボーガーやバリブルーンも夢ではなくなってきたように思います。
今回、自作のソフトウェアに音声認識を組み入れてみようと、「Julius ( http://julius.osdn.jp/ )」というオープンソースの音声認識エンジンをインストールしてみました。
以下はデモ動画ですが、こちらはマシンに対してマイクを通じて「人数」を言葉で話して認識させるものですが、しっかりと認識できていることが確認できます。 非常に面白いですね。
これは辞書に1人から10人までの言葉を登録して実行させているものですが、この様子を見ていると様々な応用が出来そうです。
例えば、辞書に寿司ネタのメニューを登録しておけば、お寿司屋さんでのお客さんの声での注文が、自動的に注文票に登録されるなどのことが出来そうです。
この Julius の素晴らしいところは高い音声認識率もさながら、やはり何と言っても無償のオープンソースであり、各自で自由にカスタマイズしてソフトウェアに組み込むことが出来ることにあると言うことに尽きると思います。
公開元の Julius開発チームには心より敬意を表したいと思います。