画像処理の難しさ2



さきがけデモも無事終了し、細かいライブラリも作成し終え、
いよいよ最後の山、画像認識と音声認識をガリガリと。

と、いっても、両方ともツライ。
本格的なものではなく、ディスプレイロボットを動かすのに充分なくらいの
実装なのですが、精度が厳しいですね。
いまのところ、画像認識にOpenCV、音声認識にはjuliusを使っています。
OpenCVにはだいぶ慣れて来たのですが、juliusの精度が良くない…
さきがけ会場で実行したところ、2,3語聞き取れれば充分、程度。

修論も押して来ましたし、いろいろと遅れそうです。

コメント

人気の投稿