« ヘッドライトのくすみに悩む | トップページ | 壁紙交換で悩む »

2017年6月24日 (土)

Googleの底力に悩む

Youtubeの画像の右下に、「字幕」アイコンというのがある。歯車アイコンの左側だ。

これがなかなかの機能で、要するに動画で語られている言葉を字幕として表示しているわけだが、これがどうもリアルタイムに音声認識しているらしい(いや、別にリアルタイムでなくても事前処理でいいのか)。

例えば、この動画で字幕を表示させてみていると「巻いて」となるべきところが「相手」と表示されたりしていて(3:45あたり)、これはその音声認識が間違って聞き取ったものなのだと思う。

これはもともと英語の動画をみていてその字幕表示が妙にリアルというか、無駄に繰り替えされた言葉がそのまま表示されたり、聞き間違いっぽい間違いがあったりして気がついたのだった。

英語の動画で日本語翻訳がリアルタイムに表示されるようなのもあるようなのだが、これはどうも有志による翻訳が行われているらしい。まぁ、Google翻訳というのはトンチンカンで悪評高いわけだし。

しかし、こういう音声認識の地道な研究を続けているというのはたしした底力で、しかもそれを日々強化しているのだろうから相当な蓄積になっているのだろうなぁ。

日本でも「りんな」とかいうlineで動作する人工知能が稼働中だということだが、日本語音声認識はどこかで進められているのだろうか? 「りんな」も中国発の技術を日本マイクロソフトが発展させているということで、何だか国産感がないから他の企業とか研究機関なんかにも頑張ってほしいところだ。

|

« ヘッドライトのくすみに悩む | トップページ | 壁紙交換で悩む »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« ヘッドライトのくすみに悩む | トップページ | 壁紙交換で悩む »