AIの進歩に伴い、広範にわたるITソリューションがAI機能を搭載したり、AIベンダーが提供するAPIを利用し連携させることが当たり前となりつつある。消費者を取り巻く家電製品や自動車などにもAIの活用が進展するなか、本稿では、AIの活用によって認識精度が向上したスマートスピーカーの登場により、注目が高まっている音声認識技術について企業での活用を中心に述べる。
注目が高まるスマートスピーカーと音声認識
コンシューマー市場においてスマートスピーカーへの注目が急速に高まっている。2017年にAmazon.com社のEcho、Google社のGoogle Home、LINEのClova WAVEが国内で発売され、2018年2月にはApple社のHomePodが海外で発売された。これらのスマートスピーカーは、音声認識による操作を主としており、クラウド上にある音楽の配信や天気予報、ニュース、スケジュールの確認などが行える。その他、照明をはじめとした家電が規格に対応することで家電をコントロールすることが可能となっている。
スマートスピーカーの中核となる技術は、操作の基本である音声認識技術である。音声認識技術自体は、1990年代より、IBM社のViaVoice、アドバンスト・メディアのAsmivoice、Nuance社のドラゴンスピーチなど、各ベンダーが開発した音声認識技術を使ったソフトウェアが発売されていた。しかし、前述のスマートスピーカーにおいては、AIを活用した音声認識技術が利用されていることが大きな特徴である。
音声認識ソフトウェアやサービスは、大きくスタンドアロン(パッケージ)型とクラウド型に分けることができる。スタンドアロン型は、インターネット接続がないオフライン状態で音声を認識できるが、クラウド型はクラウド上のサーバで音声認識処理が行われるため、音声を認識するためにはインターネットへの接続が不可欠となる。