音声研究から学んだこと ... マーケティングでビッグデータを活用するには


こんにちは、馬場です。

今週は音声認識・音声対話技術講習会に参加していました。学生のころの私は授業大嫌い、教科書と参考書があれば勉強できる、というタイプだったのですが、この全4日間の講習、本当に楽しかったです。研究者たちが、どこに着目をしどこにアイディアを得て、またどういう試行錯誤の末に「機械に会話をさせる」という途方もない夢を実現させようとしているのか、ということを研究者の口から直接聞けるのは、本を読むだけでは得られない体験でした。

例えば、音声合成。いわゆる平坦なロボット声/ロボットしゃべりの合成音声をいかにして自然なものにするか。そのために、情報処理の知識だけでなく、声帯や耳などの人の組織構造、音波の物理特性など、音声に関わるありとあらゆる知見を貪欲に取り入れ、結合させ、精度を損なわない程度のシンプルなルールを作り上げていく様は感動的でした。

もちろん自然言語処理同様、音声の世界も、ルールベースではなくビッグデータ解析による統計的確率モデル全盛です。もともと大量でなくてもビッグな音声データです。これまでコンピュータの処理速度などの制限がある中、精度を落とさずリアルタイムの対話を実現するために、利用する特徴量/モデルを徹底的な観察と深い思慮から選別していました。コンピュータの処理能力が大きく向上した現在は、生の大量データ(=ビッグデータ)を機械学習のアルゴリズム、特にこの1−2年はDeep Learning/ Deep Neural Network に適用するようなアプローチで、音声認識などの精度が飛躍的に向上したそうです。

それでは音声研究を進化させたのはビッグデータ(とそれを分析するための技術の発展)なのか。それは違うと思います。繰り返しになりますが、音声研究には「機械に会話をさせる」という野望があります。そして、野望を実現するために「そもそも自然な会話とは何なのか」ということについて繰り返し考えて得た知見があります。この2つの土台があったからこそ、新しい技術を適用することにより、さらに進化することができたのだろう、と感じました。

さて、世の中でビッグデータといえばマーケティングデータです。他の研究がデータの収集に苦心している中、マーケティングのビッグデータは「データが大量にある」という恵まれた状態からスタートしています。ただ、それ故に、そもそもの「マーケティングのこれを実現したい」という野望がありません。そのため土台となるターゲットに対する徹底的な観察、思慮がなく、結果データを活用しきれていないのが、ビッグデータの現状ではないでしょうか。つまり、ビッグデータをもっともっと活かすために今求められているのは、壮大な絵を描くことなのではないかな、と。そのような中、マーケティングコミュニケーションの心/共感といったところに踏み込もうとしている私たちの野望は充分大きいです。ただ、まだ圧倒的に問題領域の観察と思慮が足りていない、と反省しました。これからですよね。

音声の講習会でしたが、一線の研究者の様々な講義を聞くことにより多くの学びがありました(もちろん、素直に音声を処理する技術においても!)。運営に携わった皆様、ありがとうございました。


This entry was posted in その他. Bookmark the permalink.