『音声に未来はあるか？』のレビュー

「OK, Google！」って、恥ずかしく言えない

　「オッケー」って小学生くらいの時は常用してましたけど、…最近いいますか？　「いいよ」「わかった」「ああ」くらいですよね。「ねえ、Google」というのもできるそうですが、しっくりきません。
　「Siri」も初め喜んで使ってみましたけど、予想していた明快なやり取りはできませんでした。そもそも聞き取ってもらえないですよね。文法通りに発話しないとダメだった？！
　そんな音声について、河野道成さんの「音声に未来はあるか？」日経BP社、という興味深い本を読みましたので、レビューしてみたいと思います。

音声に未来はあるか?

作者:河野道成
発売日: 2018/06/29
メディア: 単行本

本書の構成

　全部で９章からなっており、はじめに現状と未来を概観して、２章からって感じの本です。
　歴史やメリットデメリット、商品の紹介、さらに音声インターフェイスの構造に課題。そして一番興味深いのは、第７章の「音声対話」でした。
　人とシステムが音声で対話する難しさとは。言語だけの問題ではなく、文化や慣習の影響もあるというのです。この本のタイトルにある未来の考察は最後の数ページです。
　興味深いところを紹介していきたいと思います。

音声なら手ぶらでOK！

　そういえば最近Pepperをみかけません。2016年、スマートスピーカーといわれるものが発売され、対話ロボットもブームになりました。ですがどちらも生活に浸透はしませんでした。

　音声による検索は楽です。画面をみずに音声だけを使えば、目移りせずに目的にたどり着きます。

「例えば、アリアナ・グランデの曲を聴きたくなったとき、音楽配信サイトにある大量の楽曲の中から選ぶ作業が必要になります。従来のUIでは、スクロールバーやボタンを何度も押したり、場合によっては五十音順にソートしたり、テキスト入力によってコンテンツを探しだしたりすることになりますが、音声を使えば『アリアナ・グランデの曲をかけて』のひと言で済みます。」

引用：河野道成「音声に未来はあるか？」日経BP社、47頁 2018

　楽なのに、使われていません。どうしてでしょうか？

子どもは人形と会話している！

　子どものおもちゃのなかには、会話をしてくれるものがあります。単純にこちらの言葉を繰り返すだけの人形や、ペットのようなものから、多様なおしゃべりをする人形もあります。
　現在６歳の私の子どももCMに引っ張られ購入してみたものの、遊んで３日も持ちません。(もちろん個人差があります！)
　我が家のおもちゃは２、３千円から１万円という印象ですが、値段による違いはほぼありません。一様に遊ばなくなります。
　実は私にも覚えがあります。もっと会話できる「新しい友達」になってくれる！　というハードルだったのではないでしょうか。
　すると、何の機能もない人形のほうが、こちらの頭の中で遊べてしまったりするのです。
　つまり、

「対話・会話というのは単純に言葉のやり取りだけで成立しているのではなく、そこには文化的、心理的、社会的な価値が複雑に絡み合うインターフェイスなのです。」

上記174頁

f:id:irie-gen:20200315064714j:plain

向き不向き

　音声による操作は、ながら作業には向いているのですが、正確な作業は難しい。
　なんとなく音楽をかけてほしいときは可能ですが、聞いている曲を三十秒前からもう一度聞きたいと思っても、「ちょっと前からかけなおして」とはいえません。「ちょっと」が正確に何秒か、示す必要があるのです。
　できないことが続くと、もういいよと諦めてしまいます。
　同様に、Pepperにも似た側面があります。販売促進の定型文やウンチクに、単純な手遊びゲームばかりでは飽きてしまうのです。つまり、「雑談」ができないのです。
　ソフトバンクと吉本興業が組んで、Pepperの受け答えのシナリオを大量にストックしたそうです。ですが、それらのコンテンツも飽きられてしまったとか。

　つきつめると人間の側面が浮き上がってきます。
　反応速度が遅い問題もあるそうですが、そもそもこれからの分野なのです。

G-EXPERIENCE

体験した気にさせる物語ってどうなってるの？