Echo/アレクサは、ある程度聞き間違うように作られている

最近、ドイツの大学から、面白い調査結果が発表された。アマゾン エコーに何時間もテレビの音を聞かせたら、驚くほど沢山の言葉に反応してしまったというんだ。エコー/アレクサだけじゃなく、Google HomeやApple HomePodなど、いろんなスマートスピーカーで実験したところ、合計1,000以上の言葉で誤応答したと報告されている。

Amazon Echoを使うには、CMでやっているように、最初に「アレクサ」と呼びかけなきゃいけない。「アレクサ、〇〇して」というふうにね。普段は休眠状態のアレクサだけど、「アレクサ」という言葉を聞き取るとブルーのライトを光らせて目を覚ます。だけど、時々、関係ない言葉に反応することがあるんだ。別の言葉を「アレクサ」と勘違いしてしまうんだね。

ドイツの州立大学大学「Ruhr-Universität Bochum(ルール大学ボーフム)」の研究者たちは、アレクサがどんな言葉を聞き間違えるか調べた。実のところアレクサだけじゃなく、グーグル ホームや、アップルのホームポッド、中国のシャオミ(Xiaomi)やバイドゥ(Baidu)、テンセント(Tencent)から出ているものなど、複数のスマートスピーカーで調べたんだ。

具体的にどうしたかというと、テレビの近くに置いて、「ゲーム・オブ・スローンズ」とか「モダン・ファミリー」とか「ハウス・オブ・カード 野望の階段」といったドラマやニュース番組を、(スマートスピーカーたちに)何時間も聞かせ続けた。

すると、スマートスピーカーは、たまたま出てきた言葉を自分の名前と聞き間違えて反応してしまう。実際の実験では英語、ドイツ語、中国語の3ヶ国語で番組を聞かせたらしいけど、大学のニュースリリースには、英語の間違い例がいくつか紹介されている。

例えば、アマゾンのアレクサは、「unacceptable(アンアクセプタブル)」や「election(エレクション)」を「アレクサ」と聞き間違えた。グーグル ホームは「OK, cool(オーケー、クール)」を「オーケー グーグル」と聞き間違えた。AppleのSiri(シリ)は、「a city(ア シティ)」を「シリ」と間違えて反応した。Amazon Echoの場合、設定を変えて「アレクサ」という名前を「アマゾン」や「コンピューター」に変えられるけど、「Peter(ピーター)」という人名を「コンピューター」と間違え、「and the zone(アンド ザ ゾーン)」というフレーズを「アマゾン」と間違えて反応したという。そんなこんなで、実験したスマートスピーカーは、1000以上の言葉を自分の名前と勘違いすることが分かったんだ。

(「アレクサ」という名前を変更する方法は、本ブログの過去記事で説明しています)

こういった聞き間違いは、メーカーがある程度仕組んだものだ、と、実験をやったDorothea Kolossa教授は言っている。

「これらのデバイス(スマートスピーカー)は、ある程度大雑把に聞き取るようにプログラムされています。なぜなら、(曖昧な)人間の言葉を理解しなければならないからです。その結果、関係のない言葉に無反応であるよりも、反応することの方が遥かに多くなるのです」

ところで、アレクサがテレビの音に反応すると何がいけないか、というと、まず、アレクサが勝手に適当なことを喋り出すので邪魔になる。それに、もっと重要な、プライバシーの問題にも関わってくるからなんだ。

人工知能アレクサは、「アレクサ」と呼ばれると、その後に命令や質問が来ると予期して、録音状態になる。長時間じゃなく、ユーザーの命令や質問のフレーズが終わるまでの数秒間を録音する。なぜ録音するか、というと、後から人間(アマゾンが雇ったスタッフ)がチェックして、ユーザーの言ったことを正しく聞き取ったか調べるためなんだね。スタッフが聞いて、アレクサの応答がトンチンカンだったら、アレクサを教育し直すんだ。こうしてアレクサは、日々賢くなって行く。

さて、これがプライバシーとどう関わってくるか、というと、こういうことになる。まず、アレクサがテレビの音に反応して録音状態になった時を考えよう。アレクサは数秒間録音しながら、命令や質問を聞こうと待つ。けれど、相手はテレビだから、アレクサへの命令や質問は来ない。この時、偶然、ユーザーが何か話してたらどうなる? その声が録音されてしまうというわけなんだ。たまたま人に聞かれたくないことを話していれば、それが数秒間録音される。確率はすごく低いけど、パスワードを読み上げていたり、住所や電話番号を口にしていたら、やっぱり録音される。そして、後からアマゾンのスタッフが聞くことになる。アマゾンのスタッフは何も口外しないことになってるけど、実際のところ分からないよね。

だから、Echo/アレクサは、テレビから離して置こう。上の実験は英語、ドイツ語、中国語で行われたけど、僕の経験では、日本語のテレビ放送にも、結構反応するよ。