○File No.15

会話のモデルIII


これまで会話のモデルとしてカード型を考えてきたが、以前カードの集合体=デッキは結局会話の流れを考慮していないせりふのモデルにすぎなかった。すなわち会話を要素に分割してしまい、単位を見ていなかったといえる。ヴィゴツキーの例えを用いるならば、「水の性質を知るのに水素と酸素の性質を調べる」ようなものだったのである。これではいくらカードを眺めても、豊かな会話には結びつかない。そこで会話の流れに注目し、これまでの人工無脳のモデルを観察するとともに新しいモデルを考え直してみよう。


Fig.1 Elizaモデル

Elizaモデル

Fig.1 はElizaの動作を大まかに示した図である。ここで強調されているのはElizaの目的語抽出-質問生成といったサイクルが、ユーザの入力を「聞く」ことに注力されている点である。我々の雑談は相手と自分の間で行われる情報交換だということができるのだが、われわれは自分と相手と、どちらが先に話し始めるかを微妙な身振りや呼吸で決定し、片方が話し役(トーカ)、他方が聞き役(リスナ)になる。これは通信インタフェース業界では昔からの常識であるが、日曜の午前中にTVで見かけるような討論番組はそのようなネゴシエーションをしないですべての端末がトーカになりたがり、コリジョンを起こしているだけの輻輳ショーのようにも見える。それはともかくとしてわれわれが友達と会話するときは、トーカモードとリスナモードを使い分けている。トーカはひとつの話題を相手が一度に理解できるサイズのパケットに切り分けて送り、リスナーは確認(acknowledge)を返すとともに不審な点についてはすぐにたずねる。トーカのパケットをすべて受け取った時点でリスナはそれについての意見を述べる。そして次の話題をどちらが話すかのネゴシエーションに戻り、これを二人の話題がなくなるまで続けるわけである。

ここでElizaについてみると、リスナー部分だけからなっている。それでは日本語版の人工無脳はどうだろうか



Fig.2 日本語人工無脳モデル

日本語人工無脳モデル

日本語人工無脳は、目的語を日本語文字列から取り出すのが困難なため(試みているものもあるが)、基本的には単純なキー検索を用いてメッセージを生成している。Eliza系人工無脳よりもバリエーションにとんだランダムメッセージを生成する能力が高く、目的語を取り出さないためにユーザの発言についてほとんど興味を示さない。これは話し役のモデルといえる。日本語版が本質的にはトーカであって、辞書を巧妙に作ることでリスナーとしての能力も持たせようと無理をしているために、彼らはユーザの言うことを聞いているようで聞いていないことが多い。日本語人工無脳の会話にはストーリー性が感じられないと感じるユーザも多い。実はどちらもストーリー性がないのだが、人工無脳がリスナーに徹していればユーザが勝手にストーリーを作ってくれるので、それを感じないというわけである。

日本でもElizaのように人工無脳による心理カウンセリング実験が行われたことがあるが、トーカである日本語版人工無脳にリスナ役を行わせようとした点は課題の一つだといえるかもしれない。



Fig.3 総合的会話モデル

会話型人工無脳モデル

以上を踏まえれば、会話についてはもう一段高いレベルからモデルを構築しなければならない。人工無脳はユーザがログインしたときに、話したい内容を数枚のカードからなるデッキとして構築する。その後人工無脳はこれからネゴシエーションモードになり、会話をする中でトーカ、またはリスナのどちらの立場をとるかを決定する。トーカであればデッキからカードを引き、それについて何ターンかかけてユーザに内容を話す。ちなみにカードがなくなったときは「もう話題がなくなった」ことを伝える。リスナモードであれば、ユーザのせりふを聞き、一区切りまたはあるターンが経過するまで質問と相槌に徹する。トーカ、リスナの役が一度終わるとネゴシエーションステップに戻る。

つづく

[PREV]社会性の獲得 未定[NEXT]