next:人工無脳のキャラクタ定義 >> Next Session:会話のモデル化と実装
新聞やTVで取り上げられる最新の人工知能たちの中には「自然言語をほぼ理解する」といわれているものが存在する。しかしこのことばを聞くとき、疑い深い人工無脳製作者の脳裏には必ず「本当に『理解』しているのか?」という疑念が浮かぶ。新たに人工知能を作ろうとする人々の多くが通る「とりあえず形態素解析で」ということばを聞くときにも、その先が意味の理解を目指しているのかと同様の懸念が頭から離れない。理解は可能なのか、理解とは何なのか。以下にこれらの問いに非常に大きな示唆を与えた一冊の本を紹介することで、彼らのアプローチの問題点を明らかにし、また人工無脳が必要としている新しい技術が何かを探ってみよう。
今回取り上げるのはヴィゴツキー(Выготский)が1934年に著した「思考と言語(Мышление и Речь)」11ヴィゴツキー著,柴田義松訳 "新訳版 思考と言語" 新読書社(2001) ISBN 4-7880-4110-3という本である。ヴィゴツキーが研究していたのは言語学でも人工知能でもなく、発達心理学である。 よく知られているように我々のことばを話す能力は生得的ではなく、学習によって徐々に成長させるものである。幼い子供が一人称として「私」や「僕」ではなく自分の名前を使うように子供には子供独特の未分化な思考体系とそれに一体となった言語の体系があり、それは成長するにつれ概念の発達した大人の思考-言語体系へと変化してゆく。ヴィゴツキーはこの思考と言語の関係をヒトの発達過程を通じて研究し、現在でも児童心理学や認知心理学などに大きな影響を与えている。人工無脳的には人間が言葉の意味をどのように捉えているかを示すまたとない教科書であり、さらに最新の認知心理学で語られるトピックスのいくつもが実に70年近く昔に作られたこの心理学体系のなかですでに語られ、それが現代向けに焼きなおされているだけであることに驚くのである。 以下に、特に我々にとって極めて印象深いトピックをいくつか紹介する。
この事実は形態素解析と構文解析の限界を示している。以下に本文から引用してみよう。
−「時計が落ちた」という句を取ってみよう。ここでは、「時計」が主語、「落ちた」が述語である。だが、この句が異なる状況のもとで二度発せられるのを、したがって同一の形式で二つの異なる思想が表現されるのを想像してみよう。私は、時計が止まっているのに気がつき、どうしてなのかとたずねる。これにたいして、「時計が落ちた」と答えられる。この場合には、私の意識には時計の表象がさいしょにある。この場合には、時計が心理的主語であり、それについて何かが語られる。時計が落ちたという表象は次に生ずる。この場合は「落ちた」は心理的述語であり、主語について語られることがらである。ここでは文法的成分と心理学的成分とは一致している。だが、それは一致しないこともある。
机に向かって勉強しているとき、私は物の落ちる音を聞いたので、何が落ちたのかたずねる。すると同じ「時計が落ちた」という答えがある。この場合には、落ちたものについての表象が先に意識にある。「落ちた」は、この句で述べられることであり、つまり心理的主語である。この主語について語られること、意識のなかに次に表れるものは心理的述語となる時計の表象である。本質的にはこの思想は、落ちたものは時計です、と表現することができよう。この場合は心理的述語と文法的述語は一致するが、上の例ではこれらは一致しない。分析は、複雑な句では文のどんな成分もが心理的述語となることができることを示している。−「思考と言語 新訳版」p.370どんな成分もが心理的述語となりうるということは、文法的なルールでは本当に主張したい核心部分が何かを押さえきれないことを意味する。人工無脳が会話を正しく継続するためにはこの心理的述語を押さえなければならない。
述語主義
書き言葉には主語と述語が必要とされ、話し言葉では主語は省略される傾向がある。ここで我々が言葉を発するとき、心の中には内言と呼ばれる伝えたいことのイメージが同時に発生し、心理学的には内言は述語だけから構成されている。話し言葉において主語が省略されるのは対話している双方が主語が何かを知っている場合であり、内言の場合には自分は常に主語が何かを知っているために、必ず主語が省略される。
内言ではまた、単語が短縮される傾向がある。
ルメトルが研究した12歳の少年の一人は「スイスの山は美しい」(Les montagnes de la Suisse sont belles)という句を「L, mn, d, l, S, b」という文字の並びで考えており、その後景には山の稜線のぼんやりした輪郭が浮かんでいた。ここで我々は内言形成の最も初期において文字の音声的側面を頭文字にまで短縮する方法を見出す。「思考と言語 新訳版」p.413このような省略は日本語ではあまりぴんと来ないが、「あれどうなった」などの指示代名詞の多用は文字の省略と同一の起源をもつように思われる。ここで言う述語は話し言葉のなかで絶対に省略できない要素であるので、入力文字列が短ければ短いほど述語が占める割合が大きいことを意味し、いいかげんな形態素解析を身上とする人工無脳にとっては的確な答えを生成しやすくなるとも考えられる。ただ「あれどうなった」で示される意味が何なのかはユーザが今何を考えているかを追跡していなければならない。
メモ:マルチモーダル(イントネーション・表情)