revised 2003/04/22
next:Eliza >> Next Session:人工知能に学ぶ
更新履歴:2003/04/22 lumain.basの作者さんからメールをいただきました。我々が興味の対象とするのはソースが公開されており構造が簡単な人工無脳である。 日本における人工無脳史はプラットホームであるパーソナルコンピュータの変遷に大きく影響を受けている。独断に基づき2001年までの歴史を3つの年代にわけ、解説を試みる。
1980年代前半〜1990年代前半
人工無脳の歴史はパソコンの普及にほとんど時を同じくして始まった。それだけユーザが会話する相手としてのコンピュータに期待していたことがよくわかる。当時のパソコンといえばPC-8001、FM-7、X1、MZ-80などいずれも1バイト系文字だけを使うBASIC環境を特徴とし、ソフトウェアの流布は主に雑誌などの紙メディア中心であった。当時のPCはPC-6001などの例外を除きカタカナ表記しかできなかったため、人間にとっての読みやすさをかねて人工無脳へは人間が手動で文節をスペースに区切って入力するタイプが多かった。当時のソースは記録メディアおよびドライブの劣化やハードウェア自体が捨てられていることもあってほとんど残っていないが、ASCII-NETなどには人工無脳を研究するユーザのグループが存在していたようである。またこのころに限ってエミー、Ractorなど商用の人工無脳が日米で開発されていたことも大きな特徴である。ちなみに英語圏ではElizaが開発されてからすでに20年近く経とうとしており、技術的には日本よりもかなり進んでいた(英語は解析が楽だった)と思われる。一方日本では研究用の人工無脳として1984年に東京農工大の研究者からSCAM(Elizaのひらがな版と思われる)が発表されたが、この段階では漢字かな混じり文の形態素解析はかなり困難だと考えられていた。
人工無脳技術史の上での位置付けもはっきりしないが、最近発掘された当時の人工無脳のソースlumain.bas11lumain.bas(人工知能・太郎) 川畑智哉(ぷらねっとぐりーん) 初出:Oh!FM 1987年9月号を示す。この人工無脳は辞書を持たず、適当な言葉に対して質問をかえす機能だけから構成されていた。そのころもネットワークがあったとはいえ人工無脳は基本的にスタンドアロンであった。
1990年代前半〜1995年頃
この頃にはPC-9801シリーズなど全角漢字を使えるコンピュータが多く普及し、MS-DOS上で走るC言語で書かれたプログラムやMac上で動くプログラムが多く作られフロッピーを用いたコピーと配布が盛んであった。当時は質の高いPDS(今でいうフリーソフト)がたくさん開発され、現在の人工無脳の基本的なアーキテクチャが確立された。すなわちそのころ作られた人工無脳は二つの機能からなっていた。ひとつは人間の入力した文字列の中から自分の知っている単語を探索し,用意された文字列を返すという漢字変換類似の機能である。もうひとつは入力された文字列の中から未知の名詞を探し,それが何かをたずねる学習機能である。このような単純な機構でも時には会話が成立しているかのような感覚を味わうことができた。しかし会話のパターンは学習が進むと単調になる傾向があった。その原因はいちユーザによってのみ学習が行われることで,結局そのユーザの知識や意識だけを反映してしまうために学習すればするほどユーザ自身の「ひとりごと」へと近づいてしまうことにあると考えられる。
このころに作られた人工無脳もPC-9801アーキテクチャーの絶滅に伴って現在ではほとんど伝えられていない。一部の記録によれば語尾の変形(「だっちゃ」など)や人称の置き換えなどが実装された人工無脳が存在していたようである。また1990年には漢字かな混じり文に対応した日本語の形態素解析モジュールの基本ロジックがある研究チームによって開発され、商用の辞書引きソフト等に利用された。その後フリーの形態素解析モジュールも大学等から数種類発表され、現在では高い精度で構文の解析が可能となっている。
1995年〜2001年現在
Windows95が登場するころになるとWindowsマシン以外のDOS系PCはほぼ淘汰され、Macユーザも地道に増えていたことによりGUI環境で動く人工無脳が出始めた。同時にインターネットの普及とCGIという新たなプラットホームの普及が進み、それは結果として新人工無脳時代に入ってスタンドアロン型とネットワーク型の二つの潮流を生み出した。スタンドアロン型はふきだしを伴ったキャラクタとして画面の隅に立ったり表情を表現するグラフィックに注力されていることが特徴で、一部には秘書ツール的な要素を持つものもあった。特にこの中で多くのベンダーが存在したペルソナが採用したネットワーク更新機能を使った自動アップデートはユーザの飽きに対する一つの考え方として興味深い。スタンドアロン型でもうひとつ特筆すべきは会話に固定の相方を導入した偽春菜(現何か)であろう。ペルソナ、偽春菜の両者ともユーザとの自然言語によるやり取りは行わず、自分たちで勝手にしゃべることを通してユーザを会話の中に引き込むという新しい会話モデルを用いて成功した。
ネットワーク型人工無脳は旧人工無脳時代のアーキテクチャーをそのまま受け継いでいるがCGIやIRCを活動の場とすることで不特定多数のユーザと会話することができ、それゆえ一人のユーザの独り言に陥らないと期待された。ゆいぼっとや人工無脳カツオなどでは単調な返事を行わないための工夫がさまざまに施され、教育システムなども考えられていた。ネットワーク型人工無脳がもたらした重要な変化として誰かが人工無脳と会話したログを見て楽しむという新しい要素が加わった。その結果、開発者には辞書を作りこんだことに対する報酬を得られるというこれまでにない大きな圧力が発生し、より高いクオリティーの会話能力が人工無脳に求められるとともに、これまでの人工無脳のアーキテクチャーではチューンアップにも限界があることがうすうす感じられてきたといえよう。これ以外にも人工無脳はたくさん存在するが技術的には後期旧人工無脳時代から枝分かれ進化した種に分類される。