「ざつぶんくん」ふたたび

 人工無能、と呼ばれる会話ソフトを見たことがないだろうか。いや「人工無能」で広く通用する名称になっているのかどうか、正確なところはわからないのだが、少なくとも私がこの文章で意味するところの人工無能とは、超簡易的な一種の人工知能、コンピューターと人間がそれらしい会話を行うように作られたソフトウェアのうち、かなり安直な一つである。同種のCGIをウェブ上で見たこともあるし、私も手元のパソコンで作ってみたことがある。

 原理はこういうものだ。プログラムは、まずユーザーに文章を入力するように求める。入力された文章が、コンピューターにとって知らない言葉だったら、どう返事したらいいかを人間に聞く。その応答を記録しておき、次に人間側から同じ言葉の入力があったとき、これを答えとして返す。
「こんにちはジャッキー」
「ようキット。元気かい」
「『元気かい』、にはなんと答えたらいいですか」
「おいおいしょうがないな。『元気だともさ』とでも答えとくさ」
「『元気だともさ』、にはなんと答えたらいいですか」
「『そりゃよかった』かな」
「『そりゃよかった』、にはなんと答えたらいいですか」
「そうだな、『お互い様さ』でいいんじゃないかな」
「『お互い様さ』、にはなんと答えたらいいですか」
「ところでキット、元気かい」
「元気だともさ」
「そりゃなによりだ」
「『そりゃなによりだ』、にはなんと答えたらいいですか」
 と、だいたいこんな調子だ。会話を続けるとデータベースがゆっくりとだが豊かになってゆき、やがてどんな質問に対してもふさわしい答えができる、会話プログラムになるはずである。

 とはいっても、データベースが十分な大きさになるにはそれなりの時間(サルがシェークスピアをタイプし終える頃まで?)がかかるし、仮に完全な応答集ができたとて、決まりきった答えしかできないことには変わりない。ちょっと考えるだけでまともな会話にはとてもなりそうにないアルゴリズムで、実際にその通りである。ただ、もとより期待するところが多くないので、たまさかにびっくりするほど鋭い受け答えをする、その瞬間の快感を楽しむソフトなのだと思う。ウェブ上にCGIとして置いておくなどして、入力を多人数で行うことができればなおよい。

 ふと思ったのだが、これを使って「ざつぶんくん」が作れないだろうか。ざつぶんくん、と言われても分からない方はわからないと思うが、私が以前このページの記事にでっちあげた、仮想上の「雑文生成プログラム」である(※)。このコーナーに陳列してあるような「雑文」を、機械の力で作ってしまうもので、いわば真の意味での「ワードプロセッサ」だ。これが作れないか、つまり、人工知能に対する人工無能程度のものだろうが、なんとかそれらしいものが作れないか、ということである。

 人工無能式「ざつぶんくん」には種文が必要である。与えられた多数の文章をまず分析し、ある言葉の次にはどの言葉が来ることが多いかを解析する。文節単位よりは、単語を単位とするほうがいいかもしれない。例えば「原理」という単語を例に取ると、この単語の次に来るものは、助詞の「は」や「を」であることが多いだろう。まれに「主義」であることもあるかも知れないし、体言止めになって句読点(マルやテン)が次に来ることもあるに違いない。その頻度を、種文に登場した全ての語に対して表にしておくのである。念の為、二つ前の単語との相関、三つ前の単語と、一文章ぶん(できればもっと)くらいまでの距離の単語についても相関を取っておき、一連の表にしておくとよい。

 この「ざつぶんくん」を使って文章を作るときは、最初の一文くらいをユーザーが与えてやる。プログラムは、上の過程で作られた表を使い、入力された文章の次の単語を推定する。今回の文章の最初の文(このページの先頭)で言うと、最後が句点で、その前の単語が「か」、その前が「だろう」、その前が「ない」…という情報から、最も確率の高い単語はコレで、その次がコレ、という確率分布が得られるはずである。種文がそれほど多くない場合や、全く新しい単語をユーザーが入力した場合は、どの単語も確率ゼロという事態に陥ることになるが、その場合は確率をゼロにしてしまう珍しい単語を除外して続けることがなんとかできると思う。マルの後はある確率で「改行」や「文章の終了」が来るはずで、だからいずれは「文章の終了」が来て「ざつぶんくん」の動作が終わり、一本の文章ができる。種文の平均的な長さに近い文章ができるのではないか。

 もちろん、これを使って楽をしてここのコーナーを更新しようなどという、大それたことを考えているわけではない。こんな簡単なアルゴリズムではとてもまともな文章にはならないと思うし、だいたい、楽をしても何かいいことがあるわけではない。私は書くこと自体が楽しくて書いているのだから、他人に代わってもらっても嬉しくともなんともないのだ。ただ、自分の文章を種にして、こうして作った「文字列」を見たいとは思う。近傍の単語との相関だけをとるため、種文の味わいを微妙に再現した、コラージュ的な文字列が得られると思うのだ。

 写生した絵に色を塗るときに、股の間からさかさまに景色を覗いてみるといい、と言われる。描いている建物や山などの色は、普通の見方だとなかなか見えてこないのだそうである。さかさまにして、見慣れた形から崩してしまうことで、やっと色に注意がゆき、思い込んでいる色とは異なる、正しい色を見いだすことができるらしい。

 おそらくは「人工無能ざつぶんくん」が作り出した文字列は、股の間から自分の文章を覗くような、珍しい経験を与えてくれるに違いない。自分自身か、そうでなければ自分が非常に親しんでいる筆者の文章でないと今ひとつ面白くないのかも知れないのだが、ということは私が自分でやる分には自分が楽しくてちょうどいいのであり、なんら障害はない。文体と言えるほど偉そうなものはないし、種文が五百本足らずではまだ不足するような気もするが、あるいはここの文章が千本くらいたまったころに、ちょっとやってみたいことの一つである。


自動文章生成装置「ざつぶんくんDX」
トップページへ
▽前を読む][研究内容一覧へ][△次を読む