bard 検索(生成AIを利用したウェブ検索)(3)
2024 2 12 (art24-0623)
「東郷池が出てくる小説」と入力してbard検索をすると、5つの小説のタイトルと作者名、出版年、そして、簡単な紹介文が出力されました。いずれの小説も、実際には存在しない架空のものなのですが、どうして、こうのような回答が出てきたのでしょうか。回答をみて、まず気づく点があります。
「この小説は、東郷池に/を・・・」で始まる紹介文は、あたりさわりのない文章です。その為、東郷池を他の池、例えば、湖山池や宍道湖に交換しても、さらに、地名、たとえば、鳥取や松江に交換しても、通用する文章です。これは、言葉と、言葉の繋がりが類型的であるからです。これは、生成AIによる文章の特徴と言えます。
そもそも、生成AIによる文章の作成は、基底的には言葉の繋がりを確率的に決めているだけのものです。膨大な文章データをもとに、言葉Aに繋がっている言葉を解析して、高頻度で繋がっている言葉Bを選び出し、それを言葉Aに繋いでいきます。もっとも、文章の精度や汎用性を高めるために、学習モデルのチューニングや入力の改変や拡張を行っているようですが。いずれにしても、生成AIで作成された文章は、普段よく目にする言葉の繋がりを反映することになりますから、あたりさわりのない文章になります。
紹介文のなかで、唯一、恩田陸の『東郷池の奇跡』に、固有名詞 ”東日本大震災”が出てきます。
『東郷池の奇跡』 – 恩田陸(2017年)
この小説は、東郷池を舞台に、東日本大震災を題材にした小説です。震災の被害を受けた人々の、復興への歩みを温かい眼差しで描いています。
これは、生成AIによる作成文にはそぐわないものです。おそらく、これは、恩田陸をキーワードにした検索から、ひっかかった言葉を取り込んで文章を作成したのだと考えられます。
恩田陸の小説『EPITAPH東京』があります。 凡夫は読んでいないのですが、東日本大震災を経て東京五輪へ、少しずつ変貌していく「東京」を舞台にした戯曲作家のKが吸血鬼だという吉屋に出会い、東京の秘密を探る、と言った内容だそうです。
恩田陸と東日本大震災が結びつきました。東日本大震災の一語が加わることで、紹介文の内容が変貌していきますが、文章は、震災の報道でよく目にする言葉を繋いだだけの、あたりさわりのないものです。
また、恩田陸をキーワードにしたGoogle検索で、恩田 陸他5名(朝井 リョウ,あさの あつこ,伊坂 幸太郎,白河 三兎,三浦 しをん)による共作『X'mas Stories: 一年でいちばん奇跡が起きる日』がヒットしますから、東郷池に奇跡を繋いで、タイトルにしています。
さて、そもそも、東郷池と恩田陸、そして、2017年はどうやって結びついたのか。本当のところは分かりませんが、以下のような一つの可能性が考えられます。
東郷池、恩田陸、2017とキーワード入力してGoogle検索すると、湯梨浜町の広報「ゆりはま」の2018年6月号の13ページがヒットし、その中に、H29年(2017年)の図書貸し出しランキングリストに『蜂蜜と遠雷』恩田陸が、そして、下段に、東郷湖漁協組合が東郷湖のシジミを学校給食用に贈呈した記事が載っています。東郷池は東郷湖とも呼ばれていますから、このページで、東郷池―恩田陸―2017が結びつきます。また、東郷コミュニティだよりの60号に、東郷公民館の新刊入荷のお知らせとして「スキマワラシ」恩田陸とありますから、東郷池と恩田陸は結びつきます。恩田陸の小説『蜂蜜と遠雷』は2017年本屋大賞を受けていますから、東郷池ー恩田陸ー2017と結びつきます。
生成AIは、意味を理解したうえで、単語と単語をつないでいるわけではありませんから、検索でヒットした言葉を、ヒットしただけで、関連させてもおかしくありません。たまたま同一ページ上にある、あるいは、近隣の文上にある言葉が、結びつけられることがあるのでしょう。特に、ウェブ上の情報量がすくなく、ヒット数が少ない場合は、関連実体のない言葉が、関連させられることになります。
文章で回答されると、とかく、人は信用してしまいます。さらに、その文章があたりさわりのないものであればある程、抵抗なく受け入れてしまいます。生成AIが作成した文章は、まさに、そうしたものですから、注意が必要です。このあたり、bard検索(生成AIを利用したウェブ検索)の落とし穴と言えそうです。
次回へ続く。