今日も、"ようこそ"      

今日も、"ようこそ"

定年退職後、横浜市から湯梨浜町(鳥取県)に転居しました。 ここには、両親が建てた古い家が残っています。 徒歩5分で東郷池, 自転車15分で日本海です。 また、はわい温泉の温水が各家庭まで届き、自宅温泉を楽しめます。 ブログでも始めようかと、HPを立ち上げました。最近始めた木工工作と古くなった家のリフォームの様子を、田舎の日常に織り交ぜながら、お伝え出来ればと思います。

生成AIを利用したウェブ検索 (12)
AI-文書要約

2024 3 14 (art24-0632)
田山花袋の紀行文「東郷池の一夜」を、AI-要約ツール (ELYZA DIGEST、要約AI Samaru、Glarity-ChatGPT4) を用いて要約してみたところ、ちょと面白いことがわかりました。ELYZA DIGESTとSamaruの要約は、本文から一部を抜粋した句や文を羅列したようなものだったのですが、Glarity-ChatGPT4の方は、本文には使われていない言葉も加えて文をつくり総括的な要約になっている印象を受けました。

AI文章要約には、抽出型要約と抽象型要約があるそうです。
抽出型要約は入力した文章中から重要な部分を抽出して要約文とする。文章中の各パートに対して重要か重要でないかを判定して、重要な文だけをつないで要約文を生成するそうです。
抽象型要約は、文章全体の意味?をとらえて要約文を生成する。(ここでの意味とは、文章に含まれる言葉の関係性のことで、膨大な文章データの学習から得た情報とも紐づけられていることかな?)。文章に出てこない言葉や句も、関連性が強ければ、要約文の生成に使うことができるとか。

ELYZA DIGESTとSamaruの要約は抽出型であり、一方、Glarity-ChatGPT4は抽象型のようです。
Glarity-ChatGPT4の要約文には、紀行文「東郷池の一夜」で使われていない言葉(名詞)が多く出てきます。地元、名所、魅力、交流、観光地などですが、いずれの言葉も、個々の記事を包括的に表現するときによく用いられています。それにしても、これらの言葉を使って全体をうまくまとめて、自然な文章で書いていることには驚きです。

もう一度、文章を要約させて、抽出型と抽象型の違いをみてみました。使った文章は、前々回のブログ(No 10)の最初の部分です。

『Bard-AIやBing-AIなど、生成AIを利用したウェブ検索は、ウェブ上の記事を検索し、ヒットした記事を生成AIが要約して簡潔な文章で回答してくれますから、知りたい情報を手っ取り早く知るには便利なツールです。しかし、使用にあたり留意すべきことがあります。 一つは、知りたい情報の記事がウェブ上に存在しない場合です。「該当する記事がみつからないので、回答できません」云々とでも返してくれればよいのですが、生成AIが質問文中の言葉から、言葉をつないで文章を作成し、それを回答として返してくることがあります。もう一つは、事物AとBの関係性を示唆する記事が無い場合です。AとBがたまたま同じウェブページに記載されていただけで、AとBを関連させて回答することがあります。 こうした回答は、出典・引用元がありませんから、生成AIが勝手に作り上げた嘘の回答と言えます。』

以下のような要約になりました。

ELYZA DIGEST
生成AIを利用したウェブ検索は、ウェブ上の記事を検索し、ヒットした記事を要約してくれる。しかし、使用にあたり留意すべきことがあるという。知りたい情報の記事がウェブ上に存在しない場合や、事物AとBの関係性を示唆する記事が無い場合も。

要約AI Samaru
生成AIを利用したウェブ検索の注意点。知りたい情報の記事がウェブ上に存在しない場合、事物AとBの関係性を示唆する記事が無い場合。出典・引用元がないから、生成AIが勝手に作り上げた嘘の回答と言える。

Glarity-ChatGPT4
生成AIを利用したウェブ検索は、記事を要約して簡潔な回答を提供する便利なツールですが、注意が必要です。記事が存在しない場合や関係性が誤解される可能性があります。そのため、情報の信頼性には注意が必要です。

やはり、前2者と後者の要約は印象を異にします。
後者の要約は、本文に出てこない言葉(名詞)、誤解、可能性、信頼性、を使って、総括的にまとめています。また、かなり文を作っている割には自然な文章です。ちょっと手直しすれば十分通用する文章です。紀行文や記事だけでなく、小説の要約にも使えそうです。次へ続く。


【戻る】