本文へ移動

AI「2本見出し」習得 本紙・静大合同企画で再対決

2020年1月10日 02時00分 (5月27日 05時35分更新)
 新聞の記事の要点を正確かつ印象的に表現する「見出し」。人間でも難しい作成作業を人工知能(AI)が行えばどうなるのか。本紙と静岡大情報学部・狩野芳伸准教授の研究室が昨年に引き続き、合同企画「AI対整理記者の見出し対決」を実施した。今回のAI「つづりん2(ローマ数字の2)」は一つの記事に複数の見出しをつけられるように進化を遂げ、実際の作業により近い形で記者に挑んだ。
 新聞記事の見出しは分量や重要度によって本数が変わる(この記事の見出しは三本)。見出しが複数になると、二本目以降ではメインの見出しで言い表せなかったことを違う単語と表現で伝えなければならない。各見出しが全体として協調する必要もあり、一本見出しに比べ、記事へのより深い理解と高度な表現力が求められる。
 つづりん2(ローマ数字の2)は過去三十年分の記事データを学習、解析。実際の新聞と同じく一つの記事に一~三本の見出し作成が可能になった。人間側は整理経験二年半の大島晃平記者(27)が受けて立ち、比較対象のため静大の情報学部二年の男子学生(21)も参加した。
 昨年中に本紙が報じた二万六千の記事のうち、新聞で最も登場頻度が高い「二本見出し」の記事三十本を無作為抽出し、三者が見出しを作成。作成者を匿名にしたうえで、水谷有・中日新聞東海本社整理部長と萩文明・同報道部長が「日本語としての適切さ」「読みやすい文体か」「記事に対して適切な見出しか」という三つの観点ごとに一~五点で採点した。
 その結果、採点合計(九百点満点)は(1)記者八百二十六点(2)学生五百十二点(3)AI四百十八点となった。昨年、一本見出しで実施した対決ではAIが百問中九問で記者を上回る評価を得たが、今回、つづりん2(ローマ数字の2)は記者に一勝もできず、合計点では学生にも及ばなかった。
 プログラムした研究室の岩間寛悟さん(23)=大学院二年=によると、つづりん2(ローマ数字の2)は過去記事の出現頻度などから有用性の高い単語を優先して使用するが、「二本見出し」の場合、同じ単語を使わない原則を十分に学習できなかったという。
 岩間さんは「記者の見出しに比べると、表現に多様性が足りない。記事に出てこない表現を織り交ぜたり、各見出しが内容を補完し合えたりするようにしたい」と改善の余地を語った。水谷部長は「日本語としては正しいが、記事の内容を捉えられていない見出しも多かった」とした上で、Q6を例に挙げ「文中にない『初V』という言葉を使った点にAIの進歩を感じた」と評価した。
(鎌倉優太)

関連キーワード

おすすめ情報