AIは、東京大学の入試を突破しえるのか。著者らは2011年、これを10年かけて明らかにする「ロボットは東大に入れるか」(通称:東ロボ)というプロジェクトに着手した。
現状での結果をいえば、東大突破は無理であろうことがはっきりしている。その理由として、AIは、国語や英語で半分以上の配点を占める長文読解に対して歯が立たないこと、センター試験によく登場する地図やイラストが理解できないこと、常識を身につけられないことなどが挙げられる。
東ロボの目標のひとつに、現状そして近未来のAIにはどのような可能性と限界があるかを広く社会に公開し、AI時代に正しく備えてもらうというものがある。ただその目標を達成するには、実は最初から課題があった。大学入試問題には過去問が少なすぎることだ。
AIが長文読解やイラストによる問題が苦手なのは、自然言語処理が難しいからだ。ところがAIが自然言語処理に最大の威力を発揮するには、「同じ形式の問題」が数千は必要となる。加えてセンター入試の問題は複雑なので、多くの場合、「なぜ解けたのか、なぜ解けなかったのか」を的確に解釈できない。つまり大学入試は、AI技術の限界を測るベンチマークとしては適していないのだ。
ベンチマークにふさわしいのは、大学入試よりも単純で一貫性が担保されており、難易度がより広範囲に分布している問題群である。その理想形として作られたのがリーディングスキルテスト(RST)だ。RSTを人間とAIの両方が解くことで、AIの自然言語処理技術の限界が明らかになる。
RSTでは、「事実について書かれた短文を正確に読むスキル」を6分野に分類して設計されている。係り受け解析(文の基本構造を把握する力)、照応解決(指示代名詞や省略された主語や目的語を把握する力)、同義文判定(2文の意味が同一であるかどうかを判定する力)、推論(小学校までに習う基本的知識などから文の意味を理解する力)、イメージ同定(文章と図やグラフが一致しているかどうかを認識する力)、具体的同定(言葉の定義を読んでそれと合致する具体例を認識する能力)である。
RSTを使った研究を進めていく中で、思わぬ誤算があった。RSTは小学生から大人までたくさんの人に受検してもらっているのだが、AIにとって難しい自然言語処理、つまり人間でいう読解は、人間の大人にも難しかったことである。
3,400冊以上の要約が楽しめる