本書が示すAIエージェントの特徴は次の5つである。
(1)大規模言語モデルを使う
ほぼすべてのAIエージェントは大規模言語モデル(LLM)を基盤技術とし、自然言語での入出力を前提とする。画像や動画、IoTデータなどを扱う場合は大規模マルチモーダルモデル (LMM)と呼ばれるが、本書ではまとめて大規模言語モデルと表す。
(2)与えられたゴールを達成する計画を立てる
ゴールが与えられれば、AIエージェントは、問題を分解し段階的に思考する「推論能力」によって、自ら計画を導き出せる。これにより、人が手順を細かく指示する必要がなくなる。
(3)与えられたツールを使って外部とやり取りする
AIエージェントは、外部環境とのやり取りで、ブラウザーやデータベース、社内システムなどのツールを使う。これらのツールをいつ、どう活用するかも自ら判断できる。
(4)立てた計画に沿って臨機応変に実行する
想定外の状況でも計画の見直しやエラー対応が可能だ。人間が事前に全ケースを設定しなくても、臨機応変に対処できる。これを「適応的(adaptive)」と呼ぶ。
(5)自律的に行動する
AIエージェントは自律的に動くことを目指すが、人間の介入の度合いはゴールの性質などによる。重要な意思決定や行動には人間の確認・承認を組み込む設計が一般的だ。こうした設計は、ヒューマン・イン・ザ・ループと呼ばれる。
生成AIはビジネスのあらゆる領域を革新する技術であり、AIエージェントはそのインパクトを最大化する用途として注目されている。生成AI市場は年平均48%で急成長し、2030年には約140.9兆円の市場規模に達すると予測される。
では、実際の企業における経営インパクトとはどのようなものだろうか。金融業界を例に、企業の財務諸表から、AIエージェントも含めた生成AI活用の経営インパクトを試算する。
4,000冊以上の要約が楽しめる