メールマガジン

サイバーセキュリティや
ラックに関する情報をお届けします。

ラックピープル　|　
2024年6月 4日

生成AIを拡張する注目の技術、AIエージェントとは

小林達也

メルマガ登録する

メルマガ登録する

こんにちは。AI技術部の小林です。

最近はさまざまな生成AIサービスが登場し、筆者も仕事とプライベートの両方で活用しています。テキストの要約、プログラミングコードの生成、高品質な画像の生成など従来のAIだと難しかったことが、自然言語を使って簡単に依頼できるようになりました。

その中でも特に話題になっているのが、AIエージェントです。AIが人の代わりのように作業を行ってくれるため、今後社会にAIが普及していく際の鍵となりうる技術で、個人的にとても注目しています。

この記事では、目覚ましい進化を遂げる生成AIの技術の中でも新たなトレンドである、AIエージェントについて紹介します。

進むAIの活用
AIエージェントとは
対話型生成AIと、AIエージェントの違い
AIエージェントの課題
さいごに

進むAIの活用

近年、AIの技術は目覚ましい進化を遂げています。ラックでは、AIを活用した不正取引検知ソリューション「AIゼロフラウド」や、社内で利用できる大規模言語モデル（Large Language Models：以下、LLM）ベースのアプリケーションなどの開発に取り組んでいます。

AIエージェントとは

AIエージェントとは、ユーザーが「◯◯を作りたい」のように目的を入力するだけで、達成に必要なタスクを洗い出して自動で実行してくれる、生成AIを使ったプログラムです。従来の対話型の生成AIに、計画、記憶、振り返りの機能を追加することで、ユーザーが目的を達成するまでの細かな指示を与えなくても自動で作業が行えるようになります。

AIエージェントの具体的な特徴は以下の通りです。

複雑なタスクの自動化

生成AIに複数の役割を与えて別のエージェントとして作業させることで、より複雑な作業をこなせるようになります。

例えばプログラム作成においては、マネージャーが必要な作業の洗い出しと計画を行い、プログラマーがコードを作成し、レビュワーが作成したコードを確認して指摘するように、複数のエージェントに分けて作業を進めます。

自律的な行動

生成AIに計画、記憶、振り返りの機能を追加することで、AIエージェントはユーザーの入力した目的達成に向けて自律的に行動できるようになります。

具体的には、AIエージェントはユーザーが入力した目的を達成するために必要な作業を計画し、作業結果を記憶し、定期的にこれまでの作業を振り返ることで計画を修正する必要があるかを確認します。このようにして目的を達成するまで、行動を続けます。

機能追加で高度な作業を実現

生成AIに独自の記憶領域と、インターネット検索の機能を追加することで、テキスト入力の制約を受けず必要なときに過去のやり取りを振り返られるようになります。情報が足りない場合はインターネットから情報を入手するなどして、より高度な作業を行えるようになります。

従来の対話式生成AIに作業を依頼する際は、目的を達成するための一つの作業を任せる形となりますが、AIエージェントに作業を任せる時は、目的をそのまま伝えるイメージです。

対話型生成AIと、AIエージェントの違い

上記の図のように対話型の生成AIを利用して作業を進めていく際は、ユーザーが必要な作業を考えて、手順ごとに生成AIに依頼します。作業の結果が期待するものではなかった場合は、ユーザーがやり取りをしながら修正をしていく必要があります。

一方、AIエージェントは最初にやりたいことと要件を伝えるだけで、それを達成するために必要な作業を考えて、実行してくれます。さらに、エージェントごとに役割を与えることで、ユーザーが介入することなく計画、実行、修正の一連の動作を自動で行えます。

上記の例は、オープンソースのAIエージェントであるDevikaに、「ブラウザで動作するタイマーアプリを作って」と依頼した際の画面です。目的のブラウザで動作するタイマーアプリを作成する計画が立てられ、手順ごとに実行されていくことが分かります。また、Devikaは必要に応じてインターネットで情報を検索しながら作業を実行します。

最終的にいくつかのファイルが生成され、HTMLファイルをブラウザで開いてみると、シンプルなタイマーアプリが表示されました。

スタートボタンを押してみると、問題なく動作しました。

AIエージェントの課題

AIエージェントは革新的な技術ですが、まだ発展途上であり課題もあります。

まず、AIエージェントが正確な作業を行うためには高精度の返答と大量のトークンを入力できるモデルを指定する必要があります。しかし、エージェントを動作させるために生成AIのAPIを使用する回数も増えるため、APIの利用料金も増えてしまうというコスト面での課題があります。

また、対話型の生成AIが使用するLLMは、ハルシネーションという事実と異なる回答を生成することがあります。AIエージェントも対話型の生成AIを使用しているためこの影響を受け、誤った作業を行い間違った成果物を作成する可能性が十分に考えられます。

そのため、現時点では完全に人の代わりとなるものではありませんが、最初のドラフト版を作成させるなど、人の支援を行う存在としてはかなり有用なツールであると感じました。

さいごに

AIエージェントに課題はあるものの、モデルの軽量化やデバイスの性能向上に伴い、手元のスマホやPCで高性能なモデルが動かせるようになれば、パーソナライズされたアシスタントとしてAIエージェントがあなたのすぐ近くでサポートしてくれるような日が来るかもしれません。

また、このような技術は悪用されることを前提として考える必要があります。そのような脅威に対応するため、ラックでは安全を守るAIエージェントの開発にも力を入れていきたいと考えています。今後もますます進化するAIエージェントの動向にぜひご注目ください。

プロフィール

小林達也
インフラエンジニアとして現場で培った経験を活かして、AIの稼働する基盤部分の構築や技術検証を中心に行なっています。
日々進化するAI技術を勉強中。趣味の競馬でAIを活かせないかと常に考えています。

この記事をシェアする

メールマガジン

サイバーセキュリティや
ラックに関する情報を
お届けします。

登録する

この記事は役に立ちましたか？

はいいいえ