
RAGやAgentic RAGについて勉強しようと調べても、ネット上の多くの記事は解説中に専門用語が多い印象です。これでは、AIやLLM(大規模言語モデル)についての知識に自信のない人には、理解しづらいと感じました。
そのため、本記事では、用語をなるべく噛み砕きながら、意味を曲げずに整理することを意識しました。
この記事を読むことで、RAGとは何か、基本的な構成にどのような違いがあるのか、そしてAgentic RAG が今回見ていくRAGとどう違うのかがつかめると思います。
RAGとは?
RAGについて簡単に説明すると、文章を作るAIが、元から学習済みの知識だけで答えるのではなく、外部の文書やデータベースから必要な情報を探し、その情報を使って回答を作る仕組みです。
”Retrieval-Augmented Generation”の略称がRAGであり、直訳では「検索拡張生成」となります。
RAGを提案した原論文では、“models which combine pre-trained parametric and non-parametric memory for language generation”と定義されています。(引用:『Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks』, Patrick Lewisら, 2020)
日本語訳すると、「言語生成のために、事前学習済みのパラメトリックメモリとノンパラメトリックメモリを組み合わせるモデル」となります。
パラメトリックメモリは「AIが学習を通じて、もともと中に持っている知識のこと」、ノンパラメトリックメモリは「AIの外にあり、必要なときに探しに行く知識のこと」です。
つまりRAGとは、回答を作るために、AIが学習を通じて元々持っている知識と、AIが必要なときに検索して使う知識を組み合わせる仕組みのことです。
RAGの必要性
RAGが必要とされた背景には、LLMが学習済みの知識だけをもとに回答することによる限界があります。LLMは多くの知識を内部に持っていますが、最新情報や外部資料が必要な質問では、その知識だけでは十分に対応できないことがあります。特に、外部の知識や資料を見ないと正確に答えにくい質問では、もっともらしい誤りを出したり、なぜその答えになったのかという根拠が見えにくくなったりすることが課題でした。そこで、外部の文書やデータベースを検索し、その情報を回答に取り込める仕組みとしてRAGが使われるようになりました。
RAGを使うことで、AIがもともと持っている知識だけに頼る場合よりも、外部文書を参照しながら回答できるようになります。その結果、回答の正確さを高めやすくなり、知識の更新もモデルを再学習するより軽く行いやすくなります。また、参照した文書を示しやすくなるため、根拠を意識した回答にもつなげやすくなります。
ただし、あらかじめ設計した流れに沿って進むRAGだけでは限界があります。こうした構成では、質問が曖昧だったり、多段階の探索が必要だったりする場合に、十分な情報を集めにくくなります。また、取得した文書にノイズや重複が多いと、そのまま回答品質に影響しやすくなります。こうした課題に対して、検索前後の処理を工夫したり、途中で分岐や再実行を含められるようにしたりする方向で、RAGは発展してきました。
このような課題に対しては、AIエージェント的な考え方を取り入れた発展も出てきました。その一つがAgentic RAGです。詳しくは後のセクションで説明します。
次のセクションでは、あらかじめ設計した流れに沿って進むRAGの代表的な構成と、それぞれの考え方の違いを見ていきます。
RAGの代表的な構成
RAGの整理の仕方には複数ありますが、違いを大枠だけで言うと、「そのまま探して答えるか」「探し方や使い方を工夫するか」「部品として組み替えられるか」「関係性までたどって答えるか」という違いがあります。
ここからは、RAGの整理法のうち、基本的なパイプラインの違いをつかみやすいものとして、Naive RAG / Advanced RAG / Modular RAGと、グラフ構造を使うGraph RAGを並べて見ます。
※どのRAGでも、通常は文書を小さく分けて検索しやすい形に整え、インデックスを作るなどの事前準備が必要です。以下の図では、その上で質問を受けてから回答するまでの流れを中心に示します。
Naive RAG
Naive RAGは、まず文書を検索できる形にしておき(図内①)、質問が来たらその内容を検索しやすい形に整え(図内②)、関連する内容を検索し(図内③)、検索結果をそのままLLMに読ませて回答を作る(図内④)一番基本的な形です。
これは、「外部文書を引いて読ませる」という最初のRAGです。
構成がシンプルで試しやすい一方、検索結果にノイズが混ざると、そのまま回答のズレにつながりやすい弱点があります。

Advanced RAG
Advanced RAGは、質問が来たら、まず曖昧な質問内容を検索しやすい形に整え(図内①)、関連する内容を広く検索し(図内②)、その検索結果を関連度順に並べ替えたり、不要な部分を絞り込んだり、要約・圧縮したりして使いやすく整えたうえで(図内③)、回答を作る形です(図内④)。
ただ文書を引いて読ませるだけでは足りないので、「より良く探し、より良く使う」方向に発展したRAGです。基本のRAGよりも精度を高めやすい一方で、前処理や後処理が増える分、構成は少し複雑になります。

Modular RAG
Modular RAGは、質問が来たら、まずその質問に対してどの工程が必要かを見極め(図内①)、使う工程を選び(図内②)、選んだ工程を順番に動かし(図内③)、必要であれば途中で分岐したりやり直したりしながら処理を進め(図内④)、最後に結果をまとめて回答を作る形です(図内⑤)。
これは、RAGを1本の決まった流れとして扱うのではなく、役割ごとの部品を組み合わせて動かす考え方です。
必要に応じて、途中で分岐したり、条件によって次の処理を変えたり、同じ工程を繰り返したりできるため、複雑な用途に合わせやすいのが特徴です。「工夫を足し続けた結果、一本道では扱いにくくなったので、部品として組み直せるようにしたRAG」と言えます。

Graph RAG
Graph RAGは、まず準備段階で文書を小さく分け、重要な要素とその関係を取り出し(図内①)、関係ごとのまとまりと要約を作っておきます(図内②)。そのうえで質問が来たら、質問に関係する要素を見つけ(図内③)、その要素どうしの関係をたどりながら必要な情報を集め(図内④)、集めた情報をまとめて回答を作る形です(図内⑤)。
これは、文書を単なる文章のかたまりとして検索するのではなく、人・組織・出来事などのつながりも使って答えるRAGです。複数の情報の関係をまたいで考える質問に向いている一方で、事前準備として関係性を整理する工程が必要になるため、構築や維持の負担は大きくなりやすいです。

以上のRAGについて、簡易にまとめると以下のようにまとめられます。
Naive RAG:見つけた文書をそのまま使って答える、基本のRAG
Advanced RAG:検索の前後に工夫を足したRAG
Modular RAG:部品として組み替えられるRAG
Graph RAG:関係性も使って答えるRAG
代表的な4つのRAGの違いを、流れで並べると次のようになります。

ここまで見てきた4つは、主にあらかじめ設計した流れに沿って進むRAGとして整理できます。次は、「RAGの必要性」で触れたAIエージェントについて見ていきます。
Agentic RAG・AIエージェントとは
ここからは、Agentic RAGに組み込まれているAIエージェントについてです。
AIエージェントとは、与えられた目的に対して、一度決められた手順をそのまま実行するのではなく、状況を見ながら次に何をするかを判断し、必要に応じてツールを使ったり手順をやり直したりしながら進む仕組みです。(参考:『Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG』, Aditi Singhら, 2025)

RAGに組み込まれると何をするのか
RAGの文脈で見ると、AIエージェントは「関連文書を取ってくる役割」そのものではなく、「どう検索するか、結果が十分か、追加で調べるべきか」を判断する役割を持ちます。
例えば以下のように、柔軟に次の行動を判断しながら回答までの工程を進めます。
質問をそのまま検索せず、まず分解する
検索結果が不十分なら、言い換えたり追加で探したりする
複数の資料から、使うべき情報を選ぶ
必要なら別のツールも使いながら、最後に回答をまとめる
4つのRAGとAgentic RAGの違い
ここまで見てきた、あらかじめ設計した流れに沿って進む4つのRAGは、「知識をどう整理して取り出すか」という観点の違いです。それに対してAgentic RAGは、「検索や整理をどのような手順で進め、途中でどう判断し直すか」という観点の違いとして捉えると整理しやすくなります。
あらかじめ設計した流れに沿って進むRAGは、決められた手順の中で検索や整理を進めるため、単純な質問からある程度複雑な処理まで広く対応できます。一方で、曖昧な質問や、途中で調べ方を見直しながら進める必要がある問いでは、あらかじめ決めた流れだけでは対応しにくい場合があります。
そこで、途中で計画を立て直す、検索をやり直す、必要に応じて別のツールを使うといったエージェント的な動きを取り入れたものが、Agentic RAGです。
Agentic RAGの整理
Agentic RAGにはさまざまな設計がありますが、違いは1つの軸だけでは整理できません。
たとえば、「誰が判断を担うか」という観点では、1つのエージェントが全体を管理する型や、複数のエージェントで役割分担をする型があります。
また、「検索をどう進め直すか」という観点では、一度だけ検索する型、途中で追加検索する型、検索結果を見てクエリを立て直す型があります。
さらに、必要に応じて、グラフ構造を使った検索や他の外部ツールを組み合わせることもあります。
Agentic RAGの違いは、何を検索するかよりも、誰がどう判断し、どう進め直すかにあります。
ここまでの違いを、具体例で見ると次のようになります。
例:「社内の就業規則で、育休中の給与の扱いはどうなっているか」と質問する場面
LLM単体=一般的な制度説明はできますが、自社規定に即した回答はできません。
RAG=就業規則や人事資料を検索して、その内容をもとに答えられます。
Agentic RAG=最初の検索結果が不十分だった場合に、「就業規則だけでなく福利厚生ガイドも見るべきではないか」と判断して、追加で探し直すこともできます。
まとめ
本記事では、RAGとは何か、その構成と種類、Agentic RAGについて解説しました。
シンプルに言えば、RAGは「外部情報を見てから答える仕組み」で、Agentic RAGは「その探し方や進め方まで、途中で判断し直せる仕組み」です。
また、Naive RAG、Advanced RAG、Modular RAG、Graph RAG は、主に「あらかじめ設計した流れに沿って、情報をどう取り出し、どう使うか」という観点で整理できます。それに対してAgentic RAGは、「検索や整理をどのように進め、途中でどう判断し直すか」という別の観点で捉えると理解しやすくなります。
まずは、「RAGは外の情報を見て答える」「Agentic RAGはその進め方まで考え直せる」と押さえれば十分です。
基本形を知るならNaive RAG
検索前後の工夫を見るならAdvanced RAG
部品の組み替えや分岐を見るならModular RAG
関係性をたどる考え方を見るならGraph RAG
途中での判断や再検索まで含めて考えるならAgentic RAG
という見方をすると整理しやすくなります。