RAGアーキテクチャの進化と2025-2026ベストプラクティス

GraphRAG: エンティティ関係グラフでテーマ横断的な質問に対応。コスト50%削減報告あり
Self-RAG: モデル自身が検索必要性を判断。不要な検索を削減

アーキテクチャの進化

RAGはNaive → Advanced → Modular → Agenticへ進化中。2025年時点では以下が実装標準：

BM25（統計ベース）+ ベクトル検索の組み合わせが業界標準：

単一ベクトル検索より精度が安定し、本番環境で採用が加速している。

Contextual Retrieval（Anthropic提唱）: チャンクにLLMで先行文脈説明を付加 → 検索エラー67%削減。コスト増だが精度向上は顕著。

Late Chunking: 文書全体を先に処理してからチャンク境界でプーリング。セマンティックチャンキングより実装簡単で、意外と精度が高い。