判断基準:データの機密性が最優先
社外秘・機密データのAI活用では、データが外部企業のサーバーを通るか否かが最大の判断軸。
| 判定 | プラットフォーム | 適用 |
|---|
| ❌ 不可 | NotebookLM(Google)、SaaS型外部サービス | データがGoogle等外部企業のインフラで処理 |
| ✅ 可 | 自前RAG(自社インフラ)、オンプレLLM | データ流出ゼロ |
重要: NotebookLMは便利だが、Googleのサーバーを経由するため社外秘データは禁止。
ドキュメントRAG用プラットフォーム比較
SaaS型(社外秘データNG)
- Biel.ai
- Markprompt
- DocsBot AI
- Inkeep
特徴: クイック導入・運用負荷低い → 但し、データ送信ステップで機密性リスク。
OSS型(自前デプロイ推奨)
- RAGFlow
- LlamaIndex
- LangChain + LangGraph
- Haystack
- LightRAG
特徴: インフラ費用・運用負荷増 ↔ データ流出ゼロ → 社外秘プロジェクト向け。
意思決定フロー
- データ機密性は高いか? → Yes: 自前RAG(OSS)選択
- 運用負荷を最小化したいか? → Yes: クラウド運用(Workers等)
- 既存ドキュメント基盤がMarkdown+Gitか? → Yes: VitePressベースRAGが相性良好