主要 AI ツールの全体像¶
ここまで学んだ知識 (0 章〜 17 章) を使って、世の中の主要 AI ツールを整理する。技術的な中身を一通り把握した後で全体像を眺めると、「このプロダクトは中身はこうなっている」「これは他とどう違う」が自分で判断できるようになる。
注記: この章は 2026-04 時点のスナップショット。プロダクトの顔ぶれ / 機能 / 価格は毎月変わる前提で読むこと。「分類軸」と「評価基準」の方が長く使える知識。
3 つの分類軸¶
AI ツールを整理する軸:
- 提供元: LLM ベンダー純正 (1st party) vs サードパーティ (3rd party)
- 配信形態: CLI / Web chat / Desktop app / Mobile app / Editor 組み込み / ワークフロー / フレームワーク / ローカル推論
- ターゲット用途: 汎用チャット / コード / 検索 / ワークフロー自動化 / オブザーバビリティ
この 3 軸で各プロダクトを位置付けると見通しが良くなる。
LLM ベンダー純正 (1st party)¶
主要 4 社の品揃えを横並びで比較:
| ベンダー | Web chat | Desktop / Mobile | CLI | API |
|---|---|---|---|---|
| Anthropic | Claude.ai | Claude Desktop (macOS/Windows) / iOS / Android | Claude Code | Anthropic API |
| OpenAI | ChatGPT | ChatGPT Desktop / iOS / Android | Codex CLI | OpenAI API |
| Gemini | Gemini app (iOS / Android) / Gemini in Workspace | Gemini CLI | Gemini API | |
| xAI | Grok (X 内 + grok.com) | Grok app | — | xAI API |
各形態の特徴:
- Web chat: 最も広いユーザ層の入口。無料枠あり。会話履歴の永続化、ファイルアップロード、Web 検索統合
- Desktop / Mobile app: Web chat の派生 + ネイティブ機能 (カメラ / マイク / スクリーンショット)
- CLI: 開発者向け。ターミナル統合、ファイル操作、コードベースを扱うエージェント。Claude Code は本リポジトリでも使われている
- API: 他ツールから叩く raw エンドポイント。全プロダクトの基盤
サードパーティ製品 (3rd party)¶
カテゴリ別に整理する。
(1) コードエディタ統合¶
| 製品 | 特徴 |
|---|---|
| Cursor | VS Code fork、AI ファースト、tab 補完 + multi-file edit |
| Windsurf | Cursor 同系、Cascade (自律エージェント) が特徴 |
| GitHub Copilot | エディタ非依存、Microsoft 系列、企業採用多数 |
| Cody (Sourcegraph) | コードベース検索に強い |
| Continue | OSS、エディタプラグイン、モデル切替可能 |
| Tabnine | エンタープライズ向け、オンプレ可 |
どれも内部的には OpenAI 互換 API で複数モデルを切り替えることが多い。中身は LLM + tool calling + RAG (コードベース) + エージェントループの組み合わせで、章 02-10 の知識がそのまま通用する。
(2) ターミナル系エージェント¶
| 製品 | 特徴 |
|---|---|
| Claude Code (Anthropic) | Anthropic 公式、対話式 + プラン + 自動実行 |
| Codex CLI (OpenAI) | OpenAI 公式、shell 統合 |
| Gemini CLI (Google) | Google 公式 |
| GitHub Copilot CLI | GitHub 公式、gh copilot サブコマンド、shell コマンド提案 / 説明に特化 |
| OpenCode (sst) | OSS、TUI、マルチプロバイダ (Anthropic / OpenAI / ローカル等)、provider 非依存の Claude Code 代替 |
| Crush (Charm) | OSS、Go 製 TUI、Bubble Tea ベース、軽量 |
| Goose (Block) | OSS、拡張機能 (MCP) ベース、デスクトップ + CLI |
| Aider (OSS) | OSS、git 連携、diff-first |
llm (Simon Willison) |
OSS、小さい Python CLI、パイプラインで使える |
| Cline / Roo (OSS) | VS Code 拡張 + ターミナル統合 |
共通点: コードベースを読んで変更する というエージェントユースケース。本リポジトリの examples/agent-demo/ を本気で作り込むとこの辺りになる。
(3) 検索特化チャット¶
| 製品 | 特徴 |
|---|---|
| Perplexity | 検索 + LLM、出典明示 |
| Phind | 開発者向け検索 |
| You.com | 汎用 AI 検索 |
| Microsoft Copilot | Bing 検索 + LLM |
共通点: RAG (Web 検索結果を context に注入) が核心。章 09 RAG の典型実装。
(4) マルチモデル チャット UI¶
| 製品 | 特徴 |
|---|---|
| T3 Chat | 高速、複数モデル対応 |
| Poe (Quora) | 有料サブスクで各種モデル |
| LibreChat | OSS、セルフホスト可能 |
| OpenRouter | API プロキシ (複数モデルを 1 つのエンドポイントで) |
| Chatbox | OSS デスクトップアプリ |
| Open WebUI | 本リポジトリでも使用中、セルフホストチャット UI |
共通点: 1 つの UI から複数 LLM 提供者にアクセスできる。LiteLLM (本リポジトリ) のようなプロキシレイヤと組み合わせるのが定石。
(5) ワークフロー / ローコード自動化¶
| 製品 | 特徴 |
|---|---|
| Dify (本リポジトリ) | OSS、Visual LLM app builder、RAG / Agent / Workflow |
| LangFlow | OSS、LangChain のビジュアルエディタ |
| Flowise | OSS、LangChain ベース、軽量 |
| n8n (本リポジトリ) | OSS、汎用自動化、AI 系ノードが充実 |
| Make (旧 Integromat) | 商用 SaaS |
| Zapier | 商用 SaaS、最大の SaaS 連携数 |
共通点: 非エンジニアでもエージェント / RAG / ワークフローが組める GUI。内部では章 05-10 の仕組みを抽象化しているだけ。
(6) オブザーバビリティ / 評価¶
| 製品 | 特徴 |
|---|---|
| Langfuse (本リポジトリ) | OSS、OTel ネイティブ、セルフホスト可能、第 8 章 で使用 |
| LangSmith (LangChain) | 商用、LangChain エコシステムと密結合 |
| Phoenix (Arize) | OSS、OTel ベース、評価機能あり |
| Helicone | プロキシ型 (リクエストを経由) |
| Braintrust | 評価特化、Eval harness が強力 |
| PromptLayer | プロンプト管理に特化 |
共通点: trace / span の可視化 + 評価データセット管理 + コスト/レイテンシ集計。章 07 / 10 の対応プロダクト。
(7) 開発フレームワーク¶
| 製品 | 言語 | 特徴 |
|---|---|---|
| LangChain | Python / JS | 最大のエコシステム、本リポジトリの agent-demo で使用 |
| LangGraph | Python / JS | LangChain の状態マシン版、複雑なエージェント向け |
| LlamaIndex | Python / JS | RAG に特化 |
| Haystack | Python | RAG + パイプライン |
| Pydantic AI | Python | 型安全、シンプル |
| Mastra | TypeScript | TS ネイティブ、シンプル |
| Vercel AI SDK | TypeScript | Next.js 統合、ストリーミング UI |
| Agents SDK (OpenAI / Anthropic) | Python / TS | ベンダー純正の薄い SDK |
共通点: 章 04 tool calling / 05 エージェントループ / 03 state management を抽象化。どのフレームワークも根っこは同じ (第 17 章 ハーネス層)。
(8) ローカル推論ランタイム¶
| 製品 | 特徴 |
|---|---|
| Ollama (本リポジトリ) | ユーザフレンドリー、モデル管理、OpenAI 互換 API |
| LM Studio | GUI ツール、Mac 向けに使いやすい |
| llama.cpp | 最軽量、C++、あらゆる環境 |
| vLLM | 高スループット、production 向け、NVIDIA GPU 必須 |
| Text Generation Inference (TGI) | HuggingFace 公式、NVIDIA GPU |
| MLX (Apple) | Apple Silicon 向け推論フレームワーク |
共通点: OSS モデル (Llama / Qwen / Gemma / Mistral 等) をローカル実行する。プライバシー / オフライン / コスト削減の用途で使う。
配信形態ごとの「何が得意か」¶
| 形態 | 典型ユーザ | 強み | 弱み |
|---|---|---|---|
| Web chat | 一般ユーザ | 導入不要、全プラットフォーム共通 | ローカルファイル / システムに触れない |
| Mobile app | 一般ユーザ | 音声・カメラ・常時携帯 | キーボード入力量が限定 |
| Desktop app | パワーユーザ | ネイティブ統合、ショートカット、ローカルファイル | Web chat との差別化が曖昧 |
| CLI | 開発者 | コードベース / git / シェル統合、スクリプト組込可 | 非開発者には敷居が高い |
| エディタ組込 | 開発者 | 既存ワークフローに溶け込む、diff 提案 | エディタ依存 |
| ローコードワークフロー | オペレーション担当 | 非開発者でも組める、SaaS 連携豊富 | 複雑な分岐は破綻しがち |
| API / フレームワーク | エンジニア | 完全カスタム、任意 | 工数かかる |
「どれを使えばいいか」の目安¶
- 試すだけ / カジュアル: Web chat (ChatGPT / Claude.ai / Gemini)
- コードを書きたい: エディタ統合 (Cursor / Windsurf) or CLI (Claude Code / Codex / Aider)
- チーム / 業務で自動化: Dify / n8n / LangFlow のローコード系
- 完全カスタム: LangChain / LangGraph / Mastra / Vercel AI SDK で自作 (本リポジトリの
agent-demoがこの例) - プライバシー / オフライン: Ollama + Open WebUI (本リポジトリ構成)
本リポジトリの立ち位置¶
ai/ + ai/examples/agent-demo/ は、上のプロダクト群が裏で使っている仕組みの最小実装として位置付けられる。たとえば Cursor も Claude Code も Dify も n8n も、中身は:
- LLM 呼び出し (第 2 章)
- トークン / コンテキスト管理 (第 3 章)
- messages / state 管理 (第 4 章)
- tool calling (第 5 章)
- エージェントループ (第 6 章)
- 記憶 / RAG (第 06, 08, 09 章)
- 観測 (第 8 章)
- 評価 (第 11 章)
- プロンプト / コンテキスト / ハーネス の 3 層 (第 17 章)
を組み合わせて製品化しただけ。hands-on で学んだ知識はそのまま全プロダクトの理解に通じる。逆に言うと、どれか 1 つに詳しくなっても本質は学べず、原理 (章 01-18) を押さえた上で全プロダクトを横断的に評価できるのが理想。
プロダクト選びの評価軸¶
個別プロダクトを評価するときの普遍的な軸:
(1) コアモデルの選択肢¶
- 単一モデル固定か、複数切替可か
- OSS モデル対応か
- 自社ホストモデルを繋げるか
(2) プロンプト層の自由度¶
- system prompt をカスタムできるか
- few-shot / ペルソナ / テンプレート管理
- プロンプトの version 管理 / A/B テスト
(3) コンテキスト層の能力¶
- RAG 対応 / ドキュメントアップロード
- 長期記憶の仕組み
- context window の扱い (圧縮 / 要約機構)
(4) ハーネス層の成熟度¶
- tool calling 対応
- エージェントループの信頼性
- 観測 / 評価機能
- エラー処理 / retry / fallback
(5) セキュリティ / ガバナンス¶
- ガードレール (第 14 章)
- 監査ログ
- ロールベースアクセス制御
- データの所在 (クラウド / オンプレ)
(6) 価格 / ライセンス¶
- 従量課金 / サブスク / OSS
- エンタープライズ契約の有無
- 自社データで学習されるか
機能リストを見るのではなく、この評価軸で自分のユースケースに当てはめて選ぶのが最善。
将来の変化に耐える知識とは¶
プロダクト名は毎月変わる。新興が出ては消え、老舗が陳腐化する。しかし核となる仕組みは数年単位で安定している:
- LLM API の形 (Chat Completions / OpenAI 互換) → 安定
- tool calling の仕組み → 安定
- messages / state 管理 → 安定
- RAG / embedding / 近傍検索 → 安定
- エージェントループの構造 → 安定
- 観測 / 評価 / ガード → 安定
だから個別プロダクトを追うより、仕組み (章 01-18) を押さえた方が長く使える。新しいプロダクトが出てきたときも、「これは LLM + RAG + tool calling を組み合わせたやつか」と即座に分類できる。
まとめ¶
- AI ツールは 提供元 / 配信形態 / ターゲット用途 の 3 軸で整理する
- LLM ベンダー純正 (Anthropic / OpenAI / Google / xAI) は Web chat / App / CLI / API の 4 配信を持つ
- サードパーティ は カテゴリ別: エディタ / ターミナル / 検索 / マルチモデル UI / ワークフロー / observability / フレームワーク / ローカル推論
- 各配信形態には得意不得意がある。ユースケースから選ぶ
- 本リポジトリ hands-on の agent-demo は全プロダクト共通の基盤の最小実装。ここで学んだ知識はそのまま他プロダクトに通用する
- プロダクト評価軸: モデル選択 / プロンプト自由度 / コンテキスト能力 / ハーネス成熟度 / セキュリティ / 価格
- 個別プロダクトより仕組みが長持ち。章 01-18 の原理を押さえた上で全体像を眺めるのが本質的な理解