AI Engineering Notes AI notes and labs

RAG demo

RAGの検索と文脈注入を小さく見る

固定文書を検索し、選ばれた文脈をプロンプトへ入れるRAGの最小フローをブラウザ内で確認します。

このデモは実APIを呼びません。検索、文脈注入、回答生成前の構造だけを固定データで見せます。

検索対象チャンク

LLMとコンテキスト

LLMは学習済みの重みだけで回答するのではなく、入力されたコンテキストに強く影響されます。RAGでは検索結果をプロンプトへ追加し、回答の根拠を明示しやすくします。

LLM / notes/llm

RAGで改善すること

RAGは最新情報や社内文書を扱うときに有効です。ただし検索品質、文書分割、メタデータ、引用設計が弱いと、回答品質は安定しません。

RAG / notes/rag

MCPとツール呼び出し

MCPはAIアプリと外部ツールをつなぐプロトコルです。JSON-RPC、ツール定義、引数スキーマ、実行結果の返却を分けて考えると理解しやすくなります。

MCP / notes/mcp

プロンプトを評価可能にする

プロンプトエンジニアリングは文言調整だけではありません。入力、制約、期待出力、失敗例、評価観点を決めることで再現性を高めます。

Prompt / notes/prompt-engineering

RAGの疑似フロー

1. Retrieve

RAGで改善すること

matches: ragで何が改善する

score 1

LLMとコンテキスト

matches: none

score 0

MCPとツール呼び出し

matches: none

score 0

2. Inject

system:
根拠にないことは断定しない。引用元を添える。

user:
RAGで何が改善する?

context:
- RAGで改善すること: RAGは最新情報や社内文書を扱うときに有効です。ただし検索品質、文書分割、メタデータ、引用設計が弱いと、回答品質は安定しません。 [notes/rag]

3. Generate

回答は検索で選ばれた文脈に寄せて生成されます。このデモではLLM呼び出しをせず、検索、文脈注入、根拠づけの形だけを確認できます。