retrieval-augmented generation のタグが付いたすべてのブログ記事。
RAGは言語モデルとドキュメント検索ステップを組み合わせ、モデルの学習済み記憶だけでなく、取得した情報源に基づいた回答を可能にします。
RAGを使えば、LLMが再学習なしで独自データから質問に答えられます。パイプライン全体 ― チャンキング、エンベディング、ベクトルストア、リランキング ― と、本番運用で失敗しがちな落とし穴を解説します。