My Book

author: 橙序开发图解 source: 小红书 url: https://www.xiaohongshu.com/discovery/item/69fdb572000000003701e37f?app_platform=ios&app_version=9.25&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CBB4NgUZ4YJQ-bvEv7rSfRpiAEG6KvzwnM6PJO6K4FW9o=&author_share=1&xhsshare=WeixinSession&shareRedId=ODY7Nzs8ND02NzUyOTgwNjY0OTc5Sz85&apptime=1778299937&share_id=378cb22dbc034870ac1edb05199187e2 saved: 2026-05-09 12:14:16 tags: - 笔记同步助手

id: 5b04d9dc-78bf-4854-8bb5-dc2b8c1ab1b5

作者: 橙序开发图解

发布/编辑时间: 2026年05月08日 10:05

什么是 RAG？
大模型很聪明，但也有“短板”：
上下文有限、知识可能过时、知识不全、微调麻烦
✅RAG = 检索增强生成让模型临时查资料再回答
就像考试带小抄：
1️⃣ 先找相关资料
2️⃣ 把资料 + 问题交给模型
3️⃣ 输出答案
用这种方式，模型能回答最新、专业、海量信息。

RAG 怎么工作？
核心流程：
1️⃣ 分块（Chunking）文档太长，切成小段，方便模型“吃下”。
2️⃣ 向量化（Embedding）把每段转成向量，意思相近的向量距离更近。
3️⃣ 建索引（向量数据库）存向量，用语义匹配快速找内容。
4️⃣ 检索（Retrieve）把用户问题向量化，找最相关的段落。
5️⃣ 重排序（Reranking）挑最贴合问题意图的段落。
6️⃣ 拼成提示词把精选内容 + 问题交给模型生成答案。
💡 向量数据库 vs 传统数据库
用语义找意思相近的内容，而不仅靠关键词
常用库：Chroma、Weaviate、Milvus、Qdrant

RAG 的挑战
分块难：太短信息散，太长语义乱
全局理解弱：拆成多段，模型可能只看到部分
向量理解有偏差：意思微妙差异可能被误判
🚀 应用场景
企业知识问答：文档建库，员工提问先检索再答
代码助手：把代码转成可检索库，快速回答函数、逻辑问题
设备故障诊断：手册 + 维修案例向量化，查找类似案例给出建议

总结：RAG 就是“查资料+答问题”的智能组合，让大模型更聪明、更实用。
#RAG #rag #大模型 #大模型开发 #大模型面试 #开发者选项 #开发者社区 #AI大模型 #AI工具 #AI开发

内容效果不满意？点此反馈