author: 橙序开发图解 source: 小红书 url: https://www.xiaohongshu.com/discovery/item/69fdb572000000003701e37f?app_platform=ios&app_version=9.25&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CBB4NgUZ4YJQ-bvEv7rSfRpiAEG6KvzwnM6PJO6K4FW9o=&author_share=1&xhsshare=WeixinSession&shareRedId=ODY7Nzs8ND02NzUyOTgwNjY0OTc5Sz85&apptime=1778299937&share_id=378cb22dbc034870ac1edb05199187e2 saved: 2026-05-09 12:14:16 tags: - 笔记同步助手

id: 5b04d9dc-78bf-4854-8bb5-dc2b8c1ab1b5

作者: 橙序开发图解

发布/编辑时间: 2026年05月08日 10:05

什么是 RAG?
大模型很聪明,但也有“短板”:
上下文有限、知识可能过时、知识不全、微调麻烦
✅RAG = 检索增强生成 让模型临时查资料再回答
就像考试带小抄:
1️⃣ 先找相关资料
2️⃣ 把资料 + 问题交给模型
3️⃣ 输出答案
用这种方式,模型能回答最新、专业、海量信息。

RAG 怎么工作?
核心流程:
1️⃣ 分块(Chunking) 文档太长,切成小段,方便模型“吃下”。
2️⃣ 向量化(Embedding) 把每段转成向量,意思相近的向量距离更近。
3️⃣ 建索引(向量数据库) 存向量,用语义匹配快速找内容。
4️⃣ 检索(Retrieve) 把用户问题向量化,找最相关的段落。
5️⃣ 重排序(Reranking) 挑最贴合问题意图的段落。
6️⃣ 拼成提示词 把精选内容 + 问题交给模型生成答案。
💡 向量数据库 vs 传统数据库
用语义找意思相近的内容,而不仅靠关键词
常用库:Chroma、Weaviate、Milvus、Qdrant

RAG 的挑战
分块难:太短信息散,太长语义乱
全局理解弱:拆成多段,模型可能只看到部分
向量理解有偏差:意思微妙差异可能被误判
🚀 应用场景
企业知识问答:文档建库,员工提问先检索再答
代码助手:把代码转成可检索库,快速回答函数、逻辑问题
设备故障诊断:手册 + 维修案例向量化,查找类似案例给出建议

总结:RAG 就是“查资料+答问题”的智能组合,让大模型更聪明、更实用。
#RAG #rag #大模型 #大模型开发 #大模型面试 #开发者选项 #开发者社区 #AI大模型 #AI工具 #AI开发

ImageImageImage


内容效果不满意?点此反馈