My Book

author: Java怎么辅助 source: 小红书 url: https://www.xiaohongshu.com/discovery/item/6a1d8eff0000000036000c76?app_platform=ios&app_version=9.25&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CB2q5VOfzx_lT0ccqVkkFRqskN1ddsdBWBKI54-9JeENY=&author_share=1&xhsshare=WeixinSession&shareRedId=ODY7Nzs8ND02NzUyOTgwNjY0OTc5Sz85&apptime=1780323190&share_id=abaf752f8d33435eb1834c4aa861cb5a saved: 2026-06-01 22:13:44 tags: - 笔记同步助手

id: e980bf7a-abca-458a-988b-6b8a9c79b745

作者: Java怎么辅助

发布/编辑时间: 2026年06月01日 13:54

1. 为什么要做 `QLoRA` 微调？相比全参微调，它解决了什么问题？
2. 迭代挖掘困难负样本是怎么做的？召回靠后的样本能不能直接作为下一轮困难负样本？
3. 困难负样本为什么要筛选？怎么排查伪负例？
4. 多轮困难负样本挖掘会不会导致过拟合？怎么保证负样本多样性？
5. 有没有看过 `Qwen2.5` 的技术报告？里面有哪些对你项目有启发的点？
6. 更高质量样本、`CoT`、`MoE/MMoE` 路由、两阶段强化学习这些设计你怎么理解？
7. 项目里有没有做 query 改写和知识增强？是不是类似 `RAG` 的思路？
8. 如果项目已经做了 `CoT` 链路，二阶段继续做 `QLoRA` 还是直接上强化学习，你会怎么选？
9. `RRF` 是什么？参数一般怎么设置？
10. `DIN` 里用户兴趣的动态性怎么理解？
11. 讲一下 `DIEN`、`SIM`、`CAN` 的核心思路。
12. `MoE` 和 `MMoE` 有什么区别？
13. `PLE` 和 `CGC` 是什么？解决了什么问题？
14. 最近排序模型有哪些新的方向或模型？
15. 正负样本不平衡怎么处理？
16. `Balanced CE` 适合解决什么问题？还有哪些其他平衡正负样本的方法？
17. 并发搜索场景下，主线程启动多个子线程后，怎么知道所有任务都完成了？
18. 为了提速引入 `Kafka`，但 `Kafka` 本身是异步组件，会不会反而让任务流转变慢？
19. 流量变大后，一个任务拆出大量并发消息，`Kafka` 会不会成为性能瓶颈？怎么做限流？
20. 扫表和用消息中间件，比如 `Kafka` 双 Topic，管理长时任务状态，各自优缺点是什么？
21. 详细介绍项目里的多智能体协同策略，三层 Agent，也就是 `Root`、`Main/Fallback`、`Sub-Agent` 是怎么配合流转的？
22. 如果主 Agent 越过第二层，直接调用底层子 Agent，上下文信息怎么跨层传递？
23. 补充检索是怎么触发的？如何评估当前检索结果质量？
24. 怎么保证二次检索能搜到第一次没搜到的内容？
25. 怎么避免大模型检索到网上被 AI 批量生成的虚假垃圾数据，也就是防止数据投毒？
26. 短期对话记忆和长期记忆分别是怎么提取、存储和更新的？
27. 怎么判断当前用户问题需不需要去 `RAG` 里检索长期记忆？
28. 为什么底层选 `pgvector` 做向量数据库，而不是其他向量库？
29. 为什么在向量检索之外还要加 `BM25` 精确检索？它解决了哪些 bad case？
#互联网大厂 #后端开发 #java面试 #校招 #面经 #大模型 #agent #大厂 #春招#ai应用开发

内容效果不满意？点此反馈