author: Java怎么辅助 source: 小红书 url: https://www.xiaohongshu.com/discovery/item/6a1d8eff0000000036000c76?app_platform=ios&app_version=9.25&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CB2q5VOfzx_lT0ccqVkkFRqskN1ddsdBWBKI54-9JeENY=&author_share=1&xhsshare=WeixinSession&shareRedId=ODY7Nzs8ND02NzUyOTgwNjY0OTc5Sz85&apptime=1780323190&share_id=abaf752f8d33435eb1834c4aa861cb5a saved: 2026-06-01 22:13:44 tags: - 笔记同步助手
id: e980bf7a-abca-458a-988b-6b8a9c79b745
作者: Java怎么辅助
发布/编辑时间: 2026年06月01日 13:54
1. 为什么要做 `QLoRA` 微调?相比全参微调,它解决了什么问题?
2. 迭代挖掘困难负样本是怎么做的?召回靠后的样本能不能直接作为下一轮困难负样本?
3. 困难负样本为什么要筛选?怎么排查伪负例?
4. 多轮困难负样本挖掘会不会导致过拟合?怎么保证负样本多样性?
5. 有没有看过 `Qwen2.5` 的技术报告?里面有哪些对你项目有启发的点?
6. 更高质量样本、`CoT`、`MoE/MMoE` 路由、两阶段强化学习这些设计你怎么理解?
7. 项目里有没有做 query 改写和知识增强?是不是类似 `RAG` 的思路?
8. 如果项目已经做了 `CoT` 链路,二阶段继续做 `QLoRA` 还是直接上强化学习,你会怎么选?
9. `RRF` 是什么?参数一般怎么设置?
10. `DIN` 里用户兴趣的动态性怎么理解?
11. 讲一下 `DIEN`、`SIM`、`CAN` 的核心思路。
12. `MoE` 和 `MMoE` 有什么区别?
13. `PLE` 和 `CGC` 是什么?解决了什么问题?
14. 最近排序模型有哪些新的方向或模型?
15. 正负样本不平衡怎么处理?
16. `Balanced CE` 适合解决什么问题?还有哪些其他平衡正负样本的方法?
17. 并发搜索场景下,主线程启动多个子线程后,怎么知道所有任务都完成了?
18. 为了提速引入 `Kafka`,但 `Kafka` 本身是异步组件,会不会反而让任务流转变慢?
19. 流量变大后,一个任务拆出大量并发消息,`Kafka` 会不会成为性能瓶颈?怎么做限流?
20. 扫表和用消息中间件,比如 `Kafka` 双 Topic,管理长时任务状态,各自优缺点是什么?
21. 详细介绍项目里的多智能体协同策略,三层 Agent,也就是 `Root`、`Main/Fallback`、`Sub-Agent` 是怎么配合流转的?
22. 如果主 Agent 越过第二层,直接调用底层子 Agent,上下文信息怎么跨层传递?
23. 补充检索是怎么触发的?如何评估当前检索结果质量?
24. 怎么保证二次检索能搜到第一次没搜到的内容?
25. 怎么避免大模型检索到网上被 AI 批量生成的虚假垃圾数据,也就是防止数据投毒?
26. 短期对话记忆和长期记忆分别是怎么提取、存储和更新的?
27. 怎么判断当前用户问题需不需要去 `RAG` 里检索长期记忆?
28. 为什么底层选 `pgvector` 做向量数据库,而不是其他向量库?
29. 为什么在向量检索之外还要加 `BM25` 精确检索?它解决了哪些 bad case?
#互联网大厂 #后端开发 #java面试 #校招 #面经 #大模型 #agent #大厂 #春招#ai应用开发









内容效果不满意?点此反馈