My Book
About me
Bilibili
plugins
ignis-bridge
03 什么是预训练
Agent Memory管理
Attention 和 Self-Attention 的区别
Hermes到底厉害在哪?
KV Cache和分组多头注意力GQA
LoRA 与 QLoRA 面试必背 12 题
LoRA 算法论文解读 & 开发人员如何微调大模型并暴露可调用接口
RAG实践知识库文本分块
Sinusoidal、RoPE、ALiBi等各类位置信息编码
Transformer和BERT看不懂来这里
《Attention is all you need》论文解读
一个视频讲透Harmes Agent面试问题
一张图片是怎么喂给大模型的?谈谈 CPU、内存、显存、GPU
三个注意力机制,为何只有一个需要掩码?
中医粉常见八大逻辑误区
从原理到实战:LoRA+QLoRA如何让大模型微调省时98%
从零实现自己的agent第一期:什么是agent
企业级RAG评测与诊断指南
十分钟了解RAG基本原理
可视化直观地理解Attention机制(Transformer模型)
可视化直观地理解LoRA模型
告诉你Agent的一切
图解Flash Attention运算原理
大白话讲解:数据预处理
如何设计更强、更聪明的AI,分享一本书《智能体设计模式》
挑战16分钟搞定,LoRA与QLoRA深度解析
用CC+obsidian搭建无限生长的个人知识库
用费曼学习法,5分钟学会LLM的监督微调阶段
用费曼学习法,5分钟搞懂LLM的预训练过程
矩阵和张量有什么区别?
社招Agent面试岗位经验分享 - 纯聊天?
空调制冷慢,是又缺氟了吗?
近年AI应用技术串讲与优质文档分享|Agent、Skill、OpenClaw、Harness……
面试中容易露馅的问题:大模型的训练和推理吃多少显存?
(科普向)算法工程师需要知道的显卡知识
github
AppPorts:让 Mac 应用住进外置硬盘
NoteDiscovery-自建知识库
linux 的夸克网盘quarkpan-plus
obsidian-note-sync-docker
my
obsidian-web
2026 免实名申请英国 giffgaff eSIM 及其“保号”秘籍
3x-ui 面板 + VLESS + Reality 搭建代理技术方案(Docker 部署)
AI编程路由器9Router让Claude永久免费 1
LoRA、QLoRA、模型量化
Obsidian + AI 插件:打造真正的第二大脑
RAG 是什么?16 种 RAG 方案一次讲清!AI 应用开发必学 万字干货
Transformer 三大变体之Decoder-Only模型详解
obsidian 多端同步的最佳插件:fast-note-sync
从CPU的视角看 多线程代码为什么那么难写!
从零开始搭建 Hexo 博客简明教程(2024版)
使用 Docker Compose 搭建 Lsky Pro 图床
多agent系统: 什么时候和如何到使用他们
大模型RAG 场景、数据、应用难点与解决(四)
大模型校招面试题 - - Obsidian 1.12.7
夸克网盘客户端Plus
小米智能家居 CLI 设备控制台
本地部署 AI 模型完全指南:用 Ollama 在你的电脑上跑大模型
深度探讨:从 OpenClaw 爆火,看 AI Agent 的真相与程序员的未来
离谱的英语学习指南
轻量级 macOS 菜单栏系统监控 — CPU使用率、CPU温度、内存占用、风扇转速、网络速度。
近年 AI 应用技术串讲与优质文档分享|Agent、Skill、OpenClaw、Harness…… - 飞书云文档
vps
大盘鸡VPS磁盘挂载
大模型
AI开发基础:Langchain框架从入门到实战开发-附代码
LayerNorm(层归一化)(全连接层)的关系 + 区别
OpenClaw 的核心组件有哪些?请描述它们之间的关系
Transform
claude
CC-Connect 对接 Claude 完整搭建说明文档
cc-connect-命令速查
forward
openclawd 的一些技能
pytorch 训练transformers步骤
transform代码
ubuntu 跑大模型安装 Jupyter Notebook(网页版)
纯手写 Transformer 代码(Ubuntu+Jupyter 可直接复制运行)
大模型面试题答案集
我的笔记
BPE(Byte Pair Encoding)算法解决了什么问题?
Decoder-Only架构与完整的Encoder-Decoder架构有什么区别?为什么现在主流的大语言模型都采用Decoder-Only架构?
OpenClaw 多 Agent 配置教程 2026:从单 Agent 到团队协作实战
RTK-Rust-Token-Killer
WordPress 文章分享重定向问题
code-server 安装 Python
dufs 的 docker compose
elio-终端文件管理器
linux 的夸克网盘quarkpan-plus
obsidian-note-sync-docker
terminal 快捷键
vps 中使用pikpak 网盘-pikpaktui
从编解码和词嵌入开始,一步一步理解Transformer
假设你要设计一个论文辅助阅读智能体
如果你要构建一个企业级的客服智能体,你会选择哪种类型的模型?需要考虑哪些因素?
给 AI 的代码
部署JupyterLab
现代诗
历史老师
反思
梦的模样
湘女
紧紧攥着你的手
蒲公英的种子
轻轻
笔记同步助手
0基础也能懂,KVCache是什么🤔
1分钟搞懂LLM流程
2026大模型学习路线指南|别焦虑,一起玩AI
3分钟带你看懂Transformer模型✔️
3分钟带你看懂Transformer模型🔍从零详解【
5分钟一次性搞清楚RAG是个啥?
加加 在小红书上发了一篇笔记,快点开来看看!
AI Agent六大主流架构范式详解!
AI Engineering from Scratch
AI Vol.02|简单看懂 Transformer(下)
Agent、Skill、MCP、Harness,到底是什么
Agent三种常见思路怎么选?ReAct、Reflection、规划执行
Agent岗位面试原题:单agent存在什么问题?
Anthropic 跑赢 OpenAI:押对了代码即解决方案的未来
GPU到底是什么?一看就懂!
Harnes详解!
KV Cache:原理、瓶颈、优化
LLM推理流程(Prompt→第一个Token)
MCP到底是什么❓️如何让AI调用工具
Memory是 Agent 的一个关键模块。请问如何
OSI模型和TCP-IP模型有啥区别?
PEFT方法图解
Phoenix Yin- 今天来看腾讯的开发工程师的初面题。 Q1 - Q9, Q12我感觉这是整张卷子最
Prompt工程师面试通关指南
Query-Key-Value 直观理解 #AllYouNe…
RAG 的工作原理是什么?---腾讯真题
RAG发展历程:智能检索的范式演进
Transformer 入门超轻指南
Transformer介绍
Transformer入门级全解,通俗易懂版解释!
Transformer面试-残差连接为什么不能去掉?
Transformer面试-自注意力的O(n²)怎么优化
Transformer面试题及其答案
Transformer:一个词如何看懂一整句话的?
Vps搭建VPN梯子教程,含面板,有手就行!
giffgaff 全网最全使用指南:从入门到榨干
multi-agent 的交流一般是靠什么?
「Sync-in」开源可自托管的文件协作平台:把网盘、共享和同步放回自己的服务器
【一文看懂:注意力机制 &多重注意力机制】
【面试题】Attention为什么要做Scale
一口气看懂Flash Attention v1、v2、v3
一图看懂|LLM模型参数意味着什么?
一张图拆开RAG系统
一张图搞懂RNN
一张图搞懂YOLO
一张图搞懂反向传播
一张图搞懂学习率
一张图搞懂损失函数
一张图搞懂激活函数
一张图搞懂神经网络
一张图讲清上下文窗口
一张图讲清:Token缓存命中-未命中
一文教你什么是transformer学完可手撕算法
一篇搞懂RAG全流程拆解!
为什么我还是无法理解transformer? - bigpunch 的回答
为什么说Transformer架构是大模型的基石
人民潜意识里为什么一定要买房?
什么是DHCP?让网络配置更简单、更高效
什么是SSH?安全远程连接协议(Secure Shell)
什么是Tokenization?
从0到1吃透LLM大模型底层技术原理,神了! 2
从0到1吃透LLM大模型底层技术原理,神了!
从零实现Transformer(小白必会版)
关于MOE你需要知道这些
关于下面这几个问题,不知道是不是有人也有类似的疑问?这几个问...
同步助手_20260503_图片_图片
周览资源- 如何成为一名合格的老司机。 不是会搜,而是知道去哪找、怎么筛选、怎么避坑。 🔗
困惑度(PPL)是什么❓️一张图看懂!
大厂真的把Claude code讲的好清晰啊!
大模型 Agent 上下文压缩的方案有哪些?
大模型FlashAttention面试连环炮,炮火猛烈
大模型Transformer
大模型八股笔记——MoE
大模型工程师:大厂真题300道
大模型微调的原理是什么?看完就懂了
我反问面试官:“如何避免Agent系统中大模型的幻觉?”,面试官:“我会写提示词,让他不要瞎编”,我笑了:“你面其他人吧,我撤了”
手把手带你走出新手村:Ubuntu 22.04 + Transformer 搭建攻略
把 Transformer、BERT、GPT 这三张经典架构…
拿阿里 Offer 的人是咋答 Agent 面试设计题
有趣的存储小知识
每天拆解一个AI知识点:Embedding
淘天一面:Transformer为什么要用KV缓存?
滴滴面试官:-你做RAG,是真的需要,还是你根本没算过成本?-
激活函数有了解吗,你知道哪些LLM常用的激
终于有人把Transformer大模型讲清楚了!!
终于有人把大模型微调讲清楚了!
解读Kimi提出的Attention Residuals
请详细解释一下 Transformer 模型中的自注
这样逐层分析Transformer真的太清晰了!
阿里达摩院ai agent面经 基本都是大模型算
面试官:“Agent系统里如何和众多工具通信”,我说:“MCP”,面试官:“细聊”。
面试追问:LLM为啥偏爱Decoder
鸟哥 - 蓝鸟会🕊️- 兄弟们,别再当冤大头了!这几家影视下载站,我赌你只知道一个,但错过就是血亏!💀
鸟哥 - 蓝鸟会🕊️- 卧槽,HuggingFace又搞了个狠活!DeepSeek-V4架构直接搬到11
🎨 1分钟吃透多维 RoPE!位置编码手绘拆解 2
🎨 1分钟吃透多维 RoPE!位置编码手绘拆解
🎯✨ 极简机器学习算法!KNN完全指南!
🏠 小米智能家居|OpenClaw + mit
👍🏻 MoE 让大模型更快更强
📱 说说 giffgaff 极简保号技巧吧
🔍 自注意力和交叉注意力有什么区别?
🔥 LoRA微调到底是什么?
🔥5分钟搞定神经网络调参-新手也能看懂!
🔥8大网络协议,一图秒懂
🔥什么是Transformer?
🔥本群为编程交流学习群,切勿添加除群主和管理员以外任何人微信以免上当受骗!
🤯 5张图搞懂梯度下降法-机器学习知识卡
算法笔记
Leetcode Hot100 题解整理
轻轻的我走了,
正如我轻轻的来。
愿我轻轻的思念,
拂去你心中的阴霾!