source: 小红书 url: https://www.xiaohongshu.com/discovery/item/69e6387c000000001a0290e8?app_platform=ios&app_version=9.25&share_from_user_hidden=true&xsec_source=app_share&type=normal&xsec_token=CBBXHCg5P67rx_64OR054CiLQqaWFMaAzoGMzsPUzC3gA=&author_share=1&xhsshare=WeixinSession&shareRedId=ODY7Nzs8ND02NzUyOTgwNjY0OTc5Sz85&apptime=1777731992&share_id=e42085f577d84047a7f5f9779588d692 saved: 2026-05-02 22:26:58

id: 5264236d-f1bb-488a-ae05-b55e7df0aa82

作者: 数据科学家阿宝哥

发布/编辑时间: 2026年04月23日 16:19

学机器学习被复杂的数学公式劝退?今天带来最友好的入门算法——KNN!4页手绘笔记带你从原理到代码全掌握,保证小白也能看懂!💪

🌟 KNN到底是什么?

K-Nearest Neighbors,中文叫K近邻算法。核心思想超级简单:近朱者赤,近墨者黑!想判断一个新样本是什么类别?看看它周围的K个邻居都是啥,少数服从多数,投票决定!

就像你搬到新小区,周围5个邻居里3个爱运动、2个爱学习,那你大概率也会变得爱运动!这就是KNN的逻辑,是不是超级直观?😊

📖 核心知识点全覆盖:

工作流程三步走:

计算新样本到所有训练样本的距离
按距离排序,选出最近的K个邻居
分类问题投票表决,回归问题取平均值
距离计算方法:

欧氏距离:直线距离,最常用(勾股定理)
曼哈顿距离:城市街区距离,只能横竖走
闵可夫斯基距离:通用形式,p=1是曼哈顿,p=2是欧氏
K值怎么选? 这是灵魂问题!K太小容易过拟合(受噪声影响),K太大容易欠拟合(边界模糊)。实用技巧:

K通常选奇数(避免平票)
经验值:K=√n
最佳方法:交叉验证找最优K
💡 优缺点要清楚:

优点:原理超简单、无需训练(懒人算法)、天然支持多分类、适合不规则决策边界

缺点:预测速度慢(要算所有距离)、内存消耗大、高维数据表现差(维度灾难)、必须做特征标准化!

⚠️ 重要提醒: 使用KNN有个致命注意点——必须做特征标准化!否则数值大的特征会主导距离计算,导致结果完全错误。这是新手最容易踩的坑!

🎯 适用场景:

小规模数据集(<10万)
低维特征(<20维)
推荐系统(找相似用户/商品)
手写数字识别
异常检测
不适合大规模、高维、实时预测场景。

💻 第4页附带完整Python代码! 从分类到回归,从数据预处理到K值选择,全流程代码示例!还有5个实用技巧:weights参数、metric选择、KD树加速、GridSearchCV调参等,拿来就能用!

🔥 总结: KNN是机器学习入门的最佳选择!原理简单到小学生都能懂,但要用好需要注意很多细节。理解了KNN,你就掌握了机器学习的核心思想:从数据中学习模式!

🔖 收藏这份笔记,开启你的AI学习之旅!

#机器学习 #KNN算法 #K近邻 #Python #数据科学 #算法学习 #手绘笔记 #干货分享 #入门教程 #AI学习

ImageImageImageImage


评论

  • 数据科学家阿宝哥: 最简单的算法~[派对R][派对R][派对R]