python K-NN算法的优缺点
- 更新时间:2021-06-26 09:48:37
- 编辑:束子明
参考资料
- Python +Excel高效办公:轻松实现Python数据分析与可视化 PDF 电子书 / 83.7 MB / 蔡驰聪 推荐度:
- Python语言程序设计基础 PDF 电子书 / 48.4 MB / 嵩天、礼欣、黄天羽 推荐度:
- Python数据分析与数据化运营 PDF 电子书 / 18 MB / 宋天龙 推荐度:
- 《树莓派Python编程入门与实战(第2版)》配套资源 配套资源 / 34.31 KB / 勃鲁姆,布莱斯纳罕 推荐度:
- Python机器学习经典实例 PDF 电子书 / 27.3M / 普拉提克·乔西 推荐度:
正文内容
无意中在网上看到《python K-NN算法的优缺点》,好久没看到这么好的Py技术类文章,把错误代码改掉了,为了大家阅读方便。
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
1、优点
(1)简单而有效
(2)再培训成本低。
(3)适合跨领域的抽样。
基于KNN的方法主要依赖于附近有限个样本,而基于类域的KNN方法则不能确定其所属的类类,所以KNN方法更适合于类域有较多交叉或重叠的待分样本集。
(4)适用于各种样本量的分类。
所提出的方法适用于类域中具有较大样本容量的类动态分类,而类域中具有较大样本容量的类动态分类更易产生错误。
2、缺点
(1)是惰性学习。
KNN算法是一种懒散的学习方法(lazylearning,基本不学习),⼀次主动学习算法速度要快得多。
(2)类评分未规格化。
不同之处在于通过概率评分进行分类。
(3)输出的可解释性较差。
比如,决策树的输出可以很好地解释。
(4)不善于处理不均衡的样品。
在样本不平衡时,例如⼀个类的样本容量很小,而其它类的样本容量很小,就有可能导致当一个新样本出现在同一K个邻域中时,在该类的K个邻域中占多数。这个算法只计算“最近的”邻域样本,其中一类样本的个数很小,那么这类样本可能与另一类样本的个数不近,或者这类样本与另一类样本的个数不近。然而,量的大小并不会影响到操作结果。对此,可采用一种改进的同位素同位素同位素同位素法(即同位素离位素同位素同位素同位素)。
以上就是python K-NN算法优缺点的介绍,希望能对大家有所帮助。更多Python学习指路:
相关教程
-
python实现蒙特卡罗方法(代码示例)
本篇文章给大家带来的内容是关于python实现蒙特卡罗方法(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
发布时间:2019-07-11
-
python 多线程共享全局变量的优劣
这篇文章主要介绍了python 多线程共享全局变量的优劣,帮助大家更好的理解和学习python多线程,感兴趣的朋友可以了解下
发布时间:2021-05-02