《scikit-learn机器学习:常用算法原理及编程实战》是一本非常实用的书籍。对于想要入门机器学习的读者来说,这本书提供了一个低门槛的学习机会。书中详细介绍了scikit-learn机器学习的应用场景、编程步骤以及Python开发包的使用方法。书中还介绍了算法模型性能评估的方法,并详细介绍了8大常用算法。最为特别的是,本书还提供了7大实战案例演练,让读者能够通过实际操作的方式更好地理解机器学习算法的原理和应用。这本书适合那些具备一定编程基础的读者阅读,是一本很实用的学习工具。
scikit-learn机器学习电子书封面
读者评价
书还错,通俗易懂的结合实例讲解了很多库函数的使用,最令我感兴趣的就是P118的那段话:人生价值的实现,在于消费资源(增熵过程)来获取能量,经过自己的劳动付出,让世界变得更加纯净有序(减熵过程),信息增益(减熵量-增熵量)即是衡量人生价值的尺度。理工男要有理工男的文艺!
机器学习程序入门,通俗容易入门
这本书正好满足了这两个特点:用深入浅出的讲解帮助初学者学习理论知识;用大量有益的实例带领读者实践,并检验学习效果。无论是机器学习的入门人员,还是有一定基础的进阶者,均能从本书中有所获益
前,人工智能是一个热门话题,这使得驱动其发展的机器学习和深度学习等技术也变得炙手可热。而学习这些技术的门槛不低,有相当难度。可喜的是,本书将这个门槛大大地降低了,读者不会一上来就被一大堆数学公式和推导过程折磨,非常值得一读。
介绍了在Python环境下学习scikit-learn机器学习框架的相关知识,涵盖的主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k-近邻算法等算法
内容介绍
本书通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,让读者以较低的代价和门槛入门机器学习。
本书共分为11章,介绍了在Python环境下学习scikit-learn机器学习框架的相关知识,涵盖的主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k-近邻算法、线性回归算法、逻辑回归算法、决策树、支持向量机、朴素贝叶斯算法、PCA算法和k-均值算法等。
本书适合有一定编程基础的读者阅读,尤其适合想从事机器学习、人工智能、深度学习及机器人相关技术的程序员和爱好者阅读。另外,相关院校和培训机构也可以将本书作为教材使用。
目录
- 前言
- 第1章 机器学习介绍 1
- 第2章 Python机器学习软件包 7
- 第3章 机器学习理论基础 58
- 第4章 k-近邻算法 69
- 第5章 线性回归算法 83
- 第6章 逻辑回归算法 98
- 第7章 决策树 115
- 第8章 支持向量机 134
- 第9章 朴素贝叶斯算法 151
- 第10章 PCA算法 168
- 第11章 k-均值算法 190
- 后记 205
现在,很多人想开发高效的算法以及参加机器学习的竞赛。所以他们过来问我:”该如何开始?”。一段时间以前,我在一个俄罗斯联邦政府的下属机构中领导了媒体和社交网络大数据分析工具的开发。我仍然有一些我团队使用过的文档,我乐意与你们分享。前提是读者已经有很好的数学和机器学习方面的知识(我的团队主要由MIPT(莫斯科物理与技术大学)和数据分析学院的毕业生构成)。 这篇文章是对数据科学的简介,这门学科最近太火了。机器学习的竞赛也越来越多(如,Kaggle, TudedIT),而且他们的资金通常很可观。 R和Python是提供给数据科学家的最常用的两种工具。每一个工具都有其优缺点,但Python最近在各个方面都有所胜出(仅为鄙人愚见,虽然我两者都用)。这一切的发生是因为Scikit-Learn库的腾空出世,它包含有完善的文档和丰富的机器学习算法。 请注意,我们将主要在这篇文章中探讨机器学习算法。通常用Pandas包去进行主数据分析会比较好,而且这很容易你自己完成。所以,让我们集中精力在实现上。为了确定性,我们假设有一个特征-对象矩阵作为输入,被存在一个*.csv文件中。
Sklearn包含的常用算法里介绍过常用的算法,scikit-learn中学习模式的调用,有很强的统一性,很多都是类似的,学会一个,其他基本差不多。以day2简单线性回归为例 from sklearn.linear_model importLinearRegression #导入模型 regressor = LinearRegression() #建立模型 regressor = regressor.fit(X_train, Y_train) #训练模型 regressor.predict(X_test) #预测