本书《数据挖掘与机器学习:WEKA应用技术与实践(第二版)》是一本很有实用价值的技术参考书。它通过大量的实践操作,帮助读者全面了解并掌握数据挖掘和机器学习的相关技能。在书中,作者系统地讲解了Weka 3.7.13的操作、理论和应用,使读者能够深入学习和应用该工具。无论是在数据挖掘还是机器学习领域的从业者,本书都具有很高的实用性和指导性,可以作为技术参考书用于实际工作中。
数据挖掘与机器学习:WEKA应用技术与实践电子书封面
读者评价
讲解很详细,很实用。只可惜,在书中发现的几处明显的错误
可以看成网络手册的翻译版本,给出了details,但是没有insight.当然 insight是大家最希望学习到的,但是details 是魔鬼。所以还是可以放在手边的。但是如果是作为手边书,为什么不用电子版?
主要看了看 Weka API 部分,比较详细
大概翻了下,内容很详实全面。初学数据挖掘,个人觉得Weka最适合入门,不仅实用,而且基本上涵盖了当今数据挖掘算法的方方面面,还能很方便的嵌入实际的Java项目开发。很值得买,除了书中的一些软件操作界面,印刷过小,很难看清其中的文字,其它都好。
内容介绍
本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分9章,主要内容包括Weka介绍、探索者界面、知识流界面、实验者界面、命令行界面、Weka高级应用、Weka API、学习方案源代码分析和机器学习实战。 本书系统讲解Weka 3.7.13的操作、理论和应用,内容全面、实例丰富、可操作性强,做到理论与实践的统一。本书适合数据挖掘和机器学习相关人员作为技术参考书使用,也适合用作计算机专业高年级本科生和研究生的教材或教学参考用书。
目录
- 第1章 Weka介绍 1
- 课后强化练习 34
- 第2章 探索者界面 35
- 操作 118
- 课后强化练习 140
- 第3章 知识流界面 143
- 课后强化练习 181
- 第4章 实验者界面 183
- 课后强化练习 229
- 第5章 命令行界面 231
- 课后强化练习 255
- 第6章 Weka高级应用 257
- 网络 269
- 课后强化练习 326
- 第7章 Weka API 327
- 课后强化练习 404
- 第8章 学习方案源代码分析 405
- 课后强化练习 429
- 第9章 机器学习实战 431
- 课后强化练习 471
- 附录A 中英文术语对照 472
- 附录B Weka算法介绍 476
- 过滤器算法介绍 476
- 分类算法介绍 498
- 聚类算法介绍 526
- 关联算法介绍 530
- 选择属性算法介绍 532
- 参考文献 537
算法面试注意细节 算法工程师岗位(机器学习、数据挖掘、数据分析等)面试主要包含两大块:首先是基本的 Coding 能力;其次就是机器学习算法的理论与应用能力。 基本的 Coding 能力考察,主要是让你写一些数据结构与算法设计的常见算法题,比如链表类、二叉树、排序、查找、动态规划等。这方面建议《剑指 Offer》+ LeetCode 结合的方式进行练习。 机器学习算法理论与应用能力不用说,应付面试看本课程就行了。当然师父领进门,修行在个人,想要在这方面深造,还需要大量实践和广泛学习优秀的论文和开源源代码。
就机器学习与数据挖掘两者来说,个人认为两者从实际运用和内容上来说重叠部分较多,不好完全区分开来。 机器学习,又可以理解为计算机学习、程序学习、模型学习,或者说是agent学习,即人们通过编程或其他方式创造出一个模型,然后训练该模型,使该模型具有通过学习增长知识的能力;数据挖掘,又可以理解为挖掘数据,在大量数据中发现和挖掘到的知识是我们想要获得的东西。机器学习更偏向于是一种手段或者方式,数据挖掘更偏向于是一种过程或者目的。以拿铲子挖宝藏为例,铲子代表机器学习,宝藏代表知识,土壤代表数据,整个动作或过程或做这件事的目的代表数据挖掘