《数据挖掘与机器学习:WEKA应用技术与实践》借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分8章,主要内容包括Weka介绍、Explorer界面、KnowledgeFlow界面、Experimenter界面、命令行界面、Weka高级应用、WekaAPI和学习方案源代码分析。作为国内第一本系统讲解Weka的书籍,《数据挖掘与机器学习:WEKA应用技术与实践》内容全面、实例丰富、可操作性强,做到理论与实践的统一。本书适合数据挖掘和机器学习相关人员作为技术参考书,也适合作为计算机专业高年级本科生和研究生教材或教学参考用书。
目录
- 第1章 Weka介绍
- 1.1 Weka简介
- 1.1.1 Weka历史
- 1.1.2 Weka功能简介
- 1.2 基本概念
- 1.2.1 数据挖掘和机器学习
- 1.2.2 数据和数据集
- 1.2.3 ARFF格式
- 1.2.4 预处理
- 1.2.5 分类与回归
- 1.2.6 聚类分析
- 1.2.7 关联分析
- 1.3 Weka系统安装
- 1.3.1 系统要求
- 1.3.2 安装过程
- 1.3.3 Weka使用初步
- 1.3.4 系统运行注意事项
- 1.4 访问数据库
- 1.4.1 配置文件
- 1.4.2 访问数据库
- 1.4.3 常见问题及解决办法
- 1.5 示例数据集
- 1.5.1 天气问题
- 1.5.2 鸢尾花
- 1.5.3 CPU
- 1.5.4 玻璃数据集
- 1.5.5 美国国会投票记录
- 1.5.6 乳腺癌数据集
- 课后强化训练
- 第2章 Explorer界面
- 2.1 图形用户界面
- 2.1.1 标签页简介
- 2.1.2 状态栏
- 2.1.3 图像输出
- 2.1.4 手把手教你用
- 2.2 预处理
- 2.2.1 加载数据
- 2.2.2 属性处理
- 2.2.3 过滤器
- 2.2.4 过滤器算法介绍
- 2.2.5 手把手教你用
- 2.3 分类
- 2.3.1 分类器选择
- 2.3.2 分类器训练
- 2.3.3 分类器输出
- 2.3.4 分类算法介绍
- 2.3.5 分类模型评估
- 2.3.6 手把手教你用
- 2.4 聚类
- 2.4.1 聚类面板操作
- 2.4.2 聚类算法介绍
- 2.4.3 手把手教你用
- 2.5 关联
- 2.5.1 关联面板操作
- 2.5.2 关联算法介绍
- 2.5.3 手把手教你用
- 2.6 选择属性
- 2.6.1 选择属性面板操作
- 2.6.2 选择属性算法介绍
- 2.6.3 手把手教你用
- 2.7 可视化
- 2.7.1 选择单独的2D散点图
- 2.7.2 选择实例
- 2.7.3 手把手教你用
- 课后强化训练
- 第3章 Knowledge Flow界面
- 3.1 知识流介绍
- 3.1.1 知识流特性
- 3.1.2 知识流界面布局
- 3.2 知识流组件
- 3.2.1 数据源
- 3.2.2 数据接收器
- 3.2.3 评估器
- 3.2.4 可视化器
- 3.2.5 其他工具
- 3.3 使用知识流组件
- 3.4 手把手教你用
- 课后强化训练
- 第4章 Experimenter界面
- 4.1 简介
- 4.2 标准实验
- 4.2.1 简单实验
- 4.2.2 高级实验
- 4.2.3 手把手教你用
- 4.3 远程实验
- 4.3.1 远程实验设置
- 4.3.2 手把手教你用
- 4.4 分析结果
- 4.4.1 获取实验结果
- 4.4.2 配置测试
- 4.4.3 保存结果
- 4.4.4 手把手教你用
- 课后强化训练
- 第5章 命令行界面
- 5.1 命令行界面介绍
- 5.1.1 命令调用
- 5.1.2 命令自动完成
- 5.2 Weka结构
- 5.2.1 类实例和包
- 5.2.2 weka.core包
- 5.2.3 weka.classifiers包
- 5.2.4 其他包
- 5.3 命令行选项
- 5.3.1 常规选项
- 5.3.2 特定选项
- 5.4 过滤器和分类器选项
- 5.4.1 过滤器选项
- 5.4.2 分类器选项
- 5.4.3 手把手教你用
- 5.5 包管理器
- 5.5.1 命令行包管理器
- 5.5.2 运行安装的算法
- 课后强化训练
- 第6章 Weka高级应用
- 6.1 贝叶斯网络
- 6.1.1 简介
- 6.1.2 贝叶斯网络编辑器
- 6.1.3 在探索者中使用贝叶斯网络
- 6.1.4 学习算法
- 6.1.5 查看贝叶斯网络
- 6.1.6 手把手教你用
- 6.2 神经网络
- 6.2.1 GUI使用
- 6.2.2 手把手教你用
- 6.3 文本分类
- 6.3.1文本分类示例
- 6.3.2 分类真实文本
- 6.3.3 手把手教你用
- 6.4 时间序列分析及预测
- 6.4.1 使用时间序列环境
- 6.4.2 手把手教你用
- 课后强化训练
- 第7章 Weka API
- 7.1 加载数据
- 7.1.1 从文件加载数据
- 7.1.2 从数据库加载数据
- 7.1.3 手把手教你用
- 7.2 保存数据
- 7.2.1 保存数据至文件
- 7.2.2 保存数据至数据库
- 7.2.3 手把手教你用
- 7.3 处理选项
- 7.3.1 处理选项方法
- 7.3.2 手把手教你用
- 7.4 内存数据集处理
- 7.4.1 在内存中创建数据集
- 7.4.2 打乱数据顺序
- 7.4.3 手把手教你用
- 7.5 过滤
- 7.5.1 批量过滤
- 7.5.2 即时过滤
- 7.5.3 手把手教你用
- 7.6 分类
- 7.6.1 分类器构建
- 7.6.2 分类器评估
- 7.6.3 实例分类
- 7.6.4 手把手教你用
- 7.7 聚类
- 7.7.1 聚类器构建
- 7.7.2 聚类器评估
- 7.7.3 实例聚类
- 7.7.4 手把手教你用
- 7.8 属性选择
- 7.8.1 使用元分类器
- 7.8.2 使用过滤器
- 7.8.3 使用底层API
- 7.8.4 手把手教你用
- 7.9 可视化
- 7.9.1 ROC曲线
- 7.9.2 图
- 7.9.3 手把手教你用
- 7.10 序列化
- 7.10.1 序列化基本方法
- 7.10.2 手把手教你用
- 7.11 文本分类综合示例
- 7.11.1 程序运行准备
- 7.11.2 源程序分析
- 7.11.3 运行说明
- 课后强化训练
- 第8章 学习方案源代码分析
- 8.1 NaiveBayes源代码分析
- 8.2 实现分类器的约定
- 课后强化训练
- 附录A 中英文术语对照
- 附录B Weka算法介绍
-
参考文献