这书朝向全部对深度学习与大数据挖掘的实践活动及比赛很感兴趣的用户,重零开始,以Python计算机语言为基本,不在涉及到很多数学分析模型与繁杂程序编写专业知识的前提条件下,逐渐领着用户了解而且把握时下很时兴的深度学习、大数据挖掘与自然语言理解专用工具,如Scikitlearn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。本书共有4章。靠前章介绍篇,详细介绍深度学习定义与Python程序编写专业知识;第2章基本篇,叙述怎么使用Scikitlearn做为基本深度学习专用工具;第3章实战篇,涉及到如何依靠非常好技术性或是实体模型全面提高具有深度学习系统软件的特性;第4章比赛篇,以Kaggle服务平台为另一半,协助用户一步一步应用这书详细介绍过的实体模型和方法,进行3项具备象征性的比赛每日任务。
目录
- 第1章简介篇
- 1.1机器学习综述
- 1.1.1任务
- 1.1.2经验
- 1.1.3性能
- 1.2Python编程库
- 1.2.1为什么使?
- 1.2.2Python机器学习的优势
- 1.2.3NumPy&SciPy
- 1.2.4Matplotlib
- 1.2.5Scikit-learn
- 1.2.6
- 1.2.7An
- 1.3Python环境配置
- 1.3.1Windows系统环境
- 1.3.2MacOS系统环境
- 1.4Python编程基础
- 1.4.1Python基本语法
- 1.4.2Python数据类型
- 1.4.3Python数据运算
- 1.4.4Python流程控制
- 1.4.5Python函数(模块)设计
- 1.4.6Python编程库(包)的导入.
- 1.4.7Python基础综合实践.
- 1.5章末小结
- 第2章基础篇
- 2.1监督学习经典模型
- 2.1.1分类学习
- 2.1.1.1线性分类器
- 2.1.1.2支持向量机(分类)
- 2.1.1.3朴素贝叶斯
- 2.1.1.4K近邻(分类)
- 2.1.1.5决策树
- 2.1.1.6集成模型(分类)
- 2.1.2回归预测
- 2.1.2.1线性回归器
- 2.1.2.2支持向量机(回归)
- 2.1.2.3K近邻(回归)
- 2.1.2.4回归树
- 2.1.2.5集成模型(回归)
- 2.2无监督学习经典模型
- 2.2.1数据聚类
- 2.2.1.1K均值算法
- 2.2.2特征降维
- 2.2.2.1主成分分析
- 2.3章末小结
- 第3章进阶篇
- 3.1模型实用技巧
- 3.1.1特征提升
- 3.1.2模型正则化
- 3.1.3模型检验
- 3.1.4超参数搜索
- 3.2流行库/模型实践
- 3.2.1自然语言处理包(NLTK)
- 3.2.2词向量(Word2Vec)技术
- 3.2.3XGBoost模型
- 3.2.4Tensorflow框架
- 3.3章末小结
- 第4章实战篇
- 4.1Kaggle平台简介
- 4.2Titanic罹难乘客预测
- 4.3IMDB影评得分估计
- 4.4MNIST手写体数字图片识别.
- 4.5章末小结.
- 后记
- 参考文献