当前位置:主页 > 计算机电子书 > 机器学习 > 机器学习下载
scikit-learn机器学习(第2版)

scikit-learn机器学习(第2版) PDF 高清完整版

  • 更新:2024-04-25
  • 大小:176.4 MB
  • 类别:机器学习
  • 作者:加文·海克
  • 出版:人民邮电出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

scikit-learn机器学习(第2版)》是一本覆盖广泛机器学习算法与实战应用的指南,融合了深度学习的前沿知识和Python编程实践,该书详实地解释了从基础到高级的多种算法,如K近邻、逻辑回归、朴素贝叶斯到更复杂的神经网络,确保读者能够全面理解每一种技术,书中不仅仅局限于理论,更侧重于如何通过scikit-learn库将这些算法应用于实际问题,包括但不限于文本分类、图像识别和数据分析等,随着Python的流行,本书也成为了学习和应用机器学习的重要资源,透过14章丰富内容的讲解,读者可以逐步建立起使用scikit-learn进行数据挖掘和模型评估的能力,提升处理复杂数据问题的效率,这本书适合希望深入了解机器学习、提高数据分析能力的技术人员及对scikit-learn感兴趣的学者,是一本让理论与实践完美结合的工具书。

scikit-learn机器学习 第2版 PDF

深度学习是1个十分受欢迎的技术性,这书内容包括多种多样设备学习模型,包含时兴的机器学习算法,比如K近邻优化算法、逻辑回归、朴素贝叶斯、K 平均值优化算法、决策树及其神经网络算法。此外,还探讨了数据预处理、超主要参数提升和集成化方式等主题风格。 阅读文章完这书以后,用户将学好搭建用以文本文档归类、图像识别技术、广告词检验等每日任务的系统软件,还将学得怎么使用scikit-learn类库的API从类型自变量、文字和图象中获取特点,怎样评定实体模型的特性,并对怎样提高实体模型的特性创建判断力。此外,还将把握结合实际应用scikit-learn搭建高效率实体模型需要的专业技能,并可以根据好用的对策进行高級每日任务。近些年,Python語言变成了广火爆的计算机语言,而它在深度学习行业也是非常好的主要表现。scikit-learn是1个用Python語言撰写的机器学习算法库,它能够保持一连串常见的机器学习算法,是1个好专用工具。 这书根据14章內容,详尽地详细介绍了一连串设备学习模型和scikit-learn的应用方法。这书从深度学习的基础知识说起,包含了简易线性回归、K-近邻优化算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、离散系统归类、决策树重归、随机森林、感知机、支持向量机、神经网络算法、K-平均值优化算法、主成分分析等关键话题讨论。 这书合适深度学习行业的技术工程师学习培训,也合适愿意掌握scikit-learn的大数据工程师阅读文章。根据阅读文章这书,用户将合理提高自己在设备学习模型的搭建和评定层面的工作能力,并可以高效率地处理深度学习难点。

目录

  • 第 1章 机器学习基础 1
  • 1.1 定义机器学习 1
  • 1.2 从经验中学习 2
  • 1.3 机器学习任务 3
  • 1.4 训练数据、测试数据和验证数据 4
  • 1.5 偏差和方差 6
  • 1.6 scikit-learn简介 8
  • 1.7 安装scikit-learn 8
  • 1.7.1 使用pip安装 9
  • 1.7.2 在Windows系统下安装 9
  • 1.7.3 在Ubuntu 16.04系统下安装 10
  • 1.7.4 在Mac OS系统下安装 10
  • 1.7.5 安装Anaconda 10
  • 1.7.6 验证安装 10
  • 1.8 安装pandas、Pillow、NLTK和matplotlib 11
  • 1.9 小结 11
  • 第 2章 简单线性回归 12
  • 2.1 简单线性回归 12
  • 2.1.1 用代价函数评价模型的拟合性 15
  • 2.1.2 求解简单线性回归的OLS 17
  • 2.2 评价模型 19
  • 2.3 小结 21
  • 第3章 用K-近邻算法分类和回归 22
  • 3.1 K-近邻模型 22
  • 3.2 惰性学习和非参数模型 23
  • 3.3 KNN模型分类 23
  • 3.4 KNN模型回归 31
  • 3.5 小结 36
  • 第4章 特征提取 37
  • 4.1 从类别变量中提取特征 37
  • 4.2 特征标准化 38
  • 4.3 从文本中提取特征 39
  • 4.3.1 词袋模型 39
  • 4.3.2 停用词过滤 42
  • 4.3.3 词干提取和词形还原 43
  • 4.3.4 tf-idf权重扩展词包 45
  • 4.3.5 空间有效特征向量化与哈希技巧 48
  • 4.3.6 词向量 49
  • 4.4 从图像中提取特征 52
  • 4.4.1 从像素强度中提取特征 53
  • 4.4.2 使用卷积神经网络激活项作为特征 54
  • 4.5 小结 56
  • 第5章 从简单线性回归到多元线性回归 58
  • 5.1 多元线性回归 58
  • 5.2 多项式回归 62
  • 5.3 正则化 66
  • 5.4 应用线性回归 67
  • 5.4.1 探索数据 67
  • 5.4.2 拟合和评估模型 69
  • 5.5 梯度下降法 72
  • 5.6 小结 76
  • 第6章 从线性回归到逻辑回归 77
  • 6.1 使用逻辑回归进行二元分类 77
  • 6.2 垃圾邮件过滤 79
  • 6.2.1 二元分类性能指标 81
  • 6.2.2 准确率 82
  • 6.2.3 精准率和召回率 83
  • 6.2.4 计算F1值 84
  • 6.2.5 ROC AUC 84
  • 6.3 使用网格搜索微调模型 86
  • 6.4 多类别分类 88
  • 6.5 多标签分类和问题转换 93
  • 6.6 小结 97
  • 第7章 朴素贝叶斯 98
  • 7.1 贝叶斯定理 98
  • 7.2 生成模型和判别模型 100
  • 7.3 朴素贝叶斯 100
  • 7.4 在scikit-learn中使用朴素贝叶斯 102
  • 7.5 小结 106
  • 第8章 非线性分类和决策树回归 107
  • 8.1 决策树 107
  • 8.2 训练决策树 108
  • 8.2.1 选择问题 109
  • 8.2.2 基尼不纯度 116
  • 8.3 使用scikit-learn类库创建决策树 117
  • 8.4 小结 120
  • 第9章 集成方法:从决策树到随机森林 121
  • 9.1 套袋法 121
  • 9.2 推进法 124
  • 9.3 堆叠法 126
  • 9.4 小结 128
  • 第 10章 感知机 129
  • 10.1 感知机 129
  • 10.1.1 激活函数 130
  • 10.1.2 感知机学习算法 131
  • 10.1.3 使用感知机进行二元分类 132
  • 10.1.4 使用感知机进行文档分类 138
  • 10.2 感知机的局限性 139
  • 10.3 小结 140
  • 第 11章 从感知机到支持向量机 141
  • 11.1 核与核技巧 141
  • 11.2 最大间隔分类和支持向量 145
  • 11.3 用scikit-learn分类字符 147
  • 11.3.1 手写数字分类 147
  • 11.3.2 自然图片字符分类 150
  • 11.4 小结 152
  • 第 12章 从感知机到人工神经网络 153
  • 12.1 非线性决策边界 154
  • 12.2 前馈人工神经网络和反馈人工神经网络 155
  • 12.3 多层感知机 155
  • 12.4 训练多层感知机 157
  • 12.4.1 反向传播 158
  • 12.4.2 训练一个多层感知机逼近XOR函数 162
  • 12.4.3 训练一个多层感知机分类手写数字 164
  • 12.5 小结 165
  • 第 13章 K-均值算法 166
  • 13.1 聚类 166
  • 13.2 K-均值算法 168
  • 13.2.1 局部最优值 172
  • 13.2.2 用肘部法选择K值 173
  • 13.3 评估聚类 176
  • 13.4 图像量化 178
  • 13.5 通过聚类学习特征 180
  • 13.6 小结 184
  • 第 14章 使用主成分分析降维 185
  • 14.1 主成分分析 185
  • 14.1.1 方差、协方差和协方差矩阵 188
  • 14.1.2 特征向量和特征值 190
  • 14.1.3 进行主成分分析 192
  • 14.2 使用PCA对高维数据可视化 194
  • 14.3 使用PCA进行面部识别 196
  • 14.4 小结 199

资源下载

资源下载地址1:https://pan.baidu.com/s/1R5-yEcc_zvw7DzmfXorF7g

资源下载地址2:https://pan.quark.cn/s/eeb08b8e734b

相关资源

网友留言