《MLOps实战:机器学习模型的开发、部署与应用》是由机械工业出版社出版的一本关于MLOps实战方面的书籍,作者是马克·特雷维尔,主要介绍了关于MLOps实战、机器学习方面的知识内容,目前在MLOps实战类书籍综合评分为:8.4分。
书籍介绍
编辑推荐
当今组织创建的分析和机器学习(ML)模型超过一半从未投入生产。机器学习运营化的一些挑战和障碍是技术性的,但其他则是组织性的。无论采取哪种方式解决问题,底线是未投入生产的模型不会影响业务。
本书介绍了MLOps的关键概念,以帮助数据科学家和应用工程师操作ML模型来驱动真正的业务变化,并随着时间的推移维护和改进这些模型。以全球众多MLOps应用课程为基础,9位机器学习专家深入探讨了模型生命周期的五个阶段——开发、预生产、部署、监控和治理,揭示了如何将强大的MLOps流程贯穿始终。
本书将帮助你:
·通过减少整个ML管道和工作流程中的摩擦,实现数据科学的价值。
·通过再培训、定期调整和全面改造来完善ML模型,以确保长期准确性。
·设计MLOps生命周期,使用公正、公平、可解释的模型将组织风险降至*低。
·为管道的部署和更复杂、标准化程度更低的外部业务系统实施ML模型。
内容简介
本书分为三部分。第1部分介绍MLOps主题,深入探讨了它是如何(以及为什么)发展成一门学科的、需要谁参与才能成功执行MLOps以及需要哪些组成部分。
第二部分介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监测和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供第3章中所涉及主题相关的更多详细信息。
第三部分提供了MLOps的具体示例,以便读者了解MLOps在实践中的设置和含义。
目录
- 前言1
- 第一部分 MLOps是什么,为什么要使用MLOps5
- 第1章 为什么现在要使用MLOps,使用MLOps面临的挑战7
- 1.1 定义MLOps及面临的挑战8
- 1.2 使用MLOps以降低风险11
- 1.3 大规模的MLOps14
- 结语15
- 第2章 MLOps的使用人员16
- 2.1 行业专家17
- 2.2 数据科学家20
- 2.3 数据工程师22
- 2.4 软件工程师23
- 2.5 DevOps团队23
- 2.6 模型风险管理者/审计师24
- 2.7 机器学习架构师25
- 结语26
- 第3章 MLOps的主要组成部分27
- 3.1 机器学习入门27
- 3.2 模型开发28
- 3.3 产品化与部署31
- 3.4 监控33
- 3.5 迭代与生命周期36
- 3.6 治理38
- 结语42
- 第二部分 如何实现43
- 第4章 开发模型45
- 4.1 什么是机器学习模型46
- 4.2 数据探索50
- 4.3 特征工程与特征选择50
- 4.4 实验53
- 4.5 评估和比较模型55
- 4.6 版本管理和再现性60
- 结语62
- 第5章 准备投入生产63
- 5.1 运行时环境63
- 5.2 模型风险评估67
- 5.3 机器学习的质量保证69
- 5.4 测试的关键注意事项69
- 5.5 再现性和可审计性70
- 5.6 机器学习安全72
- 5.7 降低模型风险74
- 结语76
- 第6章 部署到生产78
- 6.1 CI/CD管道78
- 6.2 创建ML工件80
- 6.3 部署策略82
- 6.4 容器化85
- 6.5 扩展部署86
- 6.6 需求和挑战88
- 结语89
- 第7章 监控和反馈回路90
- 7.1 模型应该多久接受一次再训练91
- 7.2 理解模型退化94
- 7.3 实践中的漂移检测97
- 7.4 反馈回路100
- 结语108
- 第8章 模型治理109
- 8.1 由谁决定组织的治理需求109
- 8.2 将治理与风险级别相匹配111
- 8.3 推动MLOps治理的现行法规112
- 8.4 新一轮人工智能特定法规115
- 8.5 负责任的人工智能的出现117
- 8.6 负责任的人工智能的关键要素118
- 8.7 MLOps治理模板122
- 结语130
- 第三部分 MLOps具体示例131
- 第9章 实践中的MLOps:消费信贷风险管理133
- 9.1 背景:商业使用案例133
- 9.2 模型开发134
- 9.3 模型偏见考虑135
- 9.4 为生产做准备135
- 9.5 部署到生产环境136
- 结语137
- 第10章 实践中的MLOps:营销推荐引擎138
- 10.1 推荐引擎的兴起138
- 10.2 数据准备140
- 10.3 设计和管理实验141
- 10.4 模型训练和部署141
- 10.5 管道结构和部署策略144
- 10.6 监控和反馈145
- 结语148
- 第11章 实践中的MLOps:消耗预测149
- 11.1 能源系统149
- 11.2 数据收集151
- 11.3 问题定义:机器学习,还是不机器学习153
- 11.4 空间和时间分辨率153
- 11.5 实施154
- 11.6 建模155
- 11.7 部署157
- 11.8 监控157
- 结语158