《分布式机器学习:算法、理论与实践》一书系统地介绍了分布式机器学习的各个方面,从全景式的绪论到具体的框架与功能模块,再到对未来发展的展望,作者以微软亚洲研究院机器学习研究团队多年的研究成果为基础,深入浅出地讨论了该领域的重要议题,不仅适合作为研究生的参考文献,也是从业者的实用工具书,书中细分的12章涵盖了机器学习基础、分布式框架、优化算法、通信机制、算法理论等诸多方面,并介绍了几个主流的分布式机器学习系统,特别值得一提的是,作者对不同选项组合而成的分布式机器学习算法进行了深入探讨,这对读者理解和选择合适的算法具有重要意义,总体而言,这本书填补了市场上关于分布式机器学习的空白,为学习和探索该领域的读者提供了一份重要参考资料。
本书旨在全面介绍分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来的发展方向。
全书共12章。第1章是绪论,向大家展示分布式机器学习这个领域的全景。第2章介绍机器学习的基础知识。第3章到第8章是本书的核心部分,向大家细致地讲解分布式机器学习的框架及其各个功能模块。其中第3章给出整个分布式机器学习框架的综述,而第4章到第8章则分别针对其中的数据与模型划分模块、单机优化模块、通信模块、数据与模型聚合模块加以介绍。接下来的三章是对前面内容的总结与升华。其中第9章介绍由分布式机器学习框架中不同选项所组合出来的各式各样的分布式机器学习算法,第10章讨论这些算法的理论性质,第11章则介绍几个主流的分布式机器学习系统(包括Spark MLlib 迭代式MapReduce系统,Multiverso参数服务器系统,TensorFlow数据流系统)。*后的第12章是全书的结语,在对全书内容进行简要总结之后,着重讨论分布式机器学习这个领域未来的发展方向。
本书基于微软亚洲研究院机器学习研究团队多年的研究成果和实践经验写成,既可以作为研究生从事分布式机器学习方向研究的参考文献,也可以作为人工智能从业者进行算法选择和系统设计的工具书。
人工智能大潮中,市场上已有许多机器学习书籍,但是分布式机器学习的专门书籍还很少见。本书是希望学习和了解分布式机器学习的读者的福音。
目录
- 第1章 绪论/ 1
- 第2章 机器学习基础/ 9
- 第3章 分布式机器学习框架/ 41
- 第4章 单机优化之确定性算法/ 61
- 第5章 单机优化之随机算法/ 85
- 第6章 数据与模型并行/ 113
- 第7章 通信机制/ 135
- 第8章 数据与模型聚合/ 159
- 第9章 分布式机器学习算法/ 177
- 第10章 分布式机器学习理论/ 209
- 第11章 分布式机器学习系统/ 229
- 第12章 结语/ 255索引/ 260