编辑推荐
《数学之美》荣获第八届文津图书奖,目前累计已卖出12万册。《数学之美》入选广电总局“2014年向青少年推荐百种优秀图书书目”《浪潮之巅》作者、谷歌公司PrincipalEngineer吴军博士力作《数学之美》由创新工场董事长兼首席执行官李开复倾力作序推荐。《数学之美》的创作源自点击超百万的谷歌黑板报专题博客,吴军应出版要求几乎改写和重构了所有的文章,既照顾了普通读者的兴趣,又兼顾了专业读者对深度的要求。在《数学之美》里,吴军集中阐述了他对数学和信息处理这些专业学科的理解,尤其是他在语音识别、自然语言处理和信息搜索领域多年来的积累。从数字和信息的由来,到搜索引擎对信息进行处理背后的数学原理,到与搜索相关的众多领域后面的奇妙的数学应用,吴军都娓娓道来。他把数学后面的本质思维写得透彻、生动。不得不说,他的文字,引人入胜,也确实让我们体会到数学的美。在他的笔下,数学不是我们一般联想到的枯燥深奥的符号,而是实实在在源于生活的有趣的现象和延伸。数学,其实无处不在,而且有一种让人惊叹的韵律和美!
内容简介
几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,并被热情的读者广为传播,得到高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣,才真正明白“数学是科学的皇后”这句名言。今年,作者吴军博士几乎把所有的文章都重写了一遍,为的是能把高深的原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。经过改写和重构后,《数学之美》在整体和细节的度上控制得更好。希望读者通过具体的例子学到的是思考问题的方式,学会如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。同时书中也留了很多问题给愿意钻研的人做进一步深入思考。
作者简介
吴军博士毕业于清华大学和美国约翰霍普金斯大学(博士),是著名自然语言处理和搜索专家,硅谷风险投资人。 吴军博士于2002年加入谷歌公司。在谷歌,他和AmitSinghal(谷歌院士,世界著名搜索专家)、MattCutts(谷歌反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得谷歌工程奖。2003年,他和谷歌全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前谷歌中日韩文搜索算法的主要设计者。在谷歌期间,他还领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了当时公司首席执行官埃里克施密特和创始人谢尔盖布林的高度评价。2010年加盟腾讯公司,出任负责搜索和搜索广告的副总裁。2012年回到谷歌,领导创新项目。 吴军博士在外发表过数十篇论文,曾获得1995年全国人机语音智能接口会议的*论文奖和2000年Eurospeech的*论文奖。他还获得和申请了十余项美国和国际专利。他撰写的《浪潮之巅》(版)和《数学之美》深受业界的好评。吴军博士在美国两家风险投资基金(中国世纪基金和ZPark风险基金)分别担任董事和顾问,他还担任约翰霍普金斯大学工学院董事会董事,以及该校国际事务委员会的顾问。他曾经是国家重大专项“新一代搜索引擎和浏览器”项目的总负责人。从2012年起任职工业与信息化部的专家和顾问。
目录
- 出版说明
- 序言1
- 序言2
- 前言
- 第1章 文字和语言 vs 数字和信息
- 文字和语言与数学,从产生起原本就有相通性,虽然它们的发展一度分道扬镳,但是最终还是能走到一起。
- 1 信息
- 2 文字和数字
- 3 文字和语言背后的数学
- 4 小结
- 第2章 自然语言处理 — 从规则到统计人类对机器理解自然语言的认识走了一条大弯路。早期的研究集中采用基于规则的方法,虽然解决了一些简单的问题,但是无法从根本上将自然语言理解实用化。直到?多年后,人们开始尝试用基于统计的方法进行自然语言处理,才有了突破性进展和实用的产品。
- 1 机器智能
- 2 从规则到统计
- 3 小结
- 第3章 统计语言模型
- 统计语言模型是自然语言处理的基础,并且被广泛应用于机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询。
- 1 用数学的方法描述语言规律
- 2 延伸阅读:统计语言模型的工程诀窍
- 3 小结
- 第4章 谈谈中文分词
- 中文分词是中文信息处理的基础,它同样走过了一段弯路,目前依靠统计语言模型已经基本解决了这个问题。
- 1 中文分词方法的演变
- 2 延伸阅读:工程上的细节问题
- 3 小结
- 第5章 隐含马尔可夫模型
- 隐含马尔可夫模型最初应用于通信领域,继而推广到语音和语言处理中,成为连接自然语言处理和通信的桥梁。同时,隐含马尔可夫模型也是机器学习的主要工具之一。
- 1 通信模型
- 2 隐含马尔可夫模型
- 3 延伸阅读:隐含马尔可夫模型的训练
- 4 小结
- 第6章 信息的度量和作用
- 信息是可以量化度量的。信息熵不仅是对信息的量化度量,也是整个信息论的基础。它对于通信、数据压缩、自然语言处理都有很强的指导意义。
- 1 信息熵
- 2 信息的作用
- 3 延伸阅读:信息论在信息处理中的应用
- 4 小结
- 第7章 贾里尼克和现代语言处理
- 作为现代自然语言处理的奠基者,贾里尼克教授成功地将数学原理应用于自然语言处理领域中,他的一生富于传奇色彩。
- 1 早年生活
- 2 从水门事件到莫妮卡·莱温斯基
- 3 一位老人的奇迹
- ...