编辑推荐
本书基于通俗易懂的Python语言环境,拥有丰富的数据科学相关库,从零开始讲解数据科学工作。具体内容包括:Python速成,可视化数据,线性代数,统计学,概率,假设与推理,梯度下降法,如何获取数据,K近邻法,朴素贝叶斯算法等。用大量的具体例子和数据挖掘、统计学、机器学习领域的重要概念等,详细展示什么是数据科学。
目录
- 前言 xiii
- 第1章 导论 1
- 1.1 数据的威力 1
- 1.2 什么是数据科学 1
- 1.3 激励假设:DataSciencester 2
- 1.3.1 寻找关键联系人 3
- 1.3.2 你可能知道的数据科学家 5
- 1.3.3 工资与工作年限 8
- 1.3.4 付费账户 10
- 1.3.5 兴趣主题 11
- 1.4 展望 12
- 第2章 Python速成 13
- 2.1 基础内容 13
- 2.1.1 Python获取 13
- 2.1.2 Python之禅 14
- 2.1.3 空白形式 14
- 2.1.4 模块 15
- 2.1.5 算法 16
- 2.1.6 函数 16
- 2.1.7 字符串 17
- 2.1.8 异常 18
- 2.1.9 列表 18
- 2.1.10 元组 19
- 2.1.11 字典 20
- 2.1.12 集合 22
- 2.1.13 控制流 23
- 2.1.14 真和假 24
- 2.2 进阶内容 25
- 2.2.1 排序 25
- 2.2.2 列表解析 &n
数据科学正在蓬勃发展、在一个前途无限的行业,有人称之为数据科学家“21世纪最性感的职业”本书从零开始讲解数据科学工作,教授数据科学工作所必须的黑客技能,带领读者熟悉数据科学——数学和统计学的核心知识。作者选择了强大、Python语言环境很容易学习,工具和算法都是手工构建的,带有精心选择的注释、简单易读的实现示例。书中涵盖的所有代码和数据都可以在GitHub上下载。
说是数据科学指路到是差不多。告诉你有哪些方面的知识需要去学习的。25章每章都值得单独去借上一两本书去学习,都值得花上一两个月用上N多个案例来实践,这样之后,我觉得才是真的入门了。
书中的代码又是一段一段的,估计只有作者才会知道这个功能是怎么来的,有什么用。后面的章里面经常大量地使用到前面各章中的代码(函数),但是书里面是不会告诉你需要(从哪里)导入的。甚至有些是python自带模块的函数,作者也是不会说的。但是却是经常需要from collections import Counter,或者from functools import partial等等。又不说,谁知道呢。感觉就是作者觉得这么讲,你们(读者)应该懂了。
不过就像开头说的,至少它起到了一个引路的作用,还是有其作用的。我就对里面提到的贝叶斯和线性回归比较感兴趣,已经借了两本专门讲贝叶斯分析的书回来看了。还专门拿了大学时候的统计学教材来学习“相关和回归分析”相关内容。
前面读起来感觉还可以,有种学会了感觉,但后面就慢慢读不懂了,作者对这些算法的历史,特点,适用场景等知识似乎没有怎么讨论,所以后面感觉学的就比较混乱了。而且不依赖矩阵等类库,看似用标准库就实现许多算法很厉害, 其实反而加大了学习难度跟减少了实用性。 但是对人还是有一定启发的