当前位置:主页 > 计算机电子书 > 大数据分析 > 数据分析下载
敏捷数据科学:用Hadoop创建数据分析应用

敏捷数据科学:用Hadoop创建数据分析应用 PDF 超清版

  • 更新:2021-08-20
  • 大小:22.7MB
  • 类别:数据分析
  • 作者:Russell、Jurney、冯文
  • 出版:电子工业出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据- 价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。

目录

  • 前言xi
  • 第1部分起步
  • 第1章理论
  • 敏捷大数据
  • BigWords定义
  • 敏捷大数据团队
  • 认识机遇和问题
  • 敏捷大数据流程
  • 代码检查和结对编程
  • 敏捷的场所:开发的效率
  • 协作空间
  • 私人空间
  • 个人空间
  • 用大幅打印件明确表达想法
  • 第2章数据
  • 电子邮件
  • 处理原始数据
  • 原始的电子邮件
  • viii|目录
  • 结构化与半结构化数据
  • SQL
  • NoSQL
  • 序列化
  • 从演变的模式中抽取和展示特征
  • 数据流水线
  • 数据透视
  • 社交网络
  • 时间序列
  • 自然语言
  • 概率
  • 小结
  • 第3章敏捷开发工具
  • 可扩展性=简洁
  • 敏捷大数据处理
  • 设置运行Python的虚拟环境
  • 使用Avro对事件进行序列化
  • 在Python中使用Avro
  • 收集数据
  • 使用Pig处理数据
  • 安装Pig
  • 使用MongoDB发布数据
  • 安装MongoDB
  • 安装MongoDB的Java驱动程序
  • 安装mongo-hadoop
  • 用Pig向MongoDB推送数据
  • 使用ElasticSearch搜索数据
  • 安装
  • 使用Wonderdog整合ElasticSearch和Pig
  • 对工作流程的反思
  • 轻量级的Web应用
  • Python和Flask
  • 目录|ix
  • 展示数据
  • 安装Bootstrap
  • 启用Bootstrap
  • 使用d3js和nvd3js可视化数据
  • 小结
  • 第4章在云端
  • 引言
  • GitHub
  • dotCloud
  • dotCloudEcho服务
  • Python工作者服务
  • AmazonWebServices
  • SimpleStorageService
  • ElasticMapReduce
  • MongoDB即服务
  • 辅助工具(Instrumentation)
  • GoogleAnalytics
  • MortarData
  • 第2部分登上金字塔
  • 第5章收集和展示数据
  • 整合软件栈
  • 收集并序列化收件箱
  • 处理和发布邮件数据
  • 在浏览器中显示邮件
  • 用Flask和pymongo处理邮件数据
  • 使用Jinja2渲染HTML5页面
  • 敏捷检查点
  • 生成电子邮件清单
  • 用MongoDB显示邮件
  • 对数据展示的分析
  • x|目录
  • 搜索邮件
  • 使用Pig,ElasticSearch和Wonderdog构建索引
  • 在网页中搜索邮件数据
  • 结论
  • 第6章使用图表可视化数据
  • 优秀的图表
  • 抽取实体:邮件地址
  • 抽取邮件
  • 对时间进行可视化
  • 结论
  • 第7章利用报表探索数据
  • 为数据添加联系
  • 用TF-IDF从邮件中提取关键字
  • 小结
  • 第8章预测
  • 预测电子邮件的回复率
  • 个性化
  • 小结
  • 第9章驱动行动
  • 好邮件的属性
  • 使用朴素贝叶斯方法进行更好的预测
  • P(Reply|From∩To)
  • P(Reply|Token)
  • 实时预测
  • 记录事件日志
  • 小结
  • 索引

资源下载

资源下载地址1:https://pan.baidu.com/s/1iqj0UWysQsKEojiYlTEg6Q

相关资源

网友留言