当前位置:主页 > 计算机电子书 > 数据库 > 大数据下载
大数据架构商业之路:从业务需求到技术方案

大数据架构商业之路:从业务需求到技术方案 PDF 高清版

  • 更新:2020-05-22
  • 大小:74.9 MB
  • 类别:大数据
  • 作者:黄申
  • 出版:机械工业出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

现阶段大数据技术性早已逐步完善,可是业内发觉与大数据有关的设计产品和产品研发依然十分艰难,技术性、商品和商业服务的融合度还远远不够。这关键是由于大数据涉及到覆盖面广、科技含量高、升级换代快,门坎也比别的大部分IT制造行业更高。大家要不应用价格昂贵的商业服务解决方法,要不花销极大的精力探求。这书根据一个虚似的互联网技术O2O创业历程,来逐渐进行详细介绍自主创业每个环节将会碰到的大数据课题研究、业务流程要求,及其相对性应的技术规范,乃至是实践活动分析;让读者亲临其境,一起来探索大数据的秘密。书里会遮盖较普遍的技术性点,并出示相对的情况专业知识详细介绍,针对想进一步深入分析关键点的读者,也可轻轻松松得到继续阅读的方位和规范性提议。

目录

  • 推荐序一
  • 推荐序二
  • 前  言
  • 第1章 抉择 1
  • 第2章 数据收集 4
  • 2.1 互联网数据收集 4
  • 2.1.1 网络爬虫 5
  • 2.1.2 Apache Nutch简介 11
  • 2.1.3 Heritrix简介 14
  • 2.2 内部数据收集 15
  • 2.2.1 Apache Flume简介 17
  • 2.2.2 Facebook Scribe和Logstash 21
  • 2.3 本章心得 21
  • 2.4 参考资料 22
  • 第3章 数据存储 23
  • 3.1 持久化存储 23
  • 3.1.1 Hadoop和HDFS 25
  • 3.1.2 HBase简介 28
  • 3.1.3 MongoDB 35
  • 3.2 非持久化存储 37
  • 3.2.1 缓存和散列 37
  • 3.2.2 Memcached和Berkeley DB简介 41
  • 3.2.3 Redis简介 41
  • 3.3 本章心得 44
  • 3.4 参考资料 44
  • 第4章 数据处理 46
  • 4.1 离线批量处理 46
  • 4.1.1 Hadoop的MapReduce 47
  • 4.1.2 Spark简介 52
  • 4.1.3 Hive简介 53
  • 4.1.4 Pig、Impala和Spark SQL 56
  • 4.2 提升及时性:消息机制 58
  • 4.2.1 ActiveMQ简介 60
  • 4.2.2 Kafka简介 61
  • 4.3 在线实时处理 63
  • 4.3.1 Storm简介 63
  • 4.3.2 Spark Streaming简介 66
  • 4.4 本章心得 66
  • 4.5 参考资料 67
  • 第5章 信息检索 69
  • 5.1 基本理念 70
  • 5.2 相关性 70
  • 5.2.1 布尔模型 70
  • 5.2.2 基于排序的布尔模型 71
  • 5.2.3 向量空间模型 74
  • 5.2.4 语言模型 75
  • 5.3 及时性 77
  • 5.4 与数据库查询的对比 81
  • 5.5 搜索引擎 82
  • 5.5.1 Web搜索中的链接分析 83
  • 5.5.2 电子商务中的商品排序 86
  • 5.5.3 多因素和基于学习的排序 88
  • 5.5.4 系统框架 89
  • 5.5.5 Lucene简介 93
  • 5.5.6 Solr简介 98
  • 5.5.7 Elasticsearch简介 104
  • 5.6 推荐系统 108
  • 5.6.1 推荐的核心要素 109
  • 5.6.2 推荐系统的分类 110
  • 5.6.3 混合模型 115
  • 5.6.4 系统架构 116
  • 5.6.5 Mahout 116
  • 5.7 在线广告 119
  • 5.8 本章心得 127
  • 5.9 参考资料 128
  • 第6章 数据挖掘 130
  • 6.1 基本理念 131
  • 6.2 数据的表示和预处理 133
  • 6.3 机器学习算法 136
  • 6.4 挖掘工具 157
  • 6.5 本章心得 165
  • 6.6 参考资料 165
  • 第7章 效能评估 167
  • 7.1 效果评估 168
  • 7.2 性能评估 190
  • 7.3 本章心得 202
  • 7.4 参考资料 202
  • 第8章 大数据技术全景 204
  • 第9章 商品太多啦!需要搜索引擎 207
  • 9.1 业务需求 207
  • 9.2 产品设计和技术选型 208
  • 9.3 实现方案 211
  • 第10章 能否更主动?还需要推荐引擎 223
  • 10.1 业务需求 223
  • 10.2 产品设计和技术选型 225
  • 10.3 实现方案 230
  • 第11章 这样做的效果如何 241
  • 11.1 业务需求 241
  • 11.2 产品设计和技术选型 242
  • 11.3 实现方案 243
  • 第12章 这个搜索有点逊 258
  • 12.1 业务需求:还要搜得更多 258
  • 12.2 “还要搜得更多”:产品设计和技术选型 259
  • 12.3 “还要搜得更多”的方案实现 261
  • 12.4 业务需求:还要搜得更准 265
  • 12.5 “还要搜得更准”:产品设计和技术选型 266
  • 12.6 “还要搜得更准”的方案实现 271
  • 12.7 业务需求:还要更快 273
  • 12.8 还要“变”得更快:产品设计和技术选型 274
  • 12.9 还要“搜”得更快:产品设计和技术选型 275
  • 12.10 业务需求:给点提示吧 280
  • 12.11 给点提示吧:产品设计和技术选型 282
  • 第13章 支持更高效的运营 287
  • 13.1 业务需求:互联网时代的CRM 287
  • 13.2 互联网时代的CRM:产品设计和技术选型 288
  • 13.3 业务需求:抓住捣蛋鬼 291
  • 13.4 抓住捣蛋鬼:产品设计和技术选型 292
  • 13.5 业务需求:销售之战 295
  • 13.6 销售之战:产品设计和技术选型 296
  • 后记 299

资源下载

资源下载地址1:https://pan.baidu.com/s/1RxfxUg05EY9H6rl309yYYw

相关资源

网友留言