当前位置:主页 > 计算机电子书 > > 大数据下载
解惑大数据

解惑大数据 PDF 超清版

  • 更新:2021-10-19
  • 大小:39.79MB
  • 类别:大数据
  • 作者:丁圣勇、樊勇兵、闵世武
  • 出版:人民邮电出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

解惑大数据

作者:丁圣勇,樊勇兵,闵世武 编著

出版时间:2013年版

《解惑大数据》是一本系统介绍大数据的技术普及读物,可帮助读者迅速了解大数据的概况。全书分为4章,共120个问题,内容涵盖大数据概念、大数据技术、大数据应用等各个方面。第1章为大数据概述篇,介绍了大数据的概念、技术特点及应用方向等;第2章为分布式平台篇,介绍了大数据的核心计算平台;第3章为分布式数据库篇,介绍大数据中广泛使用的分布式数据库;第4章为大数据与数据挖掘篇,介绍经典的数据挖掘算法以及大数据如何实现规模化和并行化处理。《解惑大数据》可作为对大数据技术感兴趣的读者以及工程技术人员、行业管理人员、大数据系统的设计开发人员的技术参考资料,也可以作为大学本科高年级学生和研究生相关课程的参考书。

目录

  • 第1章 大数据概述
  • Q1. 什么是大数据?
  • Q2. 大数据的规模如何?
  • Q3. 什么是大数据的多样化?
  • Q4. 什么是大数据的快速化?
  • Q5. 什么是大数据的价值化?
  • Q6. 大数据的起源是什么?
  • Q7. 大数据带来了哪些机遇?
  • Q8. 大数据带来了哪些挑战?
  • Q9. 什么是结构化数据?
  • Q10. 什么是非结构化数据?
  • Q11. 大数据的技术特点是什么?
  • Q12. 大数据有哪些处理模式?
  • Q13. 大数据的硬件架构有什么特点?
  • Q14. 大数据的软件架构有什么特点?
  • Q15. 大数据与云计算有什么关系?
  • Q16. 大数据适合哪些应用?
  • Q17. 零售行业如何应用大数据?
  • Q18. 金融行业如何应用大数据?
  • Q19. 交通行业如何应用大数据?
  • Q20. 互联网行业如何应用大数据?
  • Q21. 电信行业如何应用大数据?
  • 第2章 分布式平台
  • 2.1 分布式平台的基本概念
  • Q22. 什么是分布式平台?
  • Q23. 分布式平台的基本原理是什么?
  • Q24. 什么是分布式文件系统?
  • Q25. 什么是分布式计算?
  • 2.2 开源项目
  • 2.2.1 Hadoop
  • Q26. 什么是Hadoop?
  • Q27. Hadoop有哪些应用领域?
  • Q28. Hadoop的历史是什么?
  • Q29. Hadoop的优点是什么?
  • Q30. Hadoop和RDBMS的区别是什么?
  • Q31. Hadoop和高效能计算、网格计算的区别是什么?
  • Q32. Hadoop的发展现状如何?
  • Q33. Hadoop系统架构如何?
  • Q34. 什么是HDFS?
  • Q35. 什么是MapReduce?
  • 2.2.2 GraphLab
  • Q36. 什么是GraphLab?
  • Q37. GraphLab出现的背景是什么?
  • Q38. GraphLab和MapReduce的区别是什么?
  • Q39. GraphLab的优点是什么?
  • Q40. GraphLab的软件栈结构是怎样的?
  • Q41. GraphLab并行化的基本思想是什么?
  • Q42. GraphLab的数据模型是什么?
  • Q43. GraphLab程序的执行模型是什么?
  • Q44. GraphLab和Mahout的区别是什么?
  • Q45. GraphLab有哪些相关子项目?
  • 2.2.3 DPark
  • Q46. DPark是什么?
  • Q47. Spark是什么?
  • Q48. Spark和MapReduce的区别是什么?
  • Q49. DPark中有哪些基本概念?
  • Q50. DPark的计算模型是怎样的?
  • Q51. RDD的工作原理是什么?
  • Q52. RDD的容错机制是什么?
  • Q53. RDD内部的设计机制是什么?
  • Q54. DPark的任务调度机制是什么?
  • Q55. DPark共享变量的实现机制是怎样的?
  • Q56. DPark和Spark的性能比较如何?
  • Q57. DPark和Spark的区别是什么?
  • 2.2.4 Storm
  • Q58. Storm是什么?
  • Q59. Storm出现的背景是什么?
  • Q60. Storm有哪些应用领域?
  • Q61. Storm的设计特征是什么?
  • Q62. Storm中有哪些关键概念?
  • Q63. Storm集群中有哪些组件?
  • Q64. Storm如何高效地实现消息的可靠性?
  • Q65. Storm是如何实现容错的?
  • Q66. Storm有哪些缺点?
  • 第3章 分布式数据库
  • 3.1 分布式数据库的基本概念
  • Q67. 什么是分布式数据库?
  • Q68. 什么是关系型数据库?
  • Q69. 什么是NoSQL数据库?
  • Q70. 为什么需要分布式数据库?
  • Q71. 大数据时代分布式数据库的特征是什么?
  • Q72. 分布式数据库相对传统集中式数据库的优点有哪些?
  • Q73. 什么是CAP定理?
  • 3.2 开源项目
  • 3.2.1 HBase
  • Q74. HBase是什么?
  • Q75. HBase的定位是什么?
  • Q76. HBase的设计特征是什么?
  • Q77. HBase和传统数据库的区别是什么?
  • Q78. HBase的数据模型是什么?
  • Q79. 运行中的HBase有什么特点?
  • Q80. HBase的集群架构是怎样的?
  • Q81. HBase的存储架构是怎样的?
  • Q82. HBase和HDFS的关系是什么?
  • Q83. 如何在HBase上运行MapReduce?
  • Q84. HBase能否支持SQL?
  • Q85. HBase有哪些常用场景?
  • 3.2.2 Hive
  • Q86. 什么是Hive?
  • Q87. Hive的适用场景有哪些?
  • Q88. Hive的设计特征是什么?
  • Q89. Hive和RDBMS的区别是什么?
  • Q90. Hive的体系结构是怎样的?
  • Q91. Hive的元数据存储方案有哪些?
  • Q92. Hive的数据存储模型有哪些?
  • Q93. Hive和SQL的区别是什么?
  • Q94. 常见的HiveQL操作有哪些?
  • Q95. 什么是Hive的用户定义函数?
  • 3.2.3 MongoDB
  • Q96. 什么是MongoDB?
  • Q97. MongoDB的设计特征是什么?
  • Q98. MongoDB的设计哲学是什么?
  • Q99. MongoDB中有哪些基本概念?
  • Q100. MongoDB数据模型是怎样的?
  • Q101. MongoDB和SQL的区别是什么?
  • Q102. 如何进行MongoDB的CRUD操作?
  • Q103. MongoDB支持哪些数据库驱动?
  • Q104. MongoDB如何实现高可用?
  • Q105. MongoDB的分片机制是怎样的?
  • Q106. MongoDB有哪些适用场景?
  • 第4章 大数据与数据挖掘
  • Q107. 什么是数据挖掘?
  • Q108. 什么是机器学习?
  • Q109. 数据挖掘主要解决的问题有哪些?
  • Q110. 传统数据挖掘有哪些算法?
  • Q111. 什么是有监督学习?
  • Q112. 什么是无监督学习?
  • Q113. 什么是C4.5算法?
  • Q114. 什么是SVM?
  • Q115. 什么是贝叶斯算法?
  • Q116. 什么是K-Means算法?
  • Q117. 什么是EM算法?
  • Q118. 什么是Apriori算法?
  • Q119. 数据挖掘算法在电信行业如何应用?
  • Q120. 大数据时代如何进行数据挖掘?
  • ……
     

资源下载

资源下载地址1:https://pan.baidu.com/s/1r30X8jnBqTDXoBPDEClrrw

网友留言