当前位置:主页 > 计算机电子书 > 数据库 > 数据分析下载
社交网站的数据挖掘与分析

社交网站的数据挖掘与分析 PDF 完整第2版

  • 更新:2019-09-19
  • 大小:51.9 MB
  • 类别:数据分析
  • 作者:Mattbew、A.Russell,师蓉
  • 出版:机械工业出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

社交网站的数据挖掘与分析 PDF

社交平台统计数据好似掩埋地底的“铅锌矿”,怎样运用这种统计数据来发觉什么人正根据社交媒体媒体开展联络?她们已经讨论哪些?或是她们在哪里?这书第2版对上个版內容开展了全方位升级和修定,它将表明回应这种难题的方式 与方法。你将学得怎样获得、剖析和归纳撒落于社交平台(包含Facebook、Twitter、LinkedIn、Google+、 GitHub、电子邮件、网址和搏客等)的统计数据,及其怎样根据数据可视化寻找你一直都在社交媒体全球中找寻的內容与你闻所未闻的有效信息内容。

依靠IPython Notebook、自然语言工具包、NetworkX和别的科学计算专用工具发掘流行社交平台

应用高級文本挖掘技术性(如聚类算法和TF-IDF)来获取人们語言统计数据中有使用价值的专业知识

根据发觉GitHub人上人、计算机语言和编码工程项目间的亲密性,搭建兴趣爱好图普

运用D3.js开展互动式数据可视化,充分运用HTML5和JavaScript工具包的灵便特点

以“难题-解决方法-探讨”的方法详尽解读深入挖掘Twitter统计数据的实用技术,并出示编码实例

社交网站的数据挖掘与分析(原书第2版)》的配套设施编码在公布的GitHub编码比对库开展维护保养,能够根据一站式服务虚拟机来浏览,你只必须方便使用实用的IPython Notebook,就能进到开心的互动式学习培训场景。

目录

  • 《社交网站的数据挖掘与分析(原书第2版)》
  • 前言 1
  • 第一部分 社交网络导引
  • 序幕 13
  • 第1章 挖掘Twitter:探索热门话题、发现人们的谈论内容等 15
  • 1.1 概述 15
  • 1.2 Twitter风靡一时的原因 16
  • 1.3 探索Twitter API 18
  • 1.4 分析140字的推文 33
  • 1.5 本章小结 47
  • 1.6 推荐练习 48
  • 1.7 在线资源 48
  • 第2章 挖掘Facebook:分析粉丝页面、查看好友关系等 50
  • 2.1 概述 51
  • 2.2 探索Facebook的社交图谱API 51
  • 2.3 分析社交图谱联系 62
  • 2.4 本章小结 85
  • 2.5 推荐练习 86
  • 2.6 在线资源 86
  • 第3章 挖掘LinkedIn:分组职位、聚类同行等 88
  • 3.1 概述 89
  • 3.2 探索LinkedIn API 89
  • 3.3 数据聚类速成 94
  • 3.4 本章小结 124
  • 3.5 推荐练习 125
  • 3.6 在线资源 126
  • 第4章 挖掘Google+:计算文档相似度、提取搭配等 127
  • 4.1 概述 128
  • 4.2 探索Google+ API 128
  • 4.3 TF-IDF简介 138
  • 4.4 用TF-IDF查询人类语言数据 145
  • 4.5 本章小结 164
  • 4.6 推荐练习 165
  • 4.7 在线资源 165
  • 第5章 挖掘网页:使用自然语言处理理解人类语言、总结博客内容等 167
  • 5.1 概述 168
  • 5.2 抓取、解析、爬取网页 168
  • 5.3 通过解码语法来探索语义 174
  • 5.4 以实体为中心的分析:范式转换 192
  • 5.5 人类语言数据处理分析的质量 200
  • 5.6 本章小结 203
  • 5.7 推荐练习 203
  • 5.8 在线资源 204
  • 第6章 挖掘邮箱:分析谁和谁说什么以及说的频率等 206
  • 6.1 概述 207
  • 6.2 获取和处理邮件语料库 207
  • 6.3 分析Enron语料库 225
  • 6.4 探索和可视化时序趋势 241
  • 6.5 分析你自己的邮件数据 244
  • 6.6 本章小结 250
  • 6.7 推荐练习 251
  • 6.8 在线资源 251
  • 第7章 挖掘GitHub:检查软件协同习惯、构建兴趣图谱等 253
  • 7.1 概述 254
  • 7.2 探索GitHub的API 254
  • 7.3 使用属性图为数据建模 260
  • 7.4 分析GitHub兴趣图谱 264
  • 7.5 本章小结 286
  • 7.6 推荐练习 287
  • 7.7 在线资源 287
  • 第8章 挖掘带标记语义网:提取微格式、推断资源描述框架等 289
  • 8.1 概述 290
  • 8.2 微格式:易于实现的元数据 290
  • 8.3 从语义标记过渡到语义网:一个小插曲 304
  • 8.4 语义网:发展中的变革 304
  • 8.5 本章小结 310
  • 8.6 推荐的练习 311
  • 8.7 在线资源 311
  • 第二部分 Twitter实用指南
  • 第9章 Twitter实用指南 317
  • 9.1 访问Twitter的API(开发目的) 318
  • 9.2 使用OAuth访问Twitter的API(产品目的) 319
  • 9.3 探索流行话题 323
  • 9.4 查找推文 324
  • 9.5 构造方便的函数调用 325
  • 9.6 使用文本文件存储JSON数据 326
  • 9.7 使用MongoDB存储和访问JSON数据 327
  • 9.8 使用信息流API对Twitter数据管道抽样 329
  • 9.9 采集时序数据 330
  • 9.10 提取推文实体 332
  • 9.11 特定的推文范围内查找最流行的推文 333
  • 9.12 特定的推文范围内查找最流行的推文实体 335
  • 9.13 对频率分析制表 336
  • 9.14 查找转推了状态的用户 337
  • 9.15 提取转推的属性 339
  • 9.16 创建健壮的Twitter请求 340
  • 9.17 获取用户个人资料信息 343
  • 9.18 从任意的文本中提取推文实体 344
  • 9.19 获得用户所有的好友和关注者 345
  • 9.20 分析用户的好友和关注者 347
  • 9.21 获取用户的推文 348
  • 9.22 爬取好友关系图 350
  • 9.23 分析推文内容 351
  • 9.24 提取链接目标摘要 353
  • 9.25 分析用户收藏的推文 356
  • 9.26 本章小结 357
  • 9.27 推荐练习 358

9.28 在线资源 359
第三部分 附录
附录A 关于本书虚拟机体验的信息 363
附录B OAuth入门 364
附录C Python和IPython Notebook的使用技巧 368

资源下载

资源下载地址1:https://pan.baidu.com/s/1JDQa54yYxeVjLYT457ICDw

相关资源

网友留言