当前位置:主页 > 计算机电子书 > 数据库 > 数据结构下载
纵观大数据建模、分析及应用

纵观大数据建模、分析及应用 PDF 完整高清版

  • 更新:2023-08-01
  • 大小:38.1 MB
  • 类别:数据结构
  • 作者:牛琨
  • 出版:北京邮电大学出版社有限
  • 格式:PDF

  • 资源介绍
  • 相关推荐

这本PDF电子书以大数据分析和大数据建模为核心,全面介绍了纵观大数据建模、分析及应用的全过程。书中理论和实践相结合,帮助读者深入了解大数据的流程并应用于实际场景。内容完整且高清,提供了全面的视角,让读者对纵观大数据的概念有更清晰的认识。无论是对大数据分析还是大数据建模感兴趣的读者,本书都将为他们提供有价值的知识和实践指导。

纵观大数据建模、分析及应用

纵观大数据建模、分析及应用 电子书封面

内容节选

提取原始数据
我们首先提取了这个品牌手机的电商旗舰平台及线下门店的用户历史交易数据,作为原始数据,去做一些清洗和预处理。然后提取了用户的行为特征,去识别这个终端消费用户的购买频次,消费的品类,价格承受度等。然后运用协同过滤模型,去做度量这个新品手机和其他品类的相似性。

当然,我们也使用了其他的模型预测,例如购买概率的预测,产品生命周期的推测等等。之后,去建立用户特征的过滤,最后锁定目标的人群,输出目标群体的营销列表,找到整个老用户群体里有可能去购买新品手机的用户群体,并做了基于购买概率的排序。对于新品手机的微博营销方案,首先我们爬取了在新浪微博上行业相关的微博,通过关键词提取了所有博文的内容,包括评论内容、转发内容、用户信息等。

构建模型
进一步我们构建了三个模型,筛选出来用于微博营销新品手机的潜在目标用户。这三个模型分别是通过构建影响力指数模型去找到具有行业话语权的行业公众号、通过社会网络模型识别微博中的意见领袖,以及通过语义分析模型找到想买手机的人群,从而实施新品手机广告的转发和推荐。下面我具体介绍一下这三个模型:

1、做微博公众号影响力指数的编制

首先我们做了微博公众号影响力指数的编制。基于这个分类下的蓝V用户的微博影响力数据,综合利用AHP方法计算出不同行业在微博平台影响力的指标,然后我们找到这些最具有影响力的微博公众号或者蓝V的用户去做新品手机广告的触达。第二是运用社会网络模型去找到这款手机的意见领袖。

社会网络分析模型广泛地运用在这种具有网络特征的大数据分析中,例如通过计算节点的连接数去找到一个社交群体中的意见领袖和活跃分子等。

2、微博中意见领袖带动关注

同时SNA模型还可以用来计算社交网络的密度,监控这个网络的健康度等,目前在舆情监控领域、电信网络的数据分析等都有比较广泛的应用。我们利用SNA模型,去找到微博中和手机相关的意见领袖,进行新品手机营销文章的推送,引发这个意见领袖的关注和讨论,从而带动大多数跟随者对某品牌新品手机的一个关注,这是第二个模型。

3、文本挖掘

在文本挖掘模型中,我们首先建立了一系列的规则,例如在微博正文中含有“想买手机”、“挑选手机”等关键词的微博,我们针对规则对抓取的博文进行了标注和过滤,经过SVM分类模型的训练,我们把微博进行分类,最后筛选出可能会对某品牌手机感兴趣,或者近期有购买手机意愿的人群,由营销人员进行触达,推广这个新品的手机。

内容介绍

大数据分析是个入门容易但精专颇难的领域。牛琨著的《纵观大数据(建模分析及应用)》以大数据分析为主线,以电信行业应用为背景,以一线操作者为对象,系统阐述了大数据分析的理论、方法和实践。

从思维创新开始,依次介绍了大数据挖掘、经营分析 和营销策划三个主题。本书聚合了作者多年实战操作的经验,加上执教和内训的总结,辅以真实的案例, 对于电信行业的分析师而言是一部较为实用的工具类 书籍。

目录

  • Big Date Overview
  • 第一章 思维能力特训
  • 第一节 大脑如何转弯
  • 第二节 智慧之匙
  • 第三节 人人皆可创新
  • 第四节 阻碍创新的因素
  • 第五节 创新的习惯
  • 第六节 小测试:学到了多少?
  • 第二章 数据分析导论
  • 第一节 数据分析:从狭义到广义
  • 第二节 数据的层次
  • 第三节 初级的数据层
  • 第四节 中级的统计层
  • 第五节 高级的模型层
  • 第三章 数统计分析:可敬的老前辈
  • 第一节 从统计分析到数据挖掘
  • 第二节 统计分析的辉煌时代
  • 第三节 统计分析的无可奈何
  • 第四节 统计分析的未来
  • 第四章 Excel:数据基础管理
  • 第一节 新功能怎么用
  • 第二节 几个大招
  • 第三节 函数
  • 第四节 Excel操作技巧
  • 第五节 SmartArt
  • 第五章 SPSS:处理大数据
  • 第一节 基本功能介绍
  • 第二节 文件操作
  • 第三节 统计功能
  • 第四节 分析功能
  • 第六章 数据预处理:不可承受之重
  • 第一节 数据预处理做什么
  • 第二节 数据清洗
  • 第三节 数据集成
  • 第四节 数据转换
  • 第五节 数据归约
  • 第六节 数据离散化
  • 第七章 建模:数据挖掘的本义
  • 第一节 数据挖掘的过去和未来
  • 第二节 数据挖掘的标准流程
  • 第三节 主要模型介绍
  • 第四节 回归:最似然估计
  • 第五节 聚类:回归本质
  • 第六节 分类:与预测不同
  • 第七节 关联规则:焕发活力
  • 第八节 过拟合与适用性:平衡精确与健壮
  • 第八章 SAP Predictive Analytics:简单为王
  • 第一节 基本功能介绍
  • 第二节 聚类模型
  • 第三节 分类模型
  • 第四节 关联规则模型
  • 第九章 概论:经营分析的常见错误
  • 第一节 典型错误
  • 第二节 经营分析的概念和内涵
  • 第三节 经营分析的能力要求
  • 第四节 互联网时代的经营分析
  • 第十章 质的分析:定性分析方法
  • 第一节 观察法
  • 第二节 访谈法
  • 第三节 CATI:市场调研利器
  • 第四节 焦点小组座谈会
  • 第五节 案例分析法
  • 第十一章 量的分析:定量分析方法
  • 第一节 比较分析法
  • 第二节 因素分析法
  • 第三节 分组分析法
  • 第四节 异常分析法
  • 第五节 结构分析法
  • 第十二章 主题分析:每个月的那几天
  • 第一节 主题分析的概念
  • 第二节 主题分析的组织方式
  • 第三节 主题分析的关键点
  • 第十三章 主题分析模板:简单的灵魂
  • 第一节 模板框架设计
  • 第二节 双表展示结构
  • 第三节 汇总表、过程表与月份表
  • 第四节 公式逻辑与细节调整
  • 第十四章 专题分析:价值所在
  • 第一节 专题分析的概念
  • 第二节 专题分析思路
  • 第三节 数据提取与处理
  • 第四节 数据分析与展示
  • 第十五章 专题分析案例:事实说话
  • 第一节 价值背离模型:用户流失之源
  • 第二节 移动业务融合比例分析
  • 第三节 行业发展预测模型
  • 第四节 业务发展预测模型
  • 第五节 业务规模预测模型
  • 第十六章 概论:营销策划的日常
  • 第一节 营销策划的概念
  • 第二节 营销策划技术演进
  • 第三节 互联网 时代的营销策划
  • 第十七章 管理咨询模型:必备武器库
  • 第一节 STP模型
  • 第二节 SWOT 模型
  • 第三节 BCG矩阵
  • 第四节 波特五力分析
  • 第五节 基尼系数
  • 第六节 兰彻斯特模型
  • 第十八章 方法论:不是仅靠经验
  • 第一节 概论
  • 第二节 市场分析
  • 第三节 套餐设计
  • 第四节 营销准备
  • 第五节 后评估
  • 第六节 套餐优化
  • 第十九章 营销策划案例:经典的背后
  • 第一节 移动业务套餐
  • 第二节 家庭客户套餐
  • 第三节 集团客户套餐
  • 第二十章 互联网化趋势:无娱乐不营销
  • 第一节 粉丝经济学
  • 第二节 互联网思维
  • 第三节 炒作营销
  • 第四节 跨界营销
  • 第五节 事件营销

资源下载

资源下载地址1:https://pan.baidu.com/s/11BAKI52yAhvUZxH33HV0jQ

相关资源

网友留言

网友NO.35146
马皎洁

第一、好数据胜过复杂的模型 不用去太刻意追求模型的复杂度,往往线性回归和逻辑回归就能解释大部分的问题了。我深深记得当年在学校时,一位计量经济学教授说过的话:如果你不知道该用简单模型还是复杂模型,为什么不从简单的开始呢? 第二、要做好充分的数据预处理 做好数据的清洗、融合、集成、规约等,去了解业务,理解数据,切忌Garbage In,Garbage Out。所谓磨刀不误砍柴工,如果数据预处理准备的充分,接下来的数据挖掘也会非常地流畅。反之,如果没有做充分的数据预处理和描述性分析,就会对建模的结果产生怀疑,进而返工,浪费更多的时间。 第三,组建大数据建模团队 我们认为需要大数据建模分析去解决业务问题的企业应该组建一个功能比较全面的数据科学团队。我们之前也讲过,在大数据时代,建模已经演化成一个体系问题,基本不能由一个人来承担了,或者说,一个人需要掌握太多种技能才能应付整个建模流程。通常来说数据科学团队里会有大数据提取工程师、建模算法工程师、数据可视化工程师、业务数据分析师、优化工程师等,是一个集团军作业、流水线作业的情况,而不是像小数据时代,通过一个人就能解决从数据的提取、加工、建模,到最后数据的分析结果展示这一系列的问题了。

网友NO.39342
邰巧风

2011年,麦肯锡在题为《海量数据,创新、竞争和提高生成率的下一个新领域》的研究报告中首次提出大数据的概念。报告认为数据已经渗透到每一个行业和业务职能领域,数据中蕴含着巨大的价值,这些价值将导致数据成为重要的生产因素。2012年《纽约时报》的一篇专栏中写到,“大数据”时代已经降临,在商业、经济及其他领域中,最终决策将日益基于数据和分析而作出,而并非基于经验和直觉。2012年3月,美国奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署。美国政府认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志,对未来的科技与经济发展必将带来深远影响。 进入21世纪,互联网的兴起促成了数据量的大规模增长。互联网时代,几乎全民都在制造数据,与此同时,数据的形成也极其丰富。一方面,既有社交网络、多媒体、协同创造、虚拟服务等应用所主动产生的数据;另一方面,又有搜索引擎、网页浏览过程中被记录、被收集的数据。该阶段数据的特点是用户原创、主动、交互。