当前位置:主页 > 计算机电子书 > 大数据分析 > 数据挖掘下载
大嘴巴漫谈数据挖掘:第2季产品篇

大嘴巴漫谈数据挖掘:第2季产品篇 PDF 高清完整版

  • 更新:2023-07-25
  • 大小:34.1 MB
  • 类别:数据挖掘
  • 作者:易向军
  • 出版:电子工业出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

《大嘴巴漫谈数据挖掘:第2季产品篇》是一本系统而全面地描述数据挖掘基本概念和常用算法的书籍。作者以大嘴巴的幽默漫谈方式,生动有趣地介绍了数据挖掘的核心技能。无论是产品的每一阶段,作者都细致地指出了数据挖掘过程中需要避免的坑,并给出了宝贵的建议。对于想要系统学习数据挖掘知识的人来说,这本书是一本不可或缺的参考资料。

大嘴巴漫谈数据挖掘:第2季产品篇

大嘴巴漫谈数据挖掘:第2季产品篇 电子书封面

读者评价

一本不错的关于数据挖掘的入门书,从简单的基础到精通都涉及到了,适合对数据挖掘有兴趣的读者们

内容介绍

《大嘴巴漫谈数据挖掘》系统而全面地描述了数据挖掘的基本概念、常用算法等。《大嘴巴漫谈数据挖掘(第2季产品篇)》是《大嘴巴漫谈数据挖掘》的姊妹篇,在前作的基础上,它以产品为核心,按照产品发展的过程,依次详细分析产品策略研究期、产品概念评估期、产品研发期、产品测试期、产品导入期、产品发展期、产品成熟期、产品衰退期这8个产品发展的必经阶段所必须做的数据挖掘工作。针对产品每一阶段的不同特点,作者分享了数据挖掘的核心技能,并指出了每一阶段数据挖掘需要避免的坑。

《大嘴巴漫谈数据挖掘(第2季产品篇)》适合想从事数据挖掘方面工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。

内容节选

数据挖掘基本任务:分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。
DM过程:
a目标定义(任务理解、指标确定)
b数据采集(建模抽样、质量把控、实时采集)
c数据整理(数据探索、数据清洗、数据变换)
d构建模型(模式发现、构建模型、验证模型)
e模型评价(设定评价标准、多模型对比、模型优化)
f模型发布(模型部署、模型重构)
十大DM算法:
在香港举办的2006年度IEEE数据挖掘国际会议ICDM上,与会专家遴选出了十个最有影响力的数据挖掘算法:C4.5、k-means、SVM、Apriori、EM、PageRank、AdaBoost、KNN、NaïveBayes和CART。
1、k-means
k-means算法是一种常用的非监督学习聚类算法,它的作用是在我们不知道有哪些类别的情况下,将数据以K个类心,聚成K个聚类。通常我们会先确定一个相异度度量方法,常用的相异度有:欧式距离、曼哈顿距离、马氏距离、余弦距离等。根据两个数据间的“距离”来确定两个数据之间的相异度。
k-means算法:
a 所有数据中取K个数据(可随机,也可选定)作为K个聚类的初始类心。
b 遍历所有数据,计算他们到K个类心的“距离”,并将其归类到对应“距离”最小的那个类心所在的聚类中。
c 根据聚类结果,重新计算K个聚类各自的中心,计算方法是取聚类中所有元素各自维度的算术平均数。
d 若新的类心与之前的类心不同,则重复b、c步骤,直到聚类结果不再变化。
e 将结果输出。

目录

  • 0 引言 / 3
  • 0 引言:产品运营靠分析 / 4
  • 0 引言:设计商用八时期 / 6
  • 0 引言:定性定量双途径 / 8
  • 0 引言:数据来源主客观 / 9
  • 0 引言:分析方法全周期 / 10
  • 0 引言:途径来源成体系 / 12
  • 0 引言:用户视角来设计 / 13
  • 0 引言:取长补短建优势 / 14
  • 1 产品策略研究期 / 15
  • 1 产品策略研究期:策略研究找趋势 / 16
  • 1 产品策略研究期:目标用户要细分 / 17
  • 1 产品策略研究期:定性研究划小组 / 18
  • 1 产品策略研究期:样本条件配用户 / 20
  • 1 产品策略研究期:座谈讨论辨特征 / 21
  • 1 产品策略研究期:研究用户挖供需 / 23
  • 1 产品策略研究期:街头面访寻偏好 / 24
  • 2 产品概念评估期 / 34
  • 2 产品概念评估期:需求概念生产品 / 35
  • 2 产品概念评估期:开展工作挖需求 / 37
  • 2 产品概念评估期:定性研究定类型 / 38
  • 2 产品概念评估期:定量分析筛需求 / 43
  • 2 产品概念评估期:概念测试主客观 / 48
  • 2 产品概念评估期:产品概念细描述 / 49
  • 2 产品概念评估期:小组座谈评概念 / 51
  • 2 产品概念评估期:电话访问测指标 / 54
  • 3 产品研发期 / 59
  • 3 产品研发期:产品研发生原型 / 60
  • 3 产品研发期:参与设计供方案 / 61
  • 3 产品研发期:卡片分类排架构 / 62
  • 3 产品研发期:专家评审找问题 / 74
  • 4 产品测试期 / 76
  • 4 产品测试期:产品商用需测试 / 77
  • 4 产品测试期:可用测试验原型 / 78
  • 4 产品测试期:设备搭建助协调 / 79
  • 4 产品测试期:制定计划做准备 / 80
  • 4 产品测试期:测试完成出报告 / 83
  • 4 产品测试期:实例描述全过程 / 84
  • 4 产品测试期:用户招募选样本 / 85
  • 4 产品测试期:用户情况做统计 / 87
  • 4 产品测试期:任务操作有情境 / 88
  • 4 产品测试期:发现问题给建议 / 89
  • 4 产品测试期:结果分析看指标 / 90
  • 4 产品测试期:试用产品商用前 / 96
  • 4 产品测试期:定性研究分用户 / 98
  • 4 产品测试期:焦点小组谈反馈 / 99
  • 4 产品测试期:研究结果论问题 / 102
  • 4 产品测试期:深入评价靠定量 / 105
  • 4 产品测试期:样本甄别有条件 / 107
  • 4 产品测试期:问卷测试评分项 / 109
  • 5 产品导入期 / 119
  • 5 产品导入期:产品运营重精确 / 120
  • 5 产品导入期:精细运营多角色 / 121
  • 5 产品导入期:用户画像成特征 / 122
  • 5 产品导入期:产品导入先认知 / 123
  • 5 产品导入期:研究内容定策略 / 125
  • 5 产品导入期:内外方面有不同 / 126
  • 5 产品导入期:外部调研看态度 / 127
  • 5 产品导入期:主观客观双结合 / 128
  • 5 产品导入期:定性研究先抽样 / 129
  • 5 产品导入期:焦点小组谈问题 / 130
  • 5 产品导入期:小组座谈出成果 / 133
  • 5 产品导入期:定量分析助定性 / 134
  • 5 产品导入期:电话访问依问卷 / 136
  • 5 产品导入期:分析结果有展示 / 137
  • 5 产品导入期:内部数据识用户 / 141
  • 5 产品导入期:维度角度辨特征 / 142
  • 5 产品导入期:环比同比看趋势 / 144
  • 5 产品导入期:定位目标找用户 / 147
  • 5 产品导入期:数据挖掘来辅助 / 148
  • 5 产品导入期:数据理解选变量 / 149
  • 5 产品导入期:预先处理验数据 / 151
  • 5 产品导入期:分类筛选决策树 / 153
  • 6 产品发展期157
  • 6 产品发展期:产品发展有关联 / 158
  • 6 产品发展期:用户产品藏联系 / 159
  • 6 产品发展期:研究产品抽样本 / 160
  • 6 产品发展期:数据校验剔冗余 / 160
  • 6 产品发展期:关联规则建模型 / 162
  • 6 产品发展期:关键指标评效果 / 164
  • 6 产品发展期:模型输出生规则 / 166
  • 6 产品发展期:结果展示网状图 / 167
  • 6 产品发展期:分析用户找关系 / 169
  • 6 产品发展期:数据采集建模型 / 170
  • 6 产品发展期:借助决策树结构 / 171
  • 6 产品发展期:从根到叶是规则 / 172
  • 7 产品成熟期 / 173
  • 7 产品成熟期:产品成熟重差异 / 174
  • 7 产品成熟期:差异运营聚用户 / 175
  • 7 产品成熟期:因子分析打前站 / 176
  • 7 产品成熟期:聚类分析后安排 / 181
  • 7 产品成熟期:细分群组有特征 / 184
  • 7 产品成熟期:用户体验不可缺 / 187
  • 7 产品成熟期:监测产品助运营 / 188
  • 7 产品成熟期:定性研究建指标 / 190
  • 7 产品成熟期:指标体系全涵盖 / 193
  • 7 产品成熟期:定量评测体验度 / 197
  • 7 产品成熟期:结构方程生模型 / 201
  • 7 产品成熟期:输出权重和得分 / 203
  • 7 产品成熟期:应用推广助运营 / 204
  • 7 产品成熟期:发现短板定优先 / 205
  • 8 产品衰退期 / 208
  • 8 产品衰退期:产品衰退用户离 / 209
  • 8 产品衰退期:主动被动分流失 / 210
  • 8 产品衰退期:定性定量来剖析 / 211
  • 8 产品衰退期:焦点研究分小组 / 212
  • 8 产品衰退期:座谈聚焦找原因 / 215
  • 8 产品衰退期:定量分析建模型 / 216
  • 8 产品衰退期:输入输出选指标 / 217
  • 8 产品衰退期:抽取数据按条件 / 220
  • 8 产品衰退期:逻辑回归估流失 / 221
  • 8 产品衰退期:基于业务验效果 / 222

资源下载

资源下载地址1:https://pan.baidu.com/s/1r525iam5q0VgVcTcD1Iqig

相关资源

网友留言

网友NO.44372
宦旭尧

在数据挖掘领域,的确是一小撮人在看一大堆人在裸奔,而那一小撮人都在互相看对方裸奔,所以,将来物物互联的社会,这个必定是一个趋势也必将会成为现实。数据挖掘兴起于上世纪90年代,首先做的是沃尔玛,慢慢的被挖掘发现,成为了一门兴盛的学科。正是由于该学科的产生以及要解决问题的特殊性,数据挖掘不仅仅要求的是技术,还要有一定的领域知识。首先认清楚一个领域存在的问题,其次如何将这个问题进行描述,再进一步如何将其描述成数学问题,接着是否可以有一定的数据供你研究,并根据数据集问题构建一定的模型,最后是能否真正的解决该问题。这就是数据挖掘的基本流程。所以,数据挖掘不仅仅是一门科学,而且是一种指导解决问题的思路。目前流行的而且最稀缺的是跨界人才,跨界就等于价值。上述流程里面就可以清楚的看到,面对一个问题,技术仅仅是解决问题的手段,而真正需要的是如何对问题进行描述。 现在大致说一下数据挖掘的基本方法,面对一个完全陌生的数据,要去了解它,熟悉它的属性,知道它的内涵,明白它的分布,质量怎么样等等,然后在以上基础上,需要做一些特征工程,如特征提取,主成分分析,聚类等等,再接着就是对其进行数据的选择,就是选择和主体最相关的数据,我们不能拿肺结核的数据来分析心脏病,数据要有针对性,特定问题需要特定的数据进行支撑,虽然有时候,面对一个完全陌生的数据,我们无法判断哪些数据和我们真正的相关,那么就只能构建一些能够有效的或者比较松弛的模型,来容忍这些和主题不相关的噪声点。最后就是针对已有的问题以及处理好的数据进行模型构建,验证并解决模型。 以上是数据挖掘过程中的一般流程,但是一般特定问题特定分析,熊老师一直在强调不要一上来就去套模型,先分析问题,这也是以前自己犯的错误,面对问题不要一味的追求模型的复杂性,要用的合理,合理就是做好的。 接下来是对大数据下的预测模型,以前对预测类的问题理解不是很清楚,这次借着熊老师的思想,大概有一个比较成熟的思想,但是也是比较基本的,所有预测类问题可以由以下式子说明:a+h*b 其中a是基于大量数据的基本事实,即历史数据,历史的数据量越大,其值就越稳定,而b则是即时事件,也就是突发情况,具有多样性、复杂性以及即时性等,这往往和具体的环境因素有关,而h则是参数,要把预测做好,最重要的就是解决b,如何在历史数据的情况下,对b有一个更全面的认识,但是a也是非常重要的。以前对预测的理解是,在大量的历史数据里面,寻找数据的特征,也即找到最合适的a,却没有考虑到当前的突发情况b,这样的预测,往往没有很好地普适性,因此,对显示即时事件的建模,也是非常重要的,当然也是很难的。 当然,今天的收获还有很多,人生就是数据挖掘,生活中的方方面面都牵扯到数据挖掘,如果找到很好的方法,也许对自己的生活会有一个新的认识。