《新媒体数据挖掘:基于R语言》是一本为计算传播学和计算社会科学领域读者量身打造的实用指南,书中不仅介绍了R语言的基础知识和开发环境,还深入探讨了如何利用R进行网络数据采集、文本挖掘、情感分析和社会网络分析等实际应用,通过清晰的讲解和丰富的案例,这本书帮助读者快速掌握R语言的核心技能,并将其应用于新媒体数据挖掘的各个场景,无论你是初学者还是有一定编程经验的研究人员,这本书都能为你提供系统的学习路径和实用的操作技巧。
《新媒体数据挖掘:基于R语言》是一本专注于计算传播学和数据挖掘领域的实用教材。书中详细介绍了R语言在新媒体数据分析中的应用,涵盖了从基础编程到高级数据挖掘技术的全面内容。无论是初学者还是有一定编程经验的研究人员,都能从中获得实用的技能和知识。
这本书的电子资源大小为86 MB,属于R语言类别,适合在多种设备上阅读和使用。电子资源包含了完整的书籍内容,方便读者随时查阅和学习。
内容精选
书中列出了大量可用于数据挖掘的R包和函数,这些工具在数据分析过程中非常实用。以下是一些主要内容:
聚类:常用的包包括fpc、cluster、pvclust、mclust等,涵盖了基于划分、层次、模型、密度等多种方法。
分类:常用的包有rpart、party、randomForest等,支持决策树、随机森林、回归分析等算法。
关联规则与频繁项集:arules包支持挖掘频繁项集和关联规则,APRIORI算法和ECLAT算法也有详细介绍。
时间序列:timsac包提供了时间序列构建和成分分解的功能。
统计:Base R和nlme包支持方差分析、假设检验、线性混合模型等统计方法。
图表:书中详细介绍了条形图、饼图、散点图、直方图等多种图表的绘制方法。
数据操作:缺失值处理、变量标准化、抽样等数据操作技巧也有详细讲解。
与Weka接口:RWeka包允许在R中使用Weka的所有算法,扩展了R的功能。
内容介绍
这本书系统讲解了R语言的基础知识和实战应用,适合计算传播学和计算社会科学领域的学生和研究人员使用。书中不仅介绍了R语言的基本组成,还通过实际案例展示了如何利用R进行网络数据采集、文本挖掘、情感分析和社会网络分析。
书中内容结构清晰,从基础知识到高级应用逐步展开,适合不同层次的读者学习。无论是作为教材还是自学书籍,这本书都能提供实用的指导和帮助。
目录
- 第1章 为什么学习R语言
- 第2章 R语言开发环境
- 第3章 R语言基础——数据
- 第4章 R语言基础——代码
- 第5章 R绘图——数据可视化呈现
- 第6章 网络数据程序化采集
- 第7章 文本挖掘和情感分析
- 第8章 社会网络分析
- 第9章 社交编程平台:GitHub
- 附录