《Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》集中化探讨Web统计数据自动剖析的关键技术——Web统计数据自动获得、特点提取、表述模型及Web发掘等有关基础理论和方式,在这个基础上,剖析了几类典型性的Web数据分析要求,明确提出并详细介绍了具备目的性的解决方案及方式。关键解决方案包含:根据Web公共性舆论自动剖析及预警信息计划方案、根据词义的Web信息内容自动聚合物方式、多源电子商务大数据挖掘等。
《Web数据分析关键技术及解决方案/“十三五”科学技术专著丛书》选择当今Web数据分析的热点话题,小结了实际上学科建设的科研成果,基础理论与实际上实例紧密结合,合适高等院校电子信息技术、电脑等有关技术专业的老师、学员及科学研究工作人员阅读文章。
目录
- 章 Web大数据挖掘概述
- 1.1 大数据与网络大数据
- 1.2 Web大数据应用及特点
- 1.2.1 Web大数据
- 1.2.2 Web大数据特点
- 1.3 Web挖掘及Web挖掘类型
- 1.3.1 Web挖掘及Web挖掘类型
- 1.3.2 Web内容挖掘
- 1.3.3 Web结构挖掘
- 1.3.4 Web使用挖掘
- 1.4 Web挖掘过程
- 1.4.1 Web内容挖掘过程
- 1.4.2 Web结构挖掘过程
- 1.4.3 Web使用挖掘过程
- 参考文献
- 第2章 Web数据挖掘基础
- 2.1 Web信息程序获取方式
- 2.1.1 网络爬虫
- 2.1.2 其他Web信息程序获取方式
- 2.2 Web信息数据抽取
- 2.2.1 Web网页信息抽取
- 2.2.2 自然语言文本结构化信息抽取
- 2.3 Web信息文本模型的文本特征表示
- 2.3.1 文本模型与文本特征
- 2.3.2 VSM向量空间模型
- 2.3.3 布尔模型
- 2.3.4 概率主题模型
- 2.4 模式发现常用方法
- 2.4.1 统计分析
- 2.4.2 关联分析
- 2.4.3 分类分析
- 2.4.4 聚类分析
- 参考文献
- 第3章 Web内容及结构挖掘应用案例1:基于Web公共舆情自动分析及预警
- 3.1 概述
- 3.1.1 基于Web的公共舆情
- 3.1.2 网络舆情研究现状
- 3.2 基于Web意见的舆情分析预测模型
- 3.2.1 舆情分析预测模型概述
- 3.2.2 热点舆情发现模型研究
- 3.2.3 热点舆情发展趋势预测模型
- 3.3 基于意见挖掘的热点舆情发现模型
- 3.3.1 改进的热点舆情发现模型
- 3.3.2 基于Web意见挖掘的报道特征表示
- 3.4 来源加权的舆情分析模型
- 3.4.1 舆情来源量化分析指标
- 3.4.2 Page-Rank算法拓展
- 3.4.3 构建来源加权的舆情分析模型
- 3.5 热点舆情识别
- 3.5.1 话题热度特征描述
- 3.5.2 话题热度计算函数
- 3.6 实验及评估
- 3.6.1 网络新闻数据的抓取
- 3.6.2 中文分词及文本表示
- 3.6.3 模型改进效果分析
- 3.7 C5.0和BP神经网络结合的舆情预测模型
- 3.7.1 基于C5.0的意见分类
- 3.7.2 基于BP神经网络预测模型
- 3.7.3 实验及评估
- 3.8 小结
- 参考文献
- 第4章 Web内容挖掘应用案例2:基于语义的Web信息自动聚合系统的关键技术研究
- 4.1 信息聚合及相关技术
- 4.1.1 信息聚合
- 4.1.2 信息聚合问题研究现状
- 4.1.3 简易信息聚合技术RSS
- 4.1.4 数字签名算法Simhash
- 4.2 一种基于主题的Web信息自动聚合方案
- 4.2.1 方案架构
- 4.2.2 信息获取
- 4.2.3 信息预处理
- 4.2.4 按主题聚合
- 4.3 基于标点符号及标签相似度的正文抽取方法
- 4.3.1 网页类型及结构
- 4.3.2 常用网页正文抽取方法分析
- 4.3.3 基于标点分布的网页正文抽取算法
- 4.3.4 基于标签相似度的多正文网页抽取技术
- 4.3.5 算法设计及实验
- 4.4 基于潜在语义的Web信息聚合
- 4.4.1 概率主题模型与潜在语义分析模型
- 4.4.2 LDA模型
- 4.4.3 面向Web信息的LDA模型改进方法
- 4.4.4 实验结果分析
- 4.5 本章小结
- 参考文献
- 第5章 分布式多源电商数据挖掘
- 5.1 电子商务及电商数据分析
- 5.2 电商数据分析挖掘
- 5.2.1 引言
- 5.2.2 电商数据定义
- 5.2.3 电商数据采集
- 5.2.4 数据分析挖掘
- 5.3 多源电商数据融合
- 5.3.1 引言
- 5.3.2 数据融合
- 5.3.3 多源电商数据的特点
- 5.3.4 多数据源电商数据融合总体解决方案
- 5.3.5 多数据源电商数据融合方案
- 5.3.6 多数据源电商数据融合的具体实现
- 5.3.7 实验结果与分析
- 5.4 分布式电商数据分析挖掘系统
- 5.4.1 引言
- 5.4.2 基于Hadoop的分布式电商数据分析挖掘系统
- 5.4.3 基于Hadoop平台的层次聚类
- 5.4.4 电商数据的层次聚类分析
- 参考文献