当前位置:主页 > 计算机电子书 > 数据库 > Splunk下载
Splunk大数据分析

Splunk大数据分析 PDF 高清版

  • 更新:2020-06-11
  • 大小:77.3 MB
  • 类别:Splunk
  • 作者:扎德罗津尼
  • 出版:机械工业出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

Splunk是一种典型性的数据融合专用工具,可以高效率地按时钟频率对数据信息开展储存、数据库索引、浏览,已广泛运用在好几个行业。这书是介绍怎样并行处理互联网大数据并从这当中得到 经济收益的一本好用手册。这书根据真正的数据分析新项目,从数据信息导进、浏览、发掘和可视化视角全方位而系统化介绍Splunk的基本概念和操作方法,以协助阅读者迅速把握Splunk。

本书共16章,分成四个一部分:第一部分(第一~7章)介绍Splunk的基本操作,包含运用Splunk开展数据采集、解决、剖析及結果可视化等的基本操作和指令,及其应用系统日志文件创建高級数据统计分析表格的方式;第二一部分(第八~11章)应用“国际航空公司准时性能数据信息”介绍一个典型性的数据统计分析实例,详尽解读怎样应用Splunk深层发掘目前数据库管理,并介绍一些新的Splunk指令和实战技巧;第三一部分(第12~14章)详细介绍怎样搜集、解决、剖析文章和Foursquare的每日签到信息内容等,包含剖析社交媒体流数据需要的专业知识;第四一部分(第15~16章)详细介绍怎样按要求拓展Splunk,及其分布式系统解决和可扩展性的基本概念。除此之外,还包含2个附则,展现Splunk的性能及其各种各样能用的程序运行。

目录

  • 第1章 大数据和Splunk / 1
  • 1.1 什么是大数据 / 1
  • 1.2 非传统的数据处理技术 / 5
  • 1.3 Splunk是什么 / 6
  • 1.4 关于本书 / 7
  • 第2章 将数据导入Splunk / 9
  • 2.1 数据的多样性 / 9
  • 2.2 Splunk如何处理多样化的数据 / 10
  • 2.2.1 文件和目录 / 11
  • 2.2.2 数据生成器 / 16
  • 2.2.3 生成样本数据 / 17
  • 2.2.4 网络资源 / 21
  • 2.2.5 Windows数据 / 21
  • 2.2.6 其他资源 / 21
  • 2.3 应用程序和附加组件 / 21
  • 2.4 转发器 / 26
  • 2.5 小结 / 27
  • 第3章 处理和分析数据 / 28
  • 3.1 了解组合访问日志数据 / 28
  • 3.2 搜索和分析索引数据 / 29
  • 3.3 报表 / 35
  • 3.3.1 使用最多的浏览器 / 35
  • 3.3.2 排名前五的IP地址 / 37
  • 3.3.3 浏览量来源最多的网站 / 38
  • 3.3.4 有多少404事件 / 40
  • 3.3.5 有多少事件包含购买行为 / 42
  • 3.3.6 列出购买的商品 / 42
  • 3.4 排序 / 44
  • 3.5 过滤 / 45
  • 3.6 添加和评估字段 / 47
  • 3.7 聚合 / 48
  • 3.8 小结 / 54
  • 第4章 结果的可视化 / 55
  • 4.1 数据可视化 / 55
  • 4.2 Splunk是怎样处理可视化的 / 55
  • 4.3 chart / 60
  • 4.3.1 制作每一个主机的GET和POST事件数量的图表 / 61
  • 4.3.2 制作每一个产品类别的购买数和浏览数的图表 / 62
  • 4.3.3 哪个产品种类受HTTP 404错误的影响 / 63
  • 4.3.4 MyGizmoStore.com的购买趋势 / 64
  • 4.3.5 事务持续时间 / 66
  • 4.4 timechart / 67
  • 4.4.1 最高购买数量的产品 / 67
  • 4.4.2 页面浏览率和购买量 / 68
  • 4.5 使用Google Maps应用程序来可视化 / 69
  • 4.6 Globe / 71
  • 4.7 仪表盘 / 72
  • 4.8 小结 / 80
  • 第5章 定义警报 / 81
  • 5.1 什么是警报 / 81
  • 5.2 Splunk如何提供警报 / 81
  • 5.2.1 基于商品销售量的警报 / 82
  • 5.2.2 登录失败的警报 / 84
  • 5.2.3 日志文件中关键性错误的警报 / 87
  • 5.3 小结 / 88
  • 第6章 网站监测 / 90
  • 6.1 监测网站 / 90
  • 6.2 IT运作 / 91
  • 6.2.1 主机访问量 / 91
  • 6.2.2 无内部访问的主机访问量 / 91
  • 6.2.3 HTTP请求成功的流量 / 93
  • 6.2.4 HTTP请求未成功的流量 / 93
  • 6.2.5 返回HTTP错误状态码最多的页面 / 94
  • 6.3 业务 / 96
  • 6.3.1 区域用户统计 / 96
  • 6.3.2 跳出率 / 97
  • 6.3.3 独立访问者数量 / 98
  • 6.4 小结 / 103
  • 第7章 使用日志文件创建高级分析 / 104
  • 7.1 传统的分析方法 / 104
  • 7.2 范式变更 / 105
  • 7.3 语义日志 / 106
  • 7.4 日志最佳实践 / 113
  • 7.5 小结 / 115
  • 第8章 航班准点率项目 / 116
  • 小结 / 118
  • 第9章 将航班数据导入Splunk / 119
  • 9.1 处理CSV文件 / 119
  • 9.1.1 航班数据 / 119
  • 9.1.2 下载数据 / 120
  • 9.1.3 了解航班数据 / 121
  • 9.1.4 关于时间戳 / 123
  • 9.1.5 将字段映射成一个时间戳 / 124
  • 9.1.6 对所有航班数据建立索引 / 131
  • 9.2 从关系数据库中索引数据 / 132
  • 9.2.1 定义一个新的数据库连接 / 132
  • 9.2.2 数据库监测 / 133
  • 9.3 小结 / 136
  • 第10章 分析航空公司、机场、航班和延迟 / 137
  • 10.1 分析航空公司 / 137
  • 10.1.1 计算航空公司的总数 / 138
  • 10.1.2 可视化结果 / 139
  • 10.2 分析机场 / 143
  • 10.3 分析航班 / 146
  • 10.4 分析延迟 / 151
  • 10.4.1 各航空公司航班延迟情况 / 151
  • 10.4.2 各机场航班延迟的原因 / 152
  • 10.4.3 冬天与夏天的航班延迟情况 / 155
  • 10.5 创建和使用宏命令 / 157
  • 10.6 报告加速 / 158
  • 10.7 加速统计 / 161
  • 10.8 小结 / 166
  • 第11章 分析一个特定航班的历年数据 / 167
  • 11.1 航空公司名称 / 167
  • 11.1.1 字段查找自动化 / 172
  • 11.1.2 从搜索中创建查找表 / 173
  • 11.2 United flight 871航班 / 174
  • 11.3 小结 / 178
  • 第12章 分析推文 / 179
  • 12.1 开发样本流 / 180
  • 12.2 将推文加载到Splunk中 / 183
  • 12.3 Twitter / 185
  • 12.4 最流行的单词 / 188
  • 12.5 实时的Twitter趋势 / 191
  • 12.6 小结 / 196
  • 第13章 分析Foursquare签到信息 / 197
  • 13.1 签到信息格式 / 198
  • 13.2 时区注意事项 / 202
  • 13.3 装载签到数据 / 203
  • 13.4 分析签到信息 / 205
  • 13.4.1 星期日早午餐搜索 / 205
  • 13.4.2 Google地图和热门地点 / 209
  • 13.4.3 地点的签到模式 / 211
  • 13.4.4 地点的签到数量 / 212
  • 13.4.5 分析性别活动 / 214
  • 13.5 小结 / 217
  • 第14章 情感分析 / 218
  • 14.1 意见、观点、信仰、信念 / 218
  • 14.2 商业用途 / 219
  • 14.3 情感分析的技术性工作 / 220
  • 14.4 情感分析应用程序 / 222
  • 14.4.1 全局性的命令 / 223
  • 14.4.2 挖掘情感 / 224
  • 14.4.3 语言的处理 / 226
  • 14.4.4 训练数据和测试数据 / 227
  • 14.5 世界情绪指数项目 / 231
  • 14.5.1 收集RSS摘要 / 232
  • 14.5.2 将新闻标题索引到Splunk中 / 234
  • 14.5.3 定义情感语料库 / 237
  • 14.5.4 对结果进行可视化 / 240
  • 14.6 小结 / 242
  • 第15章 远程数据收集 / 243
  • 15.1 转发器 / 243
  • 15.1.1 流行的拓扑结构 / 244
  • 15.1.2 安装转发器 / 246
  • 15.2 部署服务器 / 248
  • 15.2.1 配置部署服务器 / 250
  • 15.2.2 配置转发器 / 251
  • 15.3 部署监控 / 252
  • 15.4 小结 / 253
  • 第16章 可扩展性和高可用性 / 254
  • 16.1 扩展Splunk / 254
  • 16.2 聚类 / 259
  • 16.3 小结 / 264
  • 附录A Splunk的性能 / 265
  • 附录B 有用的Splunk应用程序 / 281

资源下载

资源下载地址1:https://pan.baidu.com/s/1Y55gDESG-Bm_bLv9otj7yA

相关资源

网友留言