/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
/简体中文/
软件Tags: 大数据之路阿里巴巴大数据实践
阿里官方网首次公布互联网大数据系统架构图与关键技术,CSDN,ChinaUnix,ITPUB,segmentfault等好几家技术社区推荐!关键剖析阿里近些年的大数据挖掘,剖析,运用的探寻历经。这书合适全部搞数据信息科学研究,数据统计分析的自己或公司学习培训参照。这本书对大家有蛮高规定的。许多全是浅尝即止,或是便是提一些大家都明白的定义。我善良的想,阿里巴巴可能是为了更好地技术性信息保密吧。可是总体来说,这不能说不值得这一价格,不一样“实践活动”两字!
第1章 概要 1
第1篇 数据信息技术性篇
第2章 日志收集 8
2.1 电脑浏览器的网页页面日志收集 8
2.1.1 网页页面访问日志收集步骤 9
2.1.2 网页页面互动日志收集 14
2.1.3 网页页面日志的服务端清理和预备处理 15
2.2 无线网络手机客户端的日志收集 16
2.2.1 网页页面事情 17
2.2.2 控制点一下以及他事情 18
2.2.3 独特情景 19
2.2.4 H5 & Native日志统一 20
2.2.5 机器设备标志 22
2.2.6 日志传送 23
2.3 日志收集的挑戰 24
2.3.1 典型性情景 24
2.3.2 大促确保 26
第3章 数据库同步 29
3.1 数据库同步基本 29
3.1.1 传送数据同歩 30
3.1.2 数据信息数据同步 30
3.1.3 数据库查询日志分析同歩 31
3.2 阿里巴巴数据库管理的同歩方法 35
3.2.1 大批量数据库同步 35
3.2.2 实时数据同歩 37
3.3 数据库同步碰到的难题与解决方法 39
3.3.1 分库分表的解决 39
3.3.2 高效率同歩和大批量同歩 41
3.3.3 增加量与全量同歩的合拼 42
3.3.4 同歩特性的解决 43
3.3.5 数据信息飘移的解决 45
第4章 线下数据开发 48
4.1 数据信息软件开发平台 48
4.1.1 统一测算服务平台 49
4.1.2 统一软件开发平台 53
4.2 线程同步系统软件 58
4.2.1 环境 58
4.2.2 详细介绍 59
4.2.3 特性及运用 65
第5章 即时技术性 68
5.1 介绍 69
5.2 流式的技术架构 71
5.2.1 数据收集 72
5.2.2 数据处理方法 74
5.2.3 数据储存 78
5.2.4 网络服务 80
5.3 流式的数据库系统 80
5.3.1 数据信息分层次 80
5.3.2 多流关系 83
5.3.3 维表应用 84
5.4 大促挑戰&确保 86
5.4.1 大促特点 86
5.4.2 大促确保 88
第6章 网络服务 91
6.1 服务项目构架演变 91
6.1.1 DWSOA 92
6.1.2 OpenAPI 93
6.1.3 SmartDQ 94
6.1.4 统一的网络服务层 96
6.2 技术架构 97
6.2.1 SmartDQ 97
6.2.2 iPush 100
6.2.3 Lego 101
6.2.4 uTiming 102
6.3 最佳实践 103
6.3.1 特性 103
6.3.2 可靠性 111
第7章 大数据挖掘 116
7.1 大数据挖掘简述 116
7.2 大数据挖掘优化算法服务平台 117
7.3 大数据挖掘网易大数据管理体系 119
7.3.1 发掘数据中台 120
7.3.2 发掘优化算法网易大数据 122
7.4 大数据挖掘实例 123
7.4.1 客户画像 123
7.4.2 互联网技术反挂 125
第2篇 数据库系统篇
第8章 互联网大数据领域建模具体描述 130
8.1 为何必须大数据挖掘 130
8.2 关联数据库管理和数据库管理 131
8.3 从OLTP和OLAP系统的差别看实体模型科学方法论的挑选 132
8.4 典型性的数据库管理模型科学方法论 132
8.4.1 ER实体模型 132
8.4.2 维度实体模型 133
8.4.3 Data Vault实体模型 134
8.4.4 Anchor实体模型 135
8.5 阿里数据库系统实践活动具体描述 136
第9章 阿里数据信息融合及体系管理 138
9.1 简述 138
9.1.1 精准定位及使用价值 139
9.1.2 管理体系构架 139
9.2 标准界定 140
9.2.1 专用名词 141
9.2.2 评价指标体系 141
9.3 设计模型 148
9.3.1 具体指导基础理论 148
9.3.2 实体模型层级 148
9.3.3 基本准则 150
9.4 实体模型执行 152
9.4.1 业内常见的实体模型执行全过程 152
9.4.2 OneData执行全过程 154
第10章 维度设计方案 159
10.1 维度设计理论 159
10.1.1 维度的基本要素 159
10.1.2 维度的基本上设计方法 160
10.1.3 维度的结构分析 162
10.1.4 规范性和反规范性 163
10.1.5 一致性维度和交叉式探察 165
10.2 维度设计方案高級主题风格 166
10.2.1 维度融合 166
10.2.2 水准分拆 169
10.2.3 竖直分拆 170
10.2.4 历史时间存档 171
10.3 维度转变 172
10.3.1 迟缓转变维 172
10.3.2 快照更新维表 174
10.3.3 極限储存 175
10.3.4 小型维度 178
10.4 独特维度 180
10.4.1 递归算法层级 180
10.4.2 个人行为维度 184
10.4.3 多值维度 185
10.4.4 多值特性 187
10.4.5 杂类维度 188
第11章 事实表设计方案 190
11.1 事实表基本 190
11.1.1 事实表特点 190
11.1.2 事实表设计原理 191
11.1.3 事实表设计方法 193
11.2 事务管理事实表 196
11.2.1 设计过程 196
11.2.2 单事务管理事实表 200
11.2.3 多事务管理事实表 202
11.2.4 二种事实表比照 206
11.2.5 父子俩事实的处理方法 208
11.2.6 事实的设计方案规则 209
11.3 周期时间快照更新事实表 210
11.3.1 特点 211
11.3.2 案例 212
11.3.3 常见问题 217
11.4 积累快照更新事实表 218
11.4.1 设计过程 218
11.4.2 特性 221
11.4.3 独特解决 223
11.4.4 物理学完成 225
11.5 三种事实表的较为 227
11.6 无事实的事实表 228
11.7 集聚型事实表 228
11.7.1 集聚的基本准则 229
11.7.2 集聚的基本上流程 229
11.7.3 阿里巴巴公共性归纳层 230
11.7.4 集聚补充说明 234
第3篇 数据库管理篇
第12章 元数据 236
12.1 元数据简述 236
12.1.1 元数据界定 236
12.1.2 元数据使用价值 237
12.1.3 统一元数据服务体系 238
12.2 元数据运用 239
12.2.1 Data Profile 239
12.2.2 元数据门户网 241
12.2.3 运用链接剖析 241
12.2.4 大数据挖掘 242
12.2.5 推动ETL开发设计 243
第13章 测算管理方法 245
13.1 优化系统 245
13.1.1 HBO 246
13.1.2 CBO 249
13.2 每日任务提升 256
13.2.1 Map歪斜 257
13.2.2 Join歪斜 261
13.2.3 Reduce歪斜 269
第14章 储存和成本控制 275
14.1 数据编码 275
14.2 数据信息重遍布 276
14.3 储存整治项提升 277
14.4 生命期管理方法 278
14.4.1 生命期管理模式 278
14.4.2 通用性的生命期管理方法引流矩阵 280
14.5 数据信息成本费计量检定 283
14.6 数据信息应用收费 284
第15章 网站安全性 285
15.1 网站安全性确保标准 285
15.2 网站安全性方式简述 287
15.2.1 消費情景了解 289
15.2.2 数据整理全过程守点校检 292
15.2.3 风险防控措施监管 295
15.2.4 品质考量 299
第4篇 数据信息运用篇
第16章 数据信息运用 304
16.1 淘宝生意参谋 305
16.1.1 环境简述 305
16.1.2 作用构架与系统工作能力 307
16.1.3 店家运用实践活动 310
16.2 对里数据产品服务平台 313
16.2.1 精准定位 313
16.2.2 商品基本建设过程 314
16.2.3 总体构架详细介绍 317
附则A 这书插画图片数据库索引 320






















Copyright 2019-2022 版权所有
声明: 所有软件和文章来自互联网 如有异议 请与本站联系socangkefu@foxmail.com 本站为非赢利性网站 不接受任何赞助和广告 技术支持