本书共分8章,主要内容如下:
第1章介绍数据的认知与研究任务,大数据概念特征及技术挑战等。
第2章介绍大数据内容、知识和结果表达概念,以及元数据和知识图谱技术。
第3章介绍数据存储基础、大数据存储要求以及应对技术和典型系统。
第4章介绍数据管理基础,新型数据管理模型及其相应大数据管理系统。
第5章介绍数据计算基础,大数据计算特点,大数据的批量、流、图等新计算模型和特点,以及计算引擎的工作原理等。
第6章介绍大数据分析概念、分类聚类等数据分析的基本方法,以及深度学习等数据分析的高级方法。
第7章介绍数据可视化概念、可视化方法与常用工具,以及大数据可视化面临的问题及相应方法。
第8章介绍大数据面临的安全威胁和安全需求,以及针对大数据全生命周期不同阶段的大数据安全技术。
更多科学出版社服务,请扫码获取。
战略支援部队信息工程大学教授。长期从事网络数据分析方向的研究工作。
目录
第1章 大数据概述1
1.1 认知数据1
1.1.1 数据概念1
1.1.2 数据研究内容2
1.2 认知大数据5
1.2.1 大数据形成6
1.2.2 大数据概念7
1.2.3 大数据技术9
1.3 大数据表达12
1.4 大数据面临的挑战14
1.4.1 数据复杂性带来的挑战14
1.4.2 计算复杂性带来的挑战15
1.4.3 系统复杂性带来的挑战15
思考题16
第2章 大数据表达方法17
2.1 元数据17
2.1.1 元数据形成18
2.1.2 元数据概念20
2.1.3 元数据体系22
2.2 大数据的元数据24
2.2.1 大数据的元数据标准24
2.2.2 元数据管理25
2.3 知识表示26
2.3.1 知识的概念26
2.3.2 知识表示的概念26
2.3.3 命题逻辑与谓词逻辑29
2.3.4 语义网络32
2.3.5 本体33
2.3.6 语义Web35
2.4 知识图谱39
2.4.1 知识图谱概念40
2.4.2 知识图谱的数据模型40
2.4.3 知识图谱的向量表示43
思考题45
第3章 大数据存储46
3.1 数据存储基础46
3.1.1 数据存储概念46
3.1.2 磁盘存储原理48
3.1.3 磁盘阵列52
3.1.4 磁盘卷58
3.1.5 存储空间59
3.2 数据存储系统62
3.2.1 基于数据块的存储系统62
3.2.2 基于文件的存储系统64
3.2.3 基于对象的存储系统69
3.3 大数据存储现状69
3.3.1 大数据存储面对的挑战70
3.3.2 云存储71
思考题72
第4章 大数据管理73
4.1 数据管理相关知识73
4.1.1 数据管理概念73
4.1.2 数据管理模型75
4.1.3 数据管理系统76
4.2 大数据管理面临的主要问题79
4.3 分布式文件系统80
4.3.1 文件管理系统原理概述81
4.3.2 分布式文件管理系统原理85
4.3.3 典型的HDFS分布式文件系统90
4.4 NoSQL数据库系统96
4.4.1 关系模型98
4.4.2 非关系模型99
4.4.3 NoSQL数据存储109
4.4.4 NoSQL基本理论111
4.4.5 NoSQL体系框架112
思考题113
第5章 大数据计算115
5.1 计算系统及其体系结构115
5.2 计算服务系统及其体系结构118
5.3 大数据的计算类型及特点121
5.4 大数据的批量计算123
5.4.1 MapReduce及其计算123
5.4.2 Spark及其计算127
5.5 大数据的流式计算133
5.5.1 流数据概念及特点133
5.5.2 Spark Streaming及其流计算134
5.5.3 Storm及其流计算138
5.6 大数据的图计算141
5.6.1 BSP模型142
5.6.2 图计算系统Pregel145
思考题146
第6章 大数据分析148
6.1 大数据分析概念148
6.2 数据分析的基本方法149
6.2.1 数据分类算法149
6.2.2 数据聚类方法157
6.2.3 关联规则算法163
6.2.4 图数据分析168
6.3 数据分析的高级方法173
6.3.1 深度学习173
6.3.2 强化学习178
6.3.3 迁移学习180
思考题181
第7章 大数据可视化182
7.1 数据可视化概述182
7.1.1 可视化与可视化技术182
7.1.2 数据可视化概念183
7.1.3 数据可视化作用184
7.2 数据可视化技术186
7.2.1 数据基本统计特征的可视化186
7.2.2 高维数据的可视化189
7.2.3 面向大数据主流应用的信息可视化192
7.3 常用数据可视化工具198
7.3.1 基于Excel的数据可视化198
7.3.2 基于Tableau的数据可视化201
7.3.3 基于JavaScript开发的数据可视分析205
7.4 大数据可视化面临问题与挑战211
思考题212
第8章 大数据安全213
8.1 大数据安全概览213
8.1.1 大数据安全形势213
8.1.2 大数据安全威胁214
8.1.3 大数据安全需求214
8.2 大数据安全技术215
8.2.1 匿名认证技术215
8.2.2 访问控制安全技术220
8.2.3 数据存储完整性证明技术225
8.2.4 数据处理安全技术228
8.2.5 数据发布隐私保护技术234
思考题238
参考文献239