大数据技术基础
本书详细讲解了基于微服务的数据工程应用开发实践,包括微服务及数据工程相关原理概述、开发环境搭建、服务运行与跟踪、服务通信与配置、国产自主可控数据库实践、相关系统的开发实践等内容,特色是(1)结合当今微服务发展技术指导传统数据工程应用的开发实践(2)引入当今对国产自主可控数据库的要求,详细讲解了如何在微服务技术条件下对国
《数据资产管理核心技术与应用》深入探讨数据资产管理的核心技术与应用,融入作者在大数据领域多年的丰富经验。《数据资产管理核心技术与应用》为读者提供一套可以落地的数据资产管理框架,并详解两个基于该框架进行数据资产管理的应用案例,使读者能更好地了解数据资产管理底层所涉及的众多核心技术,让数据可以发挥出更大的价值。《数据资产管
本书系统介绍了大数据基础知识和相关技术,全书分为大数据基础、大数据存储与管理篇、大数据采集与预处理、大数据分析与挖掘、大数据平台Hadoop实践与应用案例5篇,共17章,主要内容包括大数据基本概念、大数据平台Hadoop基础、大数据存储与管理基本概念、大数据分布式文件系统HDFS、大数据分布式数据库系统HBase、大数
《Hadoop海量数据处理》从Hadoop的基础知识讲起,逐步深入Hadoop分布式文件系统(HDFS)和MapReduce分布式编程框架的核心技术,帮助读者全面、系统、深入地理解Hadoop海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。《Ha
本书通过鲁棒优化的核心原理和应用,揭开不确定性的神秘面纱,为读者提供应对不可预测的挑战所需的见解和工具。作者首先简要介绍了不确定线性规划,然后深入分析了适当不确定性集的构建与经典机会约束(概率)方法之间的相互联系。接着,提出了针对不确定的锥二次优化和半定优化问题以及动态(多阶段)问题的鲁棒优化理论。最后,通过来自金融、
本书第一章介绍了大数据分析的相关概念、大数据分析模型的建立方法;第二章介绍了Tempo平台的功能模块以及创建课堂、添加实验、发布实验等常用功能的快速入门;第三章介绍了数据预处理。第四章是分类分析实验,涉及到决策树分类、KNN分类、朴素贝叶斯分类、随机森林和神经网络算法;第五章描述了聚类分析实验,分别介绍了Kmeans算
本书采用项目任务式编写方法,以合理的结构、通俗易懂的语言、丰富实用的案例、学练结合的讲解方式,全面系统、循序渐进地介绍了大数据存储的相关技术和实际应用。全书共分为7个项目,分别为大数据存储概述、数据仓库Hive、列式数据库HBase、文档数据库MongoDB、图数据库Neo4j、键值数据库Redis、NewSQL数据库
本教材是大数据时代下,大数据行业蓬勃发展,大数据技术也在不断涌现革新,本书对大数据体系架构lambda进行梳理,介绍了一些重要的大数据平台技术原理与编程实践,包括数据收集层的Kafka,数据存储层的HDFS、HBase,计算框架层的MapReduce、Spark、Flink,资源管理与协调层的YARN、ZooKeepe
本书首先介绍了大数据应用基础:重点讲解了如何搭建Hadoop分布式集群平台,使用Java语言进行MapReduce分布式编程;HBase及Hive数据库环境的安装和数据的增、删、改、查操作;Spark平台的搭建、RDD操作及SparkSQL查询;Flink平台的搭建,Kafka消息中间件的使用及流批一体计算。其次对数据