本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。
这本书首先简要介绍了机器学习的主题,涵盖了大数据挖掘、数据流挖掘的基本方法,以及一个简单的MOA示例。接下来进行更详细的讨论,其中有关于草图技术、变更、分类、集成方法、回归、聚类和频繁模式挖掘的章节。这些章节中的大部分内容包括练习、基于MOA的实验,或者两者都有。*后,本书讨论了MOA软件,涵盖了MOA图形用户界面、命
本书系统介绍大数据技术的原理、数据挖掘与应用,主要内容包括基本概念、数据收集、数据存储、数据处理、大数据可视化、信息检索、数据挖掘和效能评估。本书以简单易懂的语言、生动有趣的实例和图形展示知识点,将概念、原理与应用融会贯通,并对大数据工具软件进行了细致的梳理。
图书内容●理解分析和基本的数据概念●使用分析方法解决各行业问题●利用机器学习技术建立预测模型●创建和应用分析策略
本书基于MATLABR2018a,由浅入深,全面讲解了MATLAB/Simulink的知识。本书涉及面广,涵盖了一般用户需要使用的各种功能,并详细介绍了MATLAB/Simulink的使用。本书自始至终采用实例描述;内容完整且每章相对独立,是一本详细的MATLAB/Simulink参考书。 全书共分为13章,首先介绍
本书以任务为导向,全面地介绍了数据分析的流程和PowerBI数据分析的应用,详细讲解了使用PowerBI解决企业实际问题的方法。全书共8章,包括数据分析与可视化概述、数据获取、M语言数据预处理、DAX语言数据建模、数据分析与可视化、PowerBI数据分析报表、数据部署、自动售货机综合案列。本书的大部分章节包含了实训与课
本教材是以昆仑通态的MCGS组态软件为例,介绍组态技术在工业控制中的应用。本教材将组态技术中所涉及的知识点和组态方法以项目的形式呈现,分为由易到难分为十个项目,为了巩固所学知识点,在每个项目的后面配套设立了难易程度相同的项目供学生课后自行完成。前4个项目通过虚拟仿真的形式完成,使学生能够熟练掌握组态软件的使用;后4个项
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知
本书作为基础理论教材,它以浅显易懂的语言为来自不同学科领域的研究生和研究人员提供有力指导。本书共十章,分别是:复杂网络基本概念、复杂网络模型、网络鲁棒性、网络传播动力学、网络演化博弈、数据挖掘、大规模复杂网络数据获取及存储、节点影响力排序、网络聚类技术分析、推荐系统和链路预测。这些内容由浅入深,对不同的读者,侧重点不同
本书从MATLAB仿真的角度系统地介绍滑模变结构控制的基本理论、基本方法和应用技术,是作者多年来从事控制系统教学和科研工作的结晶,同时融入了国内外同行近年来所取得的新成果。本书是在第3版基础上修订而成的,增加了部分内容。全书共分14章,内容包括绪论、滑模控制基本方法、几种典型滑模控制、自适应鲁棒滑模控制、基于干扰及输出