机器学习是一门多领域交叉学科,可以通过模拟来让计算机获取新的知识或技能。ApacheSpark是一种通用大数据框架,也是一种近实时弹性分布式计算和数据虚拟化技术,Spark使人们可以大规模使用机器学习技术,而无须在专用数据中心或硬件上进行大量投资。 本书提供了ApacheSpark机器学习API的全面解决方案,不仅介绍
ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书,旨在教会读者利用Spark构建实用的数据科学解决方案。 本书内容包括14章,由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构
本书以数据处理为主线,介绍数据处理的基本原理、常见的算法思想、算法设计的可视化以及编程实现python语言。 全书共13章,主要内容包括数据科学基础实践概论、数据表示、数据计算、数据分析、数据可视化、算法可视化工具、算法设计基础、Excel中的算法、Python程序设计基础、算法在Python中的实现、Word文档处理
《过程控制及自动化仪表》以过程自动化监控为基本内容,将参数检测变送、分布式控制系统(DCS)及执行器作为组成过程检测控制系统的相应环节,力求完整体现过程监控的整体内容。在参数检测方面,深入浅出地介绍了检测原理及方法;依据其代表性及发展趋势,介绍了目前生产中广泛应用的检测仪表;在控制仪表方面,根据生产实际情况,介绍了电动
本书主要内容包括认识大数据、大数据技术基础、大数据管理、大数据统计分析技术、数据挖掘、大数据可视化、大数据安全、大数据应用案例实操等。
本书内容分“主题报告”“理论报告”“数字中国”“专题阅读”“图表索引”等板块。收录的文章包括:“大数据金融风险防控指数的体系构建与测算方法研究”“中国能否引领全球金融科技新时代?——城市比较视角下的金融科技策略选择”“金融科技中心城市发展报告”“数据博弈论”等。
本书为开放教育教材,涉及:Python基础,数据探索与预处理,模型结果评估,相关与关联分析,回归分析,分类,聚类分析,时间序列分析。
本书分三个部分,共十一章。第一部分是数据分析与挖掘概述,包括第1章,主要介绍数据分析与挖掘的基本概念。第二部分是基础理论和基本技术,包括第2章到第10章,内容涉及数据仓库、多维数据分析OLAP、线性回归模型等。第三部分是数据分析与挖掘的操作与应用,包括第12章,以SQLSERVER和R语言为实践平台,介绍多维数据分析O
本书主要内容包括:数控技术与数控机床的基本知识、数控技术的现状与发展趋势、数控技术在国民经济中的地位和作用、数控技术应用型人才需求、数控技术专业概况等。
本书以典型厂家及型号的计算机控制系统为对象,基于项目导向、任务驱动的理念,从生产过程控制系统工程案例出发,引入企业典型工作案例,主要介绍集散控制控制器的软硬选型、设备安装、组态设计以及系统运行调试以及现场总线和SIS的构成、特点和网络通信等内容。本教材不仅可作为高职高专生产过程自动化技术、电气自动化技术、机电一体化技术