本书为了符合学生学习知识的一般规律,以一张控制流程图为切入点,首先介绍了识图方法,之后阐述了自动检测、自动控制、自动联锁报警等过程控制系统,然后分三章介绍了变量检测及仪表、过程控制仪表及计算机控制系统等过程控制工具,最后是控制系统的应用——典型过程单元的控制方案及控制系统的操作。将实验与实践内容单独列为一章,在这一章不
本书立足“共生理论”,围绕“公共数据开放”这一研究对象,从共生状态演进视角界定并量化各利益主体在不同共生阶段的共生关系概念和竞合程度评判依据,进而识别出共生主体在不同阶段行为变化的共生关键因素。面向公共数据开放各方阶段性需求变化,对其行为、利益进行再配置,从时序上建立起公共数据开放运行初期、中期和后期不同共生模式对应的
本书全面探讨了科技文本分析的智能方法,以情报学理论为支撑,以人工智能技术为核心,结合现代情报工程的前沿实践经验,对科技文本分析的任务图景、智能方法实现以及技术发展趋势进行了系统研究。首先分析了科技文本分析的概念、任务、实现流程和发展历史,系统性地提出了科技文本分析的任务图景。其次,深入论述科技文献的智能化版式分析方法、
本书详细介绍大数据采集与清洗的相关知识和技术,共9章,分别是概述、网络爬虫基础、网页数据抓取、缓存下载页面、并发/并行爬取、用Selenium抓取动态内容、Scrapy爬虫框架及其应用、大数据平台系统日志采集、pandas数据清洗。本书大体上由数据采集(第2~8章)和数据清洗(第9章)两部分内容构成,以Python作为
本书主要阐述切换系统安全控制问题的基本内容与方法,介绍国内外相关领域的最新研究成果,主要内容包括:未知扰动下切换系统抗扰动安全控制,输出和切换模式受攻击下切换系统异步被动网络安全控制,基于双触发、弹性触发的切换系统主动网络安全控制,基于受损数据预测的切换系统主动网络安全控制,基于学习和智能算法的切换系统网络安全控制,基
本书内容涵盖分布式理论基础、大数据处理架构Hadoop、Hadoop分布式文件系统、基于Hadoop的数据仓库工具Hive、分布式数据库HBase、分布式计算框架MapReduce、基于内存的分布式计算框架Spark、分布式计算框架Flink、分布式协作服务ZooKeeper等大数据平台架构核心理论与重要组件,以及资源
本书共12章。第1章简要介绍DeepSeek的技术架构、本地部署与在线开发环境,为后续分析奠定技术基础。第2~4章聚焦多源数据获取、数据清洗及预处理,提供标准化操作流程与代码实例。第5-8章介绍描述性统计、频数分析、相关性分析、线性/曲线/逻辑回归、K-Means聚类、时间序列分析等核心算法,结合GDP分析、商品评论挖
本书着重介绍大数据建模与分析中常用的概率极限理论,主要内容包括相依随机变量和过程的极限理论、Stein方法及其应用、自正则化极限理论、高维样本协方差矩阵的谱统计量渐近分布理论、随机梯度方法及其应用、随机复杂网络的整体和局部结构、分布式统计推断方法和渐近理论、Gauss逼近原理及其应用等。
本书共分为8章,每一章都围绕完整的项目展开,涵盖Spark的各个重要组件。包括认识Spark、Scala语法应用、SparkCore数据分析、SparkSQL结构化数据处理、Spark、流式数据处理,Spark结构化流式处理、Spark机器学习应用、社交软件运营数据分析,逐步提升读者的技术水平和应用能力。每个项目由多个
本书精心编排为15章,内容包括Spark简介、Spark集群环境部署、Spark编程体验、RDD深度解读、RDD的Shuffle详解、Spark共享变量、Spark序列化和线程安全、Spark内存管理机制、SparkSQL简介、SparkSQL抽象编程详解、SparkSQL自定义函数、SparkSQL源码解读、Spar