本书以Python为工具,全面讲解概率论与数理统计的主要内容和多元统计分析常用技术。全书包括13章和4个附录,内容翔实,讲解深入浅出。概率论4章,讲解概率论基础知识,主要是随机变量的相关理论;数理统计4章,主要是样本理论、参数估计和假设检验;回归分析2章,包括一元和多元回归分析及其统计解释;多元统计3章,主要讲解主成分分析和因子分析理论。整书内容简明,易上手,实用性强。本书不需要读者有良好的数学基础,4个附录提供了Python基础知识、微积分与线性代数的必要基础,可满足不同层次的读者需求。本书的特色是将Python贯穿于内容之中,为读者提供实践练习,也便于读者学习用Python解决实际问题的能力。
本书适用于大数据与人工智能专业的教师和学生,也适用于对数据科学感兴趣的人士和企业界的工程师。
对于数据科学和人工智能的从业者和学生而言,概率论和数理统计是一门非常重要的基础课,因为现代人工智能和大数据理论是建立在概率统计之上的模型系统,它利用概率统计的语言完成人机交互和复杂系统的运行。笔者希望读者通过本书的学习,能打好概率统计基础,进而对后续人工智能、大数据挖掘等专业课起到良好的推动作用。
在广义的计算机科学的学习过程中,很多初学者遭遇的挫折大多来自抽象的数学推导。传统的概率论教学以板书的形式展开,强调理论的完整且细致的证明,这种带有浓重的数学风格的教学模式给很多学生造成了一定程度的困扰,特别是理工科学生,他们不学习数学专业,对数学的兴趣也不算高,他们更喜欢实现具体的模型和算法。笔者认为,要理解一个算法的内在逻辑,没有数学知识是不行的,但也不能一味地追求数学形式的完整,一般来讲,学生具备必要的能读懂文献的数学基础就可以工作了,不需要把书写得那么数学化。
本书内容
本书旨在帮助读者解决技术书籍过于数学化,一方面本书遵循概率论和数理统计的教学大纲,在数学方面不过于强调,没有过多展开; 另一方面,利用Python工具,实现了大部分的理论和模型,使读者通过实践简化学习过程,提高代码编写能力,增强动手能力,为进一步学习人工智能和大数据科学奠定良好的基础。
本书特色
本书在附录中提供了Python基础、微积分基础、线性代数基础和NumPy基础,零基础的读者也能入门。采用计算机程序模拟数学推导的方法使数学知识更为清晰易懂,对初学者更加友好。
本书适合大数据与人工智能相关专业师生和企业一线开发人员参考,也适合对数据科学有兴趣的研究人员学习。
李爽
2023年1月
本书源代码
教学课件(PPT)