![]() ![]() |
大数据采集与预处理
本书共分两部分:第一部分是网络数据采集与预处理的基础理论实践,包括任务1-任务6,主要讲解如何使用Python编写网络数据采集和预处理程序,内容包括Python环境搭建,Python基础语法、语句与函数,网络基础知识,常用网络数据采集与预处理库和解析库、数据持久化保存,以及requests库、Numpy库、Pandas库、Selenium技术、ChromeDriver技术和Scrapy技术的应用方式。第二部分是网络数据采集与预处理的综合案例,包括任务7-任务9,主要讲解requests库数据采集与Echarts可视化技术相结合并持久化保存和数据预处理的应用案例;Selenium和ChromeDriver技术相结合模拟登录,采集动态和静态数据并持久化保存和数据预处理的应用案例;Hadoop平台的Flume日志数据采集应用案例,充分呈现了大数据采集与预处理主流技术与可视化技术的主要功能和特点。
你还可能感兴趣
我要评论
|