教材简介
本书分为认识数据采集、采集和解析网页数据、并行多线程网络数据、Scrapy爬虫框架网页数据采集、反爬虫技术与反反爬虫技术五个项目。以项目式进行编排并分任务、实训讲解,将理论与实践一体化,体现“学中做”和“做中学”。除了讲授知识和技能外,本书还引导学生牢固树立法治观念,自觉践行职业精神和职业规范,并采用润物无声的方式将“课程思政”元素内化于教学任务中,培养学生具备爱国情怀、奉献精神、科学精神、工匠精神、创新意识等职业素养。本书主要面向高等职业院校计算机类及相关专业的学生,内容构造体现“以实用为主体”,强调知识的理解和运用,实现高等职业教育教学以实践体系为主及以技术应用能力培养为主的目标,符合现代高等职业教育对教材的要求。
项目一 初识数据采集
任务一 数据采集
任务二 网络爬虫
实训 爬取手机端数据
项目二 采集和解析网页数据
任务一 采集网页分析
任务二 用 Python 实现 HTTP 请求
任务三 静态网页和动态网页采集
任务四 解析采集到的网页
实训 爬取天气预报数据
项目三 并行多线程网络数据采集
任务一 多线程网络数据采集
任务二 多进程网络数据采集
实训 爬取旅游网站数据
项目四 Scrapy 爬虫框架网络数据采集
任务一 安装 Scrapy 爬虫框架并创建爬虫项目
任务二 使用 Scrapy 提取网页数据
任务三 多层级网页抓取
实训 爬取图书网站数据
项目五 反爬虫技术与反反爬虫技术
任务一 反爬虫技术
任务二 反反爬虫技术
实训 爬取购物网站商品数据
参考文献
-
978-7-200-18683-3《数据采集技术》目录-样章
2025-3-3