本书分为认识数据采集、采集和解析网页数据、并行多线程网络数据、Scrapy爬虫框架网页数据采集、反爬虫技术与反反爬虫技术五个项目。以项目式进行编排并分任务、实训讲解,将理论与实践一体化,体现“学中做”和“做中学”。除了讲授知识和技能外,本书还引导学生牢固树立法治观念,自觉践行职业精神和职业规范,并采用润物无声的方式将“课程思政”元素内化于教学任务中,培养学生具备爱国情怀、奉献精神、科学精神、工匠精神、创新意识等职业素养。本书主要面向高等职业院校计算机类及相关专业的学生,内容构造体现“以实用为主体”,强调知识的理解和运用,实现高等职业教育教学以实践体系为主及以技术应用能力培养为主的目标,符合现代高等职业教育对教材的要求。
项目一 初识数据采集
项目二 采集和解析网页数据
项目三 并行多线程网络数据采集
项目四 Scrapy爬虫框架网络数据采集
项目五 反爬虫技术与反反爬虫技术