OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 学习 > 实训 >

Python分布式爬虫:Scrapy入门与实践

Python分布式爬虫:Scrapy入门与实践

  • 来源:国防科技大学
  • 章节:3 单元:6

  • 韩梅
进入实训课程

课程简介:

`Scrapy`,是`Python`开发的一个快速、高层次的屏幕抓取和`web`抓取框架,用于抓取`web`站点并从页面中提取结构化的数据。`Scrapy`用途广泛,可以用于数据挖掘、监测和自动化测试。
本实训从简单到深入带你学习`Scrapy`框架,从抓取数据到数据分析逐步掌握~
(注意:需要一定的`Python`语言基础)

课程章节:

初识Scrapy爬虫

对Scrapy框架没有任何了解,甚至对爬虫都没有了解的同学,可以从本章开始接触爬虫爬取数据的方法。本章涉及部分MySQL数据库的知识,不熟悉的同学可以学习一下。

Scrapy爬虫进阶

学会了Scrapy框架的运行原理,我们可以尝试用它去爬取热门网站数据。

数据分析

数据我们都获取到了,就该试着分析一下,并用图表把他们展示出来了。本章涉及知识点还有MongoDB的使用和Pandas分析数据的方法,同学们都了解一下更利于学习。