更改

百度百科Scrapy

删除5字节, 2020年1月14日 (二) 03:41

→‎更多

=更多=

你也看到了如何使用Scrapy从一个网站提取和存储数据，实际上，Scrapy提供了许多强大的特性，让它更容易和高效的抓取：[1]

1>内建 selecting and extracting，支持从HTML，XML提取数据<~~td/~~br>2>内建Item Loaders，支持数据清洗和过滤消毒，使用预定义的一个过滤器集合，可以在所有蜘蛛间公用<~~/td~~br>3>内建多格式generating feed exports支持(JSON， CSV， XML)，可以在后端存储为多种方式(FTP， S3， local filesystem)<~~/dr~~br>4>针对抓取对象，具有自动图像(或者任何其他媒体)下载automatically downloading images的管道线<~~/dr~~br>5>支持扩展抓取extending Scrap，使用signals来自定义插入函数或者定义好的API(middlewares， extensions， and pipelines)<~~/dr~~br>

6>大范围的内建中间件和扩展，基于但不限于cookies and session handling

HTTP compression

明华

管理员

23,882

个编辑

更改

百度百科Scrapy

导航菜单

个人工具

名字空间

变种

视图

更多

搜索

导航

站群链接

工具