我们采集内容的时候经常遇到内容里面有图片的,或者我们就采集图片并下载。采集的图片格式有2种:

1,带html标签的 img,这样的情况我们只要在下载设置那里勾选“图片下载”;

2,不带html标签的就单单是采集图片地址,这样的情况在下载设置那里我们要勾选“探测文件下载”。

上面2种情况下,我们要下载图片,下载选项那里设置是不一样的如下图:

clip_image004

图片标签和缩略图标签采集的都是图片。如果我们要下载设置是不一样的如下图:

clip_image006

clip_image008

测试截图如下:

clip_image010

成功下载了。

原因就是采集器只会把包含<img 标签的看成图片文件,勾选下载图片就可以了,采集的是图片地址的就会当成其他文件下载,就需要勾选探测文件下载。

上一篇:火车头教程3:列表缩略图及列表页标签采集

下一篇:火车头教程5:一个简单的文章采集实例