正文

火车头采集器获取图片设置（火车头采集器获取图片设置方法）

发布时间：2023-05-30 17:08:42 稿源：创意岭阅读： 93

大家好！今天让创意岭的小编来大家介绍下关于火车头采集器获取图片设置的问题，以下是小编对此问题的归纳整理，让我们一起来看看吧。

开始之前先推荐一个非常厉害的Ai人工智能工具，一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等

只需要输入关键词，就能返回你想要的内容，有小程序、在线网页版、PC客户端和批量生成器

问友Ai官网：https://ai.de1919.com。

本文目录:

如何写火车头采集器的采集规则，采集页面上图片内的文字？
火车头采集器怎么采集今日头条文章？
火车头采集器提取图片路径的问题
火车头采集器为什么有些图片采集不了，怎么设置！
火车头采集器怎么用？

火车头采集器获取图片设置（火车头采集器获取图片设置方法）

如何写火车头采集器的采集规则，采集页面上图片内的文字？

不得不说火车头是有一定用处，但是个人觉得不怎么好用，光是写那些采集规则，设定什么的就一大堆不明不白的东西。拿钱购买嘛，一开始那客服还很热情的为你解答，一交完钱买下来了，写规则，好了，有问题要找客服解决，结果一拖再拖，弄了一个多月还没弄好，整个网站的工作进程全拖慢了，还不如自己辛苦点自己手动写文章，还采集啥啊~
言归正传，火车头使用：新建站点—>新建任务—>填写你要采集的网站文章列表—>点下面的开始测试网址—>如果有采集到很多文章，看各个地址相同部分（如system/2012/03/07），点返回修改，把system/2012/03/07这部分加到“文章内容必须包含”那里，再测试一下，就可以采集到3月7日的文章地址了—>前面准备好网址后接下来就是第二步的采集内容规则了，点第二步，设定标签，一般采集包括标题<title></title>、关键字<meta name=keyword...>、内容<div>...</div>，这些设置从你要采集的网站代码上可以找到相应的——>采集页面上的图片，在第四步，“文件保存及高级设置”，选择所有文件本地保存文件夹（这里是从页面下载图片存放的位置），然后下面有个FTP同步文件上传的，填好服务器、用户名、密码什么的，文件上传根目录就是你网站服务器放置图片的文件夹位置，你可以在服务器新建一个文件夹试试看，OK！到此为止，不过有一些网站写了反采集代码，有可能会被封IP，整体来说，个人不提倡使用火车头采集器，还不如个人手动来得实在，就算一天少发点也行，只要保证每天更新量、伪原创和原创，一样有很大效果。

火车头采集器怎么采集今日头条文章？

第一步采集网址，下载好火车头采集器后打开，新建一个任务，任务名随意。把需要采集的网站文章列表页网址添加到起始网址。从图中看出该列表页有34页，每页有N篇文章。
2
列表页会一级网址，添加多级网址获取，从而获取二级网址（文章页网址）
设置列表分页获取，3个地方分别是：分页源代码前面和后面还有中间位置。这一步用于获取列表页面链接，因为有34个列表页面。设置完保存。
网址获取选项，这一步用于获取列表页上面文章页的链接，根据自己需要设置需要截取的部分和根据网址的结构设置包含与不包含某些字符。为空即没限制，设置完保存。
设置好链接采集规则后，可以测试网址，看测试结果调整规则。看图可以看到采集链接规则从起始链接到全面列表页再到列表页上的文章页链接都已经成功采集。
第二步是采集内容，首先修改标题规则，在页面源代码里面找到标题的代码，把标题前后代码负责过去截取出标题。保存。
修改内容采集规则，跟标题规则差不多，也是源代码里面找到内容的前后代码。这里内容会有一些其他html标签，所以得添加一个html标签排除的规则。
完成后，测试看一下结果，从测试结果来调试规则，直到测试结果是自己想要的内容为止。
第三步是采集导出。前面1、2两步把规则设置好，最后就要把文章导出了。先做一个导出的模版。
然后选择方式二,把每一篇文章都分别记录到一个txt文本,保存位置自己选择,模板选择刚刚做好的导出模版.保存的文件名用文章标题为命名。其他默认，保存。
把采集网址，采集内容，发布3个选项框都勾选，然后开始采集。完成后文本就自动生成在刚刚保存的文件夹里面了。
火车头采集器采集文章教程到此就完成了，由于每个网站都是不一样的，所以这里只能用一个网站演示，只是一个方法思路，自己采集文章还需要灵活变通。追问

这样复杂粘贴有意思吗？

火车头采集器提取图片路径的问题

现在你解决了这个问题了吗，我现在也是遇到图片路径问题，我遇到的问题是下载到本地文件路径不对，

写好的路径是src="/d/file/31/4ile/29037c1219d39b584f3ee5c14639669a.jpg”，结果图片保存在/d/file/文件，而不是在/d/file/31/4ile/文件里。

火车头采集器获取图片设置（火车头采集器获取图片设置方法）