HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    火车头采集规则怎么写(火车头采集规则怎么写的)

    发布时间:2023-05-27 16:14:40     稿源: 创意岭    阅读: 122        

    大家好!今天让创意岭的小编来大家介绍下关于火车头采集规则怎么写的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    只需要输入关键词,就能返回你想要的内容,有小程序、在线网页版、PC客户端和批量生成器kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    官网:https://ai.de1919.comkAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    本文目录:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    火车头采集规则怎么写(火车头采集规则怎么写的)kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    火车头如何采集还有缩略图的文章呢kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    1、首先在采集列表页的源码中将带有缩略图的那部分源码复制下来,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    2、查看网站的源码,找到这行代码,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司


    kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    3、打开火车头,进入采集网址规则—添加多级网址采集规则,选中手动填写链接地址规则,并将第二步骤中选中的代码粘贴进去,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    4、将代码进行如下修改:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    5、改好后保存并进行采集测试,如图所示kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    6、然后再在采集内容规则里进行修改,选中“缩略图”标签,打开,进行内容替换,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    7、然后点击文件下载,选中下载图片,并填好缩略图保存路径及命名方式,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    8、在“文件保存及部分高级设置”里设定缩略图的保存盘符及其前缀,我设定为桌面,前缀为“./”,如图:kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司


    9、我们保存后测试一下,一起顺利,缩略图顺利采集下来了
    kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    追问

    是最近版本的吗?kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    火车头采集规则怎么写(火车头采集规则怎么写的)kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    关于火车头正则表达式采集数据kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    正确的正则:
    document\.write\('<a\s+href="(?<content>([^\/"]*\/)*[^"]*\.jpg)"\s+id="jqzoomMain"\s+class="jqlightbox">

    你的正则的错误在于:
    1. (?<content>.*\/+.*\.jpg)中.*使用了贪婪匹配,匹配了所有的内容,而不光是/前的内容,正确的写法是[^/"]所有非/非"的内容。
    2. (?<content>.*\/+.*\.jpg)中\/+加号修饰的是\/,而非.*\/也就是说只有斜杠可以重复N次,正确的写法是([^/"]*\/)+追问

    感谢您的回答,根据你写的这个正则所匹配到的是整个路径包括图片名称也在内如a/b/c/d/123.jpg 而我只需要他的路径即 a/b/c/d 我重写了一个document\.write\('(.*\/)+).*\.jpg"\s+id="jqzoomMain"\s+class="jqlightbox"> 这个就可以匹配到a/b/c/d 多谢你的提醒!kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    如何写火车头采集器的采集规则,采集页面上图片内的文字?kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    不得不说火车头是有一定用处,但是个人觉得不怎么好用,光是写那些采集规则,设定什么的就一大堆不明不白的东西。拿钱购买嘛,一开始那客服还很热情的为你解答,一交完钱买下来了,写规则,好了,有问题要找客服解决,结果一拖再拖,弄了一个多月还没弄好,整个网站的工作进程全拖慢了,还不如自己辛苦点自己手动写文章,还采集啥啊~
    言归正传,火车头使用:新建站点—>新建任务—>填写你要采集的网站文章列表—>点下面的开始测试网址—>如果有采集到很多文章,看各个地址相同部分(如system/2012/03/07),点返回修改,把system/2012/03/07这部分加到“文章内容必须包含”那里,再测试一下,就可以采集到3月7日的文章地址了—>前面准备好网址后接下来就是第二步的采集内容规则了,点第二步,设定标签,一般采集包括标题<title></title>、关键字<meta name=keyword...>、内容<div>...</div>,这些设置从你要采集的网站代码上可以找到相应的——>采集页面上的图片,在第四步,“文件保存及高级设置”,选择所有文件本地保存文件夹(这里是从页面下载图片存放的位置),然后下面有个FTP同步文件上传的,填好服务器、用户名、密码什么的,文件上传根目录就是你网站服务器放置图片的文件夹位置,你可以在服务器新建一个文件夹试试看,OK!到此为止,不过有一些网站写了反采集代码,有可能会被封IP,整体来说,个人不提倡使用火车头采集器,还不如个人手动来得实在,就算一天少发点也行,只要保证每天更新量、伪原创和原创,一样有很大效果。

    以上就是关于火车头采集规则怎么写相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。kAG创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司


    推荐阅读:

    杭州火车东站附近商场(杭州火车东站附近商场叫什么)

    火车采集器简介作用500字(火车采集器简介作用500字怎么写)

    建德至杭州火车时刻表(建德至杭州火车时刻表和票价)

    济南公司vi设计全套(济南vi设计公司价格表)

    夏河网店代运营公司哪家好(夏河网店代运营公司哪家好一点)