新闻中心 网络推广 网站建设 优化推广

蓝天采集器采集多级网站规则如何设置?

时间:2023-12-02   来源:本站

如题,蓝天采集器要采集多层级的网页时,例如一些常见的模板站。模板站除了有列表页,详情介绍页,然后还有一个展示演示地址的DEMO页面,而DEMO页面里面又是框架调用了外部的链接。这种情况下如何使用蓝天集体器来采集呢?

其他的设置照常如采集普通网站一样设置,然后到内容起始页的时候我们这样来设置。如图:

首先,加多一个层级:

image.png

然后点开这个层级进行设置他的抓取列表内容。这里抓取的就是我们平时采集时的列表页,抓取有多少篇文章。

image.png


设置好之后,第二步:设置详情页中点击打开的DEMO网址获取地址。也就是详情页中的跳转地址。

image.png


列表设置就设置完了。现在是设置内容页。选择你想要获取的字段,可以从刚才的列表中获取,也可以说跳转后的内容页中获取。

image.png


设置完成,并保存,就可以进入采集发布了。是不是很简单呢?希望对您有所帮助。






新闻推荐
龙华网站建设多少钱?
龙华网站建设多少钱?

大家好,这里是黑马视觉,今天我们来聊聊在深圳建一个网站需要多少钱?龙华网站建设需要多少钱?从所周知,...

龙华外贸网站建设必需知道的四大注意事项
龙华外贸网站建设必需知道的四大注意事项

在深圳有很多外贸公司,他们已经不满足于通过其他平台来引流,于是他们都需要建设一个自己自己的外贸网站,...

宝塔防火墙导致无法引入JS
宝塔防火墙导致无法引入JS

在最新一版的宝塔NGINX免费防火墙中,有一条规则是:我们可以看到里面有:script,所以会导致在添加一些第三...

网站没有安装SSL证书了,但是谷歌浏览器依旧跳转到HTTPS,怎么处理?
网站没有安装SSL证书了,但是谷歌浏览器依旧跳转到HTTPS,怎么处...

假如你的网站之前安装了SSL证书,然后到期之后,你将你的网站SSL证书也删除了。但是在使用谷歌浏览器打开网...

Top