无法在这个位置找到: head2.htm
当前位置: 建站首页 > 新闻 > 产业新闻 >

大批量检验被百度搜索收录的死链的方式

时间:2021-03-27 14:28来源:未知 作者:jianzhan 点击:
短视頻,自新闻媒体,达人种草1站服务前段時间服务器被侵入,挂了许多博彩之类的黑页,并且所有被百度搜索收录。如今把系统漏洞补好了,但删掉黑页文档之后变成死链,要如何让

大批量检验被百度搜索收录的死链的方式


短视頻,自新闻媒体,达人种草1站服务

前段時间服务器被侵入,挂了许多博彩之类的黑页,并且所有被百度搜索收录。

如今把系统漏洞补好了,但删掉黑页文档之后变成死链,要如何让百度搜索删掉收录呢?

在网络上找了1下,好像仅有检验网站地址是不是被收录的专用工具,而沒有检验收录的是否死链的专用工具。

自身理清了下思路,找方法找出了全部被收录的死链,并写下这篇文章内容。

不知道道有木有更好的方式,大伙儿能够告知我,先共享给大伙儿,假如有高手请忽略或告知我更好的方式,1起学习培训沟通交流吧。

下面实例教程刚开始

先在百度搜索寻找xenu能够仿真模拟爬虫抓取全部联接,我免费下载了个汉化版。

大家先用这个专用工具查寻全部被收录的网页页面。

开启手机软件,填入简版百度搜索site网址,之因此用简版是能够降低连接查寻時间和內容。(请把xxx.biz换为你的网站地址)

 

等候检验进行。

 

点一下导出来为制表符隔开的文档。

 

导出来的文档,大家能够看到文件格式是:网站地址+空格+情况码

 

那末写1个正则表达式,把必须的网站地址提取下来就行,例如baidu下的404网页页面便是

/:\/\/baidu(.*?)\s404/i

(以开始,\s意味着空格,404,/i意味着配对尺寸写)

不容易正则表达式如何办?

 

以便便捷大伙儿,我把文档作了改动,大伙儿要是把head改为漂亮性开始,state改为情况码就行,file改为导出来的文档相对路径就行。

head如何改,举个事例,

你的网站是,那末你就写

你的网站是,那末你就写

把正则表达式写入php,在php自然环境下运作get.php。那末結果就出来了。

 

这时候你只必须全选,拷贝到1个txt文档,提交到网站室内空间,再到百度搜索站长服务平台死链递交填入文档相对路径就行便可以。

 

大家了解,思路是根据抓取找出全部被收录的连接,随后按标准列出来罢了。

这样的话,要是把开始键入的site网站地址改1下,还可以查寻别的检索模块的收录。

把正则表达式改1下,能够得到如题目等别的內容。在此就不11描述。

来源于:卢松松blog(手机微信/QQ号:),欢迎共享本文,转载请保存出处!


(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
无法在这个位置找到: ajaxfeedback.htm
栏目列表
推荐内容


扫描二维码分享到微信

在线咨询
联系电话

400-888-8866