纯代码实现主题记录搜索引擎蜘蛛抓取时间

虫子君
虫子君
虫子君
560
文章
260
评论
2019年12月5日23:48:10 评论 199 1983字阅读6分36秒

对于网站的内容是否能够及时的收录,都是我们站长每天都在关注的东西,毕竟每天产出的东西有限,所更加的关注自己写的内容是否能够讨的百度蜘蛛的欢心,好及时收录自己的网页,毕竟早一天收录,这样获得流量的可能性就会更多一点,那样的话,以后变现的成本也会变得更低。

对于虫子君这样的懒人来说,三天打鱼两天晒网的人来说,是否收录都无关紧要,我是佛系站长啊。

纯代码实现主题记录搜索引擎蜘蛛抓取时间

百度蜘蛛

有时候当我们不知道蜘蛛什么时候来过我们的网站的时候,只能够通过一遍又一遍的向百度提交自己网站最近产生的新鲜内容。但是又害怕这样会让百度的蜘蛛讨厌我们的网站,总之那种感觉啊,不是太好。

今天带来的这个方法,是网上盛传已久的一个办法,中午在上班的时候,偶然中看到的一个只需要利用代码就可以获得搜索引擎的蜘蛛什么时候来抓取我们网站的时间,和记录。

测试环境
网站程序主题时间
WordPress 5.3中文版春哥柒比贰主题2019年12月5号

1、在网站根目录新建“robotslogs.txt”

您可以选择在本地新建一个文件,并命名为“robotslogs.txt”然后,上传到你的网站根目录。这种适用于虚拟机用户,因为无法在服务器新建文件,且太麻烦,所以推荐本地建立好了以后直接上传。(上传到wp-admin同级目录)。

上传上去以后,默认txt文件仅有“554”的权限,由于我们需要利用主题的功能在文本文件当中记录数据,所以这里需要修改一下“robotslogs.txt”的读写权限。

推荐大写直接改成“777权限”或者“775权限”

2、将以下代码粘贴到你的主题中的function.php文件当中。

以下代码的实现过程,是来自一款插件,暂时忘记名字,以后记起来了,再补上去。

你可以直接在WordPress的后台当中,找到外观——主题编辑器,然后点击进去。

这时候你可以看到当前主题所有的文件都罗列在其中。

有的主题默认关闭了,编辑主题的功能,所以这里大家可以在我的博客搜索如何关闭主题编辑,我记得以前写了一篇关于如果禁止主题编辑的文章。

因为禁用的代码几乎相同,所以可以再一定程度上方便你查找文件。

最后将下方的代码粘贴到主题function.php的最末端,保存即可。完成以后,一般24小时候,就可以看到你“robotslogs.txt”当中已经满是数据的了。

//wordpress非插件记录百度蜘蛛信息  
//来源:https://chonzi.com
function get_naps_bot(){  
    $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  
    if (strpos($useragent, 'googlebot') !== false){  
        return 'Googlebot';  
    }  
    if (strpos($useragent, 'msnbot') !== false){  
        return 'MSNbot';  
    }  
    if (strpos($useragent, 'slurp') !== false){  
        return 'Yahoobot';  
    }  
    if (strpos($useragent, 'baiduspider') !== false){  
        return 'Baiduspider';  
    }  
    if (strpos($useragent, 'sohu-search') !== false){  
        return 'Sohubot';  
    }  
    if (strpos($useragent, 'lycos') !== false){  
        return 'Lycos';  
    }  
    if (strpos($useragent, 'robozilla') !== false){  
        return 'Robozilla';  
    }  
    return false;  
}  
function nowtime(){  
    date_default_timezone_set('Asia/Shanghai');  
    $date=date("Y-m-d.G:i:s");  
    return $date;  
}  
$searchbot = get_naps_bot();  
if ($searchbot) {  
    $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  
    $url=$_SERVER['HTTP_REFERER'];  
    $file="robotslogs.txt";  
    $time=nowtime();  
    $data=fopen($file,"a");  
    $PR="$_SERVER[REQUEST_URI]";  
    fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");  
    fclose($data);  
}
展开全文
  • 您有好资源需要让广大网友一起享用吗?可以是您的主题,也可以是插件,欢迎来投稿!
  • 这里是我的博客,亦是您分享插件或主题的地方,虫子君只专注WordPress,以及自己的工作。这里欢迎你来投稿。

您必须才能发表评论!