搜索引擎搜狗不收录的问题排查

作者

我的这个网站(森林的博客),主要是用来记录一些学习笔记。基本都是原创文章。但是发现一个问题,就是搜狗不收录。网站本身有两三年了。感觉应该是哪里有问题。

平时也遇到过一些企业网站,知道搜狗收录的确实比百度慢,有时候慢的还很多。今天site: liuhaolin.com 发现收录了一个 blog.liuhaolin.com的页面,我似乎想起了了,这个页面是好多年前的页面。当时还不太了解域名怎么使用,就随倒腾的一个博客。后来就忘记了。怀疑是不是这个原因导致了。

之所以这样怀疑,是不是搜狗把这个blog.liuhaolin.com 当做了主域名。blog.liuhaolin.com 301后最终的 www.liuhaolin.com 还是200, 是不是由于什么原因一直当做正常的页面了。

curl -I -L https://blog.liuhaolin.com
HTTP/1.1 301 Moved Permanently
Server: nginx
Date: Wed, 23 Sep 2020 03:16:25 GMT
Content-Type: text/html
Connection: keep-alive
Location: https://www.liuhaolin.com/
Strict-Transport-Security: max-age=31536000; includeSubDomains

HTTP/1.1 200 OK
Server: nginx
Date: Wed, 23 Sep 2020 03:16:25 GMT
Content-Type: text/html; charset=UTF-8
Connection: keep-alive
X-Powered-By: PHP/7.2.12
Strict-Transport-Security: max-age=31536000; includeSubDomains

做个测试,把blog.liuhaolin.com 的页面返回成404,观察一下。

[root@localhost ~]# curl -LI  http://blog.liuhaolin.com
HTTP/1.1 404 Not Found
Server: nginx
Date: Wed, 23 Sep 2020 03:34:21 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive

[root@localhost ~]# curl -LI  https://blog.liuhaolin.com
HTTP/1.1 404 Not Found
Server: nginx
Date: Wed, 23 Sep 2020 03:34:30 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Strict-Transport-Security: max-age=31536000; includeSubDomains

之后观察一段时间看看,有没有用。

回复

邮箱地址不会被公开。