郑州seo

郑州网站优化知识检索

SEO学习

请联系我

地址:

河南郑州

微信:

1101525132

Q群:

853094090
seo百科

>>当前位置:主页 > seo百科 >

怎么确定百度蜘蛛真假_为什么蜘蛛抓取不收录

文章来源:郑州seo 添加时间:2019/06/16

分析日志是seo必备的职业技能之一,目的主要是为了观察搜索引擎蜘蛛对网站的抓取是否正常。前几天,一个学员问了我一个问题,为什么日志显示蜘蛛来的次数也不少,抓取的也不少。但是网站为什么没有收录?针对这个问题,我们需要先确定是不是真的百度蜘蛛,然后才能分析不收录的原因。
以光年seo为例,光年seo作为一款日志分析工具,深受网站站长欢迎。但是里面的百度蜘蛛有的却不是真的。
一些工具可以模仿百度蜘蛛,采集你的网站。所以,站长们一定要仔细甄别。下面郑州小辉seo给大家分享两个辨别百度蜘蛛的方法:
一、DNS反查IP
以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup 加你要差的IP地址,按enter 判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。


 

 
二、百度蜘蛛IP反查工具
需要的可以找我获取。
确定不是搜索引擎的蜘蛛,可以屏蔽掉,(至于怎么屏蔽,大家可以继续关注我,会在下篇为大家介绍)节约空间,为真正的搜索引擎蜘蛛让路。增加抓取网站页面的机会,另一方面网站质量也要好好做。
以上就是怎么确定是不是真的百度蜘蛛?蜘蛛抓取不收录是怎么回事?的全部内容了。懂seo更懂你的需求,欢迎大家继续关注小辉seo。
附百度蜘蛛IP及作用(搜集于互联网,大家可以参考):
百度蜘蛛 功能说明
60.172.229.61 蜘蛛来访,准备抓取网页内容
61.129.45.72 蜘蛛来访,准备抓取网页内容
61.135.162.* 蜘蛛来访,准备抓取网页内容
61.135.165.134 百度竞价蜘蛛
117.34.74.66 百度竞价蜘蛛
118.122.188.194 百度竞价蜘蛛
119.63.196.9 百度竞价蜘蛛
125.39.78.185 百度竞价蜘蛛
61.135.186.* 百度联盟蜘蛛、百度统计蜘蛛
61.147.98.146 站长工具模拟百度蜘蛛
61.188.39.16 站长工具模拟百度蜘蛛
113.98.254.245 站长工具模拟百度蜘蛛
117.21.220.245 站长工具模拟百度蜘蛛
117.28.255.42 站长工具模拟百度蜘蛛
124.248.34.52 站长工具模拟百度蜘蛛
125.90.88.* 站长工具模拟百度蜘蛛
119.147.114.213 站长工具模拟百度蜘蛛
121.10.141.* 站长工具模拟百度蜘蛛
123.15.**.** 百度图片蜘蛛
123.125.71.* 抓取网站内页收录,质量不高,暂时不会放出来
159.226.50.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.* 考察蜘蛛(很大可能是降权蜘蛛)
180.76.5.87 考察蜘蛛(很大可能是降权蜘蛛)
220.181.158.107 考察蜘蛛(很大可能是降权蜘蛛)
183.91.40.144 新站不正常情况下的蜘蛛
203.208.60.* 新站不正常情况下的蜘蛛
210.72.225.* 打酱油的百度蜘蛛
123.125.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
218.30.118.102 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
220.181.68.* 如果发现下面这几个ip段每天只增不减的话,那就很危险了,
很有可能会进入沙盒或者有被K站的现象。
123.125.66.* 代表百度蜘蛛IP来过了,准备抓取你网站上的东西!
220.181.7.*
121.14.89.* 百度蜘蛛作为度过新站考察期的一个ip段
220.181.108.95 此ip段爬过的文章或首页正常情况下基本在24小时都会放出来
220.181.108.92 此ip段爬过的文章或首页正常情况下基本在25小时都会放出来
220.181.108.91 此ip段爬过的文章或首页正常情况下基本在26小时都会放出来
220.181.108.75 此ip段爬过的文章或首页正常情况下基本在27小时都会放出来
123.125.71.95 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.97 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.181.108.77 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
123.125.71.106 抓取内页收录的,权重相对比较低,爬过此段的内页文章不会很快被放出来,
因它怀疑不是原创文章或者怀疑是采集来的文章。
220.181.108.89 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 0就代表网站未更新
220.181.108.94 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 1就代表网站未更新
220.181.108.97 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 2就代表网站未更新
220.181.108.80 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 3就代表网站未更新
220.181.108.77 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 4就代表网站未更新
220.181.108.83 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 5就代表网站未更新
220.181.108.86 专用抓取网站首页的,也属于权重段,
一般返回代码304 0 6就代表网站未更新

上一篇:郑州seo学习哪家好?

下一篇:seo可以自学吗_学seo要多久

返回