2,百度的搜索技术到底如何先进?
其实从上面的介绍我们就可以看到。
Google是按照网页级别(PageRank)来收录的,网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google则坚决不去收录。Baidu则采用的是来者不拒的原则,百度则不管三七二十一上来就抓整个站,对于网站内容不做分析就快速收录,公认的其爬虫数量非常庞大,如果你的ISP服务商对你有流量限制.那么,你就倒大霉了,你的流量全部被占掉了.
说白了,百度的搜索方法就是大量派出爬虫,大量收集尽可能快和尽可能多的搜集页面,这样一来大家就会发现,百度好像更新特别快,可是这样是以牺牲有效性为代价.大家可以做一个测试,随机抽取若干词语分别在google和百度里面搜索看看,还是那句老话:不怕不识货,就怕货比货.特别是在搜索专业性的资料的时候,百度的搜索基本上是胡扯.
其实从上面的介绍我们就可以看到。
Google是按照网页级别(PageRank)来收录的,网站有一定的网页级别,Google会快速收录的,而没有网页级别的网站,Google则坚决不去收录。Baidu则采用的是来者不拒的原则,百度则不管三七二十一上来就抓整个站,对于网站内容不做分析就快速收录,公认的其爬虫数量非常庞大,如果你的ISP服务商对你有流量限制.那么,你就倒大霉了,你的流量全部被占掉了.
说白了,百度的搜索方法就是大量派出爬虫,大量收集尽可能快和尽可能多的搜集页面,这样一来大家就会发现,百度好像更新特别快,可是这样是以牺牲有效性为代价.大家可以做一个测试,随机抽取若干词语分别在google和百度里面搜索看看,还是那句老话:不怕不识货,就怕货比货.特别是在搜索专业性的资料的时候,百度的搜索基本上是胡扯.