搜索引擎已逐渐成为人们日常生活中必不可少的工具,而且网民对搜索引擎的依赖还在不断增强。互联网上巨大的利润和搜索引擎的窗口地,驱使很多网站管理者和网页制作者想方设法使其站点和页面变得有名,以期待用户在进行相关内容查询时,他们的网页排在结果的前列。对于商业网站而言,就某些查询占据靠前的排序,会给网站带来流量的大幅增加,流量的变大意味着更多的交易。
利益的驱使下, 搜索引擎优化 (Search Engine Optimization, SEO)行业应运而生。所谓搜索引擎优化,就是针对各种搜索引擎的检索特点,让网站建设和网页设计的基本要素适合搜索引擎的检索原则(即搜索引擎友好),从而获得搜索引擎收录并在检索结果中排名靠前,进一步提高网站访问量,最终提升网站的销售能力和宣传能力的技术。追求高排名是搜索引擎优化师们的目标,然而,短期内大幅提高网站排名是一件困难的事情,一个页面一般需要经过长期的发展过程,才能变得“知名”,特别是在这个搜索引擎占主导地位的时代。很多不道德的搜索引擎优化人员已经不满足于正当的优化过程,而是寻求“捷径”,采用一些欺骗搜索引擎的手段,使得Web页面在检索结果中的排名高于实际应得排名,这种行为就叫做搜索引擎作弊(Search Engine Spam)。著名的“SEO竞赛”被多次主办,它鼓励参赛者提高其网站在某些关键词上的Google、Yahoo和MSN排名。结果表明,几乎所有的参赛者使用的方法都与Web作弊有着密切关联,历届的搜索引擎优化大赛更像是公开的Web作弊竞赛。
Web作弊,又称搜索引擎作弊(Web Spam),是指采用不道德的手段迷惑搜索引擎排序算法,以获得虚假排名的行为。Web作弊与互联网垃圾不是同一概念, 作弊网页不一定是垃圾网页; 反过来,垃圾网站往往采用作弊技术。根据表现形式不同,搜索引擎作弊可以大体分为内容作弊(Content Spam)、链接作弊(Link Spam)和隐藏作弊(Hiding Spam)三类。
内容作弊指作弊网站利用内容信息欺骗搜索引擎,提高某些页面的查询\相关性",这些作弊方式多是针对文本信息检索中的TFIDF等模型。内容作弊是一种简单、易操作的作弊模式,作弊者在网页中注入大量的热门关键词,有时甚至会加入整个词典,从而可以匹配大量的查询。链接作弊是指作弊网站构造出一些网络链接结构,利用HITS、PageRank等链接分析排序算法,以获得高的网站排名的行为。隐藏作弊指作弊者利用各种隐蔽技术,为用户和搜索引擎提供不同的数据。隐藏作弊是作弊者常用的技术之一,利益如此诱人,以至于一些知名的大企业也跃跃欲试。国内最大的网址导航网站HAO123、宝马公司的德国网站都曾因为使用这种技术而遭到Google的封杀。
作弊行为严重影响了人们正常使用搜索引擎,如果搜索引擎不能解决好这个问题,受害的是广大网民,并最终伤害搜索引擎产业的未来。搜索引擎作弊已经成为互联网搜索面临的最严峻的挑战之一。如果不采取行动,搜索引擎的排序结果将会被严重扭曲,用户无法获得想要的信息,从而严重恶化了用户的搜索体验,这将成为互联网搜索的巨大灾难。
搜索引擎认可那些可以提升网站质量的 SEO,Google、Yahoo、Bing 也经常积极地参与 SEO 的相关活动。在以搜索引擎营销和SEO行业交流为主的全球搜索引擎战略大会,得到了整个搜索业界的支持,SEO 专家也有机会同搜索引擎进行面对面的沟通。对于“少数不道德的SEO”搜索引擎则会采取一定的惩罚手段,而到底什么是“不道德的 SEO(Web作弊)”,尽管搜索引擎缺乏较统一的判定手段,但以下行为可被明确的认为是作弊:隐藏文本和链接、关键词堆积、Cloaking、链接联盟、网页重定向等。
搜索引擎优化避免被当作作弊封杀的最有效的途径就是提供给搜索引擎的内容切实的反应网站所提供的信息,不要参与旨在提高您的网站排名或PageRank的链接方案,尤其要避免链接到违禁的网站或“恶邻”,为互联网提供有意义、有价值的信息。搜索引擎作弊与反作弊之间的斗争像永无止境的军备竞赛,也变相推动着互联网搜索行业的不断创新和发展,影响着人们的网上生活。随着模式识别、机器学习等技术的发展与成熟,我们相信作弊行为将无处遁藏,搜索排序结果也必将会更加的合理。
- 2010-812
-
原创文章如转载,请注明:转载自小付博客 [ http://www.langzui.com/ ]
本文链接地址:http://www.langzui.com/post/253.html


1楼 junofeeng
Post:2010-8-12 18:54:55
2楼 PTFE
Post:2010-8-12 23:35:00