Google可否将抄袭内容排名高于原创?

抄袭内容排名高于原创

小博客最关心的问题之一是将其内容排在Google的搜索结果中。很难与所有巨大的megasites竞争主导结果,所以内容盗窃导致类似问题的想法是毁灭性的。

我想向你保证,这样的事情永远不会发生,但事实是,谷歌并不完美。让我们来谈谈这个问题,谷歌如何试图阻止它,以及如果它发生了什么你可以做什么。

被盗的内容
对于尽可能多的各种小型企业博客,同样有许多垃圾博客或精简博客。这些博客是由数十个私人网络制作的,用于销售反向链接,或者采用分层链接建设方案来增加一个黑帽营销商的资金网站。在大多数情况下,这些计划坚决反对Google政策,当Google将网站识别为垃圾网络的一部分时,他们通常会对网站进行取消索引。

由于这些网站往往是短命的,因此用营销人员支付或自己编写的内容构建它们是没有意义的。相反,他们只是插入他们的搜索查询并查找在Google的第 10 页或其他任何内容上发布的内容,并且只是窃取它。有时候,如果原来的主人是幸运的,那么黑帽会旋转内容以使其“独特”,尽管这并不总是保证谷歌不会将其识别为旋转。

Google上的被盗内容
您可以在此处阅读Google关于抓取内容的政策。具体来说,谷歌谈论以下网站:

复制并重新发布其他网站的内容,而不添加任何原始内容或值。
复制其他网站的内容,稍微修改,然后重新发布。
从其他站点重现内容源,而不向用户提供某种类型的独特组织或好处。
从其他网站嵌入视频,图像或其他媒体等内容,但没有实质性附加价值。
这就是指明什么是内容盗窃和不内容盗窃。

如果某个网站在有或没有归属的情况下从其他网站复制内容或图片,只要没有重要的附加值,就会被盗。
如果一个站点从另一个站点复制内容并将其旋转,那么如果它被识别,它仍然是盗窃的。
如果一个站点从另一个站点复制内容,但添加了正确的规范化和归属,那就不是盗窃,而是联合。
如果站点从其他站点复制内容但增加了额外的值,则更像是引用或聚合器。例如,我之前的一组项目符号是Google页面部分的逐字引用; 这不是盗窃,因为我正确归因于它,并明确表示这是一个引用。
所以要明确的是,如果你在雅虎发布一个客座帖子并将其发布到另一个网站,那么无论你是否在自己的网站上发布内容,谷歌都不会因此而惩罚任何人。如果您发布了一段内容,然后在spamblog.wordpress.com上找到它,那么Google更有可能介入垃圾博客并对其进行取消索引。

Google Scraped Content被盗内容可能会损害网站,但不会频繁。与流行的看法相反,对被盗内容的重复内容处罚几乎是闻所未闻的。真正的威胁来自被盗内容排名高于原始副本的时间。

当被盗内容超过原始内容时,内容生成的大部分流量将传递给小偷。原始版本在流量,潜在转换,声誉,名称识别以及运行博客和发布内容的所有其他好处方面都有所损失。如果这种情况发生得太频繁,它实际上会破坏较小博客的价值。显然,这对任何人都没有好处。

谷歌的做法
谷歌确实有一些算法部分可以帮助防止这种情况发生。

一般的想法是谷歌遵循内容的出版日期。如果您在1月1日发布了一段内容,并且其他人在4月4日复制了该内容,则Google会优先选择之前的副本。

这有点真实,但并非完全正确。由于多种原因,Google不信任您自己的发布日期。一方面,回溯一段内容非常容易,因此它似乎比原版更早发布。如果你只是明确地张贴出版日期,那就像盲目地相信街上一些随意的人告诉你他是总统。也许他是,但所有的迹象都指向谎言。

出版时间
还有约会后的内容。如果我在2015年写了一段内容然后在2017年更新,我可能会将发布日期更改为2017年,以反映我更新它的事实。如果有人在2016年窃取了内容,那么被盗版本将“更旧”,然后看起来好像是原版。当然,如果我显着改变内容,它就不再重要了,因为它不是直接副本,但它仍然可能是一个问题。

如果Google无法信任发布日期,他们会做什么?秘密在索引日期。谷歌首次在网上发现一段内容时进行了记录。如果他们发现其他地方发布的内容,他们仍然会相信他们首先发现的内容。

请求索引
当然,这并不是那么简单。谷歌没有什么比这更简单了。他们在列表中添加了其他因素。也许Google首先将更活跃的垃圾博客编入索引; 然后怎样呢?好吧,也许原始内容是在垃圾博客发布之前在社交媒体上分享的。如果旧链接指向他们找到的第二个内容,他们可能会选择更新日期。当然,较旧的链接必须是有信誉的,而不仅仅是垃圾邮件发送者可能编辑的有利于他们的东西。

因此,在99%的情况下,内容盗窃由Google的算法正确处理。然而,这不是100%,实际上John Mueller确认存在“边缘案例”,其中被盗内容可能超出原始内容。有时候它是针对没有人使用的利基关键词,有时候是因为引用的片段,有时候是因为不正当的联合。与其他内容被意外重复的边缘情况相结合,您最终会遇到棘手的情况。

如果发生在您身上该怎么办
那么如果你的内容被盗,会发生什么呢?现在这个内容超出了自己的版本?你能为这个做什么?我提供了一些选择和替代方案。

首先,您需要确定是否有任何被盗内容。如果您发现您的内容在一个网站上被删除并重新发布,请执行此步骤; 那里可能会有更多。我建议使用Copyscape。它,或任何其他主要的抄袭检查员,将能够扫描和搜索您的内容的副本。只需插入一个片段或整块 – 或者如果您为Copyscape付费,您的整个网站 – 并让它扫描。

Copyscape主页
如果您不想使用第三方工具,则可以运行Google搜索内容的摘要。至少有一个完整句子的冗长引用是不可能被引用的,并且足够独特,不可能在别处创建,这很重要。如果你使用过于通用的句子,你会发现其他人只是写了同样的东西。

如果您发现正在复制内容的域,请将其写下来然后进行分析。

其次,你需要确保它实际上不是你的错。这是分析的用武之地。在某些情况下,您可能无意中复制了内容。过去常常会出现产品描述; 商店会复制制造商的产品说明,导致重复内容。

您也可能提交了一篇帖子作为客座帖子发布,并且没有回复任何内容,因此您可以自行发布。最初的网站可能已经发布了它,也许是后来发布的,而这只是导致重复的沟通失败。这个至少相当容易理清。

在其他情况下,它可能是一个刮刀或垃圾邮件发送者,如上所述。它也可能是不正当的联合。如果您在允许在网络中的其他网站上进行联合的位置发布内容,则他们有合法权利重新发布该内容。但是,他们应该真正实现规范化的正确使用。理想的规范化将指向您的内容作为原始内容。“副本”可能仍然超过你的,但至少你的网站得到了它的信任。

自动博客刮痧示例
其他可能的原因只是简单的盗窃。自由撰稿人可以提交仅复制现有内容的作业。尽管重复检查提交的内容是多么容易,但仍然会发生这种情况。这就是为什么如果你从一个你不了解或完全信任的作家那里接受作品,你应该在发布之前通过像Copyscape这样的内容来运行内容。作者也可能只是在不止一个地方发表他们的作品,这在功能上是相同的。

此时,您应该开始记录您的内容。复制您的内容和被盗内容的链接,但也会截取屏幕截图,以防您最终陷入法律纠纷,垃圾邮件发送者试图隐藏证据。深入了解WHOIS信息,了解您可以提出的建议。有些黑帽子是愚蠢到足以将他们的真实姓名附加到他们的非法交易上,这使得追求它们变得容易。所有这些都可以通过网络托管服务商,谷歌或律师用于您的案件。

第三,您可以联系内容的所有者并要求正确的重定向或规范化。可能无意中发布被盗内容的高质量网站很可能会做出积极的回应。一旦您证明您拥有并首先发布了内容,他们可能会提供归因和规范化,或删除内容。在这两种情况下,负责盗窃的人都可能被解雇。如果您想破坏垃圾邮件发送者和小偷的“职业”,那么可能值得联系作者在其他地方调查他们的工作。

但在很多情况下,内容的所有者是垃圾邮件发送者,他们只会忽略你。毕竟,如果你放弃这件事,他们就不必做任何事情。也许忽略了这个问题,它就会消失。就此而言,他们并不关心这些网站,因为它们的保质期通常很短,不值得担心。

如果与所有者联系不起作用,您可以直接与内容主持人联系。例如,如果WordPress.com托管内容,您可以通过其报告表单联系WordPress管理员。WordPress和许多其他网络主机不希望被标记为阴暗网站所有者或黑帽内容的避风港 – 它反映了对他们的负面影响并伤害了他们的业务 – 因此他们将在整个页面或网站上删除调查。

如果网络托管服务商忽略了您或拒绝了您的请求,您可以直接向Google报告。事实上,您可能应该立即与其他选项一起使用。Google允许您通过此表单报告网络垃圾邮件,如果您在网站站长搜索控制台中遇到重复内容处罚,则可以提交重新审核请求以及被盗内容的证据。

Google内容删除
如果所有这些都失败了,您可以考虑采取正式的法律行动。我建议立即采取法律行动的原因是因为许多公司只是律师而不是立即采取行动。什么曾经是一个简单的“哦抱歉,我们会把它取下来”因为冗长的法律交流。但是,如果您需要提交版权声明,您可以在版权律师的帮助下进行。这肯定会解决你的问题。