Anonim

我已经大声朗读了,但恐怕它会唤醒Azathoth。

您是否曾经想过,什么黑色的,扭曲的头脑梦到了验证码呢? 您是否曾经问过,这种可怕的反垃圾邮件措施是由什么样的触角深度产生的?为什么对所有正确和善良的人来说,它必须如此难以辨认? 这个问题实际上是在前几天发生的,因此我决定进行一些研究。

我们将从技术的简短历史开始。

类似于CAPTCHA的任何东西的首次使用都可以追溯到1997年,当时搜索平台Alta-Vista寻求阻止向其引擎自动提交URL的方法。 看到,尽管向组织提交URL的能力无疑帮助他们拓宽了视野并增强了搜索范围,但仍有许多不道德的人将旨在将URL只是向其服务器垃圾邮件的机器人扔在一起,这是一种不合理的努力,它会扭曲引擎排名算法对他们有利。

Alta Vista的首席科学家Andrei Broder相信他提出了一个解决方案,方法是开发一种算法,该算法随机生成打印文本的图像,这是CAPTCHA技术的最早实例。 该算法由卡内基梅隆大学的研究人员于2000年完善,他将该技术称为CAPTCHA技术,该技术是完全自动化的公共Turing测试来告诉计算机和人类的区别。 是的…首字母缩写词并不是他们真正的意思。

无论如何,计算机无法识别它,但是人类仍然具有读取消息和键入消息的完全能力。该技术迅速流行,并很快在Internet上传播开来。 2001年4月,专利权授予了Broder及其团队。

暂时,这对专业程序员和垃圾邮件代理人之间的军备竞赛是致命的打击。

这就是为什么现代CAPTCHAS经常难以辨认和几乎不可能阅读的原因,而这也是垃圾邮件制造者花很长时间找到解决该技术的方法的原因。 他们中的许多人只是为了强行闯入薄弱的安全区域,但他们中的许多人甚至发现了更聪明的水龙头,它们能够在图像中识别字符。

没有人说垃圾邮件发送者是愚蠢的,恰恰相反,垃圾邮件发送者的精髓与最聪明的专业人员一样聪明。

卡内基梅隆大学再次提出了一项新技术,即名为GIMPY CAPTCHA的新技术,该技术现在使单词略微变形和扭曲,经常使它们在奇怪的背景下出现。 它通过从字典中选择随机单词来工作-用户必须正确识别至少其中几个单词才能通过测试并到达他们想要去的任何地方。

至此,计算机实际上比人类更擅长识别单个字符。

再一次,该技术最终被证明是无效的,因为应用程序开发得相当快,使计算机可以将图像“分段”成多个部分,识别各个字符,然后将它们拼成单词。 军备竞赛再次升级,现代的验证码-我们经常看到的通常不易读懂的傻瓜-诞生了。 这种形式的CAPTCHA使用了很高的失真度,将字符挤在一起,通常使它们很难阅读和分割。

其他形式的验证码

图形化的验证码并不是存在的唯一形式的垃圾邮件保护,它们只是最常见的(也是最令人讨厌的)。 有音频标题(通常会失真以抵消音频识别程序),计算机尚无法理解的文本问题(即“土豆属于其中一个词”),甚至还有PiCAPTCHA,它们向用户提供了一系列图像,并告诉他们按特定顺序单击它们。

不幸的是,即使是这些形式的验证码也并非牢不可破,我们已经开始看到垃圾邮件制造者利用其他人来解决他们的问题的趋势。 有时,他们是“数字血汗工厂工作人员”,被迫弯腰坐在计算机旁,为CAPTCHA问题提供解决方案,以便这些垃圾邮件发送者可以将其添加到数据库中。

但是,有时候,他们很可能是不知情的骗子,例如可怜的傻瓜,他们无意中增加了垃圾邮件制造者的武器库,因为他们想要免费的色情内容。

我们尚未找到解决这种攻击途径的方法-我们可能永远找不到。

无论如何,那里有。 电脑屏幕上令人头疼的蠕动线条背后的简短历史。

验证码背后的故事