这种验证装置,看似是用于验证,可通常都是真假结合。
比如第一个是有正确答案的真的【验证码】,第二个则是其实根本没有答案的义务劳动。
如果你第一个填对了,它就会默认你对第二个验证码的劳动也是正确的,并把这个结果传回项目主机。
并且,同一张义务劳动的图片还会交叉发给多个人类用户,用以对比和确保答案的正确和可信程度。
“你猜猜,reCAPTCHA每天能够协助录入多少字符?”
阿里克斯带着一脸坏笑,他觉得这个数字量孟繁岐一定猜不到。
“你都这么说了,我肯定往大了猜,每天....一天八万多秒,一秒就算他一百个,八百万?”
“08年的时候每天六千万字符,现在应该几个亿了。”
根据统计估算,全世界每天输入验证码上亿次,每次接近十秒钟。
每天网民在验证码上的时间,就得接近百万小时。
通过白嫖这部分劳动力,不知不觉之间,人类已经通过验证码的方式录入了超过两千五百万本书进入数字世界。
这还仅仅只用了几年的时间。
“09年谷歌把reCAPTCHA买下来了,此后,验证码的种类开始变得多种多样起来,而不仅仅只是文本验证了。”
谷歌09年花了将近三千万美金买这个系统,当然不是为了做慈善。
此举,是为了获取海量的带标签数据,为自己后来的人工智能做准备。一半验证你是不是真人,有没有认真答题;另一半,则开始让你义务劳动打白工。
标注门牌号,路牌,分类各种图片,只要你生活在网络的世界,伱就或多或少地每天要给谷歌打几十秒的白工。
“所以说,虽然验证码诞生之初,解决了网络环境和用户安全的大问题,但后面其实性质已经发生了改变?”
“那当然,如果真的要做【分辨对面到底是人是狗】的图灵测试,其实还有更加聪明的办法,比如只需要点击一个我不是机器人的按钮就好了。”
“系统可以追踪用户的鼠标和键盘轨迹,让机器人的模拟成本非常之高,这才是更科学的验证系统。又或者是滑动,拼图的方式,都比验证码科学多了,又不会有识别错误的风险,比如8和B,o和0。至于那些图像的测试验证,其实更多的成为了一种收集数据的手段。”