混沌:技术、复杂性和互联网的未来
上QQ阅读APP看书,第一时间看更新

A/B之谜

当奥巴马第一次总统竞选团队在其网站上试验两种注册按钮时,他们发现,命名为“了解更多”的按钮获得的点击量远远超出“现在加入我们”或“立即注册”按钮。

另一项测试显示,奥巴马一家的黑白照片的点击量竟然意外地远远高于该网站一直使用的彩色照片。

随后,当竞选团队把“了解更多”的按钮与黑白照片放在一起时,注册人数增加了40%。

综合起来看,竞选团队估计,在其通过电子邮件触达的1 300万人中,近1/3的人和约7 500万美元的捐赠因这种A/B测试的优化而获得。在这种测试中,网站对不知情的随机用户试用不同版本的广告或内容,然后根据测试结果来决定为其余用户提供哪个版本。5

让竞选团队更惊讶的是,一段候选人在集会上鼓动群众的视频,其点击量远远低于单纯的文本信息。考虑到候选人的演说才能,有什么能解释这种反常的差异呢?竞选团队不知道,他们也无须知道。即便不知晓原因,实证数据也会告诉他们应该把哪些内容发布到竞选网站上。从结果看,奥巴马获得了更高的点击量,更多的捐款,也许还有更多的投票。

A/B测试已成为一种常见的做法。你在谷歌搜索页面上获得的结果是A/B测试的结果。6网飞官网电影的排序是A/B测试的结果。甚至《纽约时报》使用的某些新闻标题也是A/B测试的结果。72014年至2016年,微软必应搜索网站的软件工程师进行了21 200次A/B测试,其中1/3直接导致了服务的变更。8

A/B测试非常有效,而且这种有效性并不基于任何对结论的解释性假设,同时,测试本身也不会给出任何这种假设。例如,在亚马逊的一些广告里,为什么年轻女子微笑的形象在左边而不是在右边时会产生更多的销量?我们可以编一个理论出来,但我们最好还是在制作下一个广告时对模特的位置再次进行A/B测试。黑白照片对奥巴马有效,并不意味着他的竞选对手约翰・麦凯恩就应该放弃自己的彩色照片。使用蓝色背景而不是绿色背景对亚马逊的户外烤肉架销售有帮助,但我们没有理由因此就认为它对室内烤肉架或烧烤食谱也会起作用。

实际上,影响人们偏好的因素完全有可能是难以察觉且变化无常的。也许50岁以上的男性更喜欢模特广告在页面左侧,但前提是这个广告的页面标题很有趣。底特律的女性更喜欢模特广告在页面右侧,前提是持续阴了两天,灿烂的阳光刚刚透过窗户照进来。有些人喜欢黑白照片,前提是他们刚看过高对比度的视频。有些人更喜欢彩色照片,就因为他们最喜欢的棒球队刚刚输掉一场比赛。针对影响人们偏好的因素,我们也许能从这些个性中总结出一些共性,也许不能。我们不知道,影响结果的因素可能和世界本身一样纷繁复杂。

我们从小就相信,世界的真相和本质可以用一些永恒不变的定律来表达。学习这些定律,你就能做出预测。发现新的定律,你就能预测更多事情。如果有人想知道你是如何做出一个预测的,那么你可以把定律和输入的数据告诉他。但是在A/B测试中,我们通常没有任何的心理框架去解释为什么一个广告版本比另一个的效果更好。

想想抛沙滩球,你会期望球在你抛出去的大致方向上划出一个弧线,因为我们基于物理的认知模型考虑到了重力和动量。但就算球朝别的方向飞去,你也不会不相信物理了。你会默认自己没有考虑某些因素,也许刮了一阵风,也许你抛球的手滑了一下。

这正是我们的A/B测试不涉及的部分。我们不需要知道为什么黑白照片和“了解更多”的标签能增加竞选捐款。而且,即使我们从民主党的广告中吸取的经验对共和党对手无效——它们很可能是无效的,那也没关系,我们只需要再进行一次成本很低的A/B测试就可以了。

A/B测试只是一个例子,它含蓄地向我们表明,原理、定律和普遍原则并不像我们想象的那么重要。也许——也许——所谓原理恰恰是我们在无法处理现实的细微之处时拿来做简化的工具。

* * *

我们刚刚看了两种完全不同的计算机技术:一种是编程技术(机器学习);另一种是能让我们遇到他人,倾听他们的表达,感受他们创造力的全球村(互联网)。当然,这些技术通常是相互交织的:机器学习通过互联网大规模地搜集信息,同时越来越多的基于互联网的服务需要应用机器学习,进而反哺机器学习。

这两种技术至少有3点共同之处:规模庞大,互通性,复杂性。这些共同点使我们了解了世界的运转方式。

它们的庞大(规模)并不是我们在参观世界上最大的麻线球或者想象世界上所有的土豆都堆在一起时的那种大。机器学习和互联网规模庞大的特性在于,它们是细致入微的。这两种技术都依赖于精细化和独特性蓬勃发展,而不是通过概括或压制“边缘”信息和想法来忽略细节。

这两种技术的互通性意味着它们包含的点点滴滴的信息都是相互影响的,而无须考虑物理距离造成的障碍。互通性对这两种技术都是至关重要的:一次只能将一个部件连接到另一个部件的网络不是互联网,而是过时的电话系统。新技术的互通性是庞大的、多路径的、零距离的且必不可少的。

机器学习和互联网的庞大规模和互通性导致了它们的复杂性。大量碎片化信息之间的联系有时会导致一连串事件的发生,这些事件的结局会与它们的初始目标相去甚远。微小的差异会导致这些系统产生意想不到的变化。

我们并不是因为这些技术规模庞大、互通且复杂才使用它们的,我们使用它们是因为它们有效。我们使用这些技术取得的成功向我们展示出,世界远比我们想象的更复杂、更混乱,而这反过来又鼓励我们探索新的方法及认知策略,挑战我们对“理解”及“解释”本质和重要性的假设,并最终引导我们对因果性产生新的认知。