18世纪的贝叶斯定理成为Google计算的新力量

贝叶斯(Thomas Bayes,1702-1763)是一位伟大的数学大师。贝叶斯1702年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1763年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。1763年发表了这方面的论著,对于现代概率论和数理统计都有很重要的作用。贝叶斯的另一著作《机会的学说概论》发表于1758年。他的理论照亮了今天的计算领域。

搜索巨人Google和一家出售信息恢复工具的Autonomy公司,都使用了贝叶斯定理为数据搜索提供近似的(但是技术上不确切)结果。 研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系,创建个人机器人,开发能够根据数据和经验来决定行动的人工智能设备。

这听起来好像很深奥,其实它的意思却是很简单:某件事情发生的概率大致可以由它过去发生的频率近似地估计出来。研究人员把这个原理应用在每件事上,从基因研究到过滤电子邮件。贝叶斯理论的一个出名的倡导者就是微软。该公司把概率用于它的公共平台上。该技术将会被内置到微软未来的软件中,而且让计算机和蜂窝电话能够自动地过滤信息,不需要用户帮助,自动计划会议并且和其他人联系。如果成功的话,该技术将会导致一种叫“上下文的服务器”电子管家的出现,它能够解释人的日常生活习惯并在不断变换的环境中组织他们的生活。

微软研究部门的高级研究员埃里克 侯卫茨说他们正在进行贝叶斯的研究,它将被用于决定怎样最好地分配计算和带宽”,他个人相信“在这个不确定的世界里,你不能够知道每件事,而概率论是任何智能的基础。” 

到今年年底,Intel也将发布它自己的基于贝叶斯理论的工具包。一个关于照相机的实验警告医生说病人可能很快遭受痛苦。在本周晚些时候在该公司的开发者论坛上将讨论这种发展。虽然它在今天很流行,但贝叶斯的理论并不是一直被广泛接受的:就在10年前,贝叶斯研究人员还在他们的专业上踌躇不前。但是其后,改进的数学模型,更快的计算机和实验的有效结果增加了这种学派新的可信程度。

贝叶斯的理论可以粗略地被简述成一条原则:为了预见未来,必须要看看过去。贝叶斯的理论表示未来某件事情发生的概率可以通过计算它过去发生的频率来估计。一个弹起的硬币正面朝上的概率是多少?实验数据表明这个值是50%。 “斯坦佛的管理科学和工程系的教授霍华德认为,贝叶斯表示从本质上说,每件事都有不确定性,你有不同的概率类型。例如,假设不是硬币,一名研究人员把塑料图钉往上抛,想要看看它钉头朝上落地的概率有多大,或者有多少可能性是侧面着地,而钉子是指向什么方向的。形状,成型过程中的误差,重量分布和其他的因素都会影响该结果。

贝叶斯技术的吸引力在于它的简单性。预测完全取决于收集到的数据--获得的数据越多,结果就越好。贝叶斯模型另一个优点是它能够自我纠正,也就是说数据变化了,结果也就跟着变化。

概率论的思想改变了人们和计算机互动的方式。Google的安全质量总监彼得说“这种想法是计算机能够更象一个帮助者而不仅仅是一个终端设备,你在寻找的是一些指导,而不是一个标准答案”。他们从这种转变中,研究获益非浅。几年前,所谓的Boolean搜索引擎的一般使用需要把搜索按照“f,and,or ,but”的语法进行提交,然后去寻找匹配的词。现在的搜索引擎采用了复杂的运算法则来搜索数据库,并找出可能的匹配。 如同图钉的那个例子显示的那样,复杂性和对于更多数据的需要可能很快增长。由于功能强大的计算机的出现,对于把好的猜测转变成近似的输出所必须的结果进行控制成为可能。

作者:Michael Kanellos