《世界因你不同》

下载本书

添加书签

世界因你不同- 第19节


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
尔”的陷阱。再接着走下去,世界冠军最终“溃不成军”。他崩溃了,气愤地说:“不玩了。”最终,他放弃了第二局和第三局的比赛。我们的机器奥赛罗“比尔”,以56:8 战胜了人类冠军。
  这是机器第一次打败人类冠军,是一个历史性的里程碑。而在计算机学界,人们对人工智能充满了信心,而我也对计算机世界中的统计学有了更大的信心。我和萨卓依·玛哈俊在最高级别的期刊《人工智能》上发表了两篇文章。萨卓依·玛哈俊成为第一个在《人工智能》上发表论文的高中生作者,后来,他在剑桥大学拿到博士学位,成为了一名优秀的教授。
  后来,“比尔”被系里的汉斯·柏林(HansBerliner)教授知道,他约我吃饭,对我说他正在做一个国际象棋的硬件,希望打败世界棋王,看到我统计学工作的成绩,希望我考虑加入他的组,把统计学的方法应用在国际象棋上。他说:“这样你很快就可以毕业了。”但是,我拒绝了他,因为我还是希望做一个真正有用的软件,而不是把游戏作为自己的论文。另外,瑞迪教授对我恩重如山,我不能无缘无故就离开他。1988 年最重要的科学发明
  就在我暑期忙着教书,秋天投身奥赛罗时,瑞迪教授从美国国防部得到了300 万美元的经费做不特定语者、大词库、连续性的语音识别。也就是说,他希望机器能听懂任何人的声音,而且可以懂上千个词汇,懂人们自然连续说出的每一句话。这三个问题都是当时无解的问题,而瑞迪教授大胆地拿下项目,希望同时解决这三个问题。他在全美招聘了30 多位教授、研究员、语音学家、学生、程序员,以启动这个有史以来最大的语音项目。而他也期望我在专家系统方面继续努力,得到突破,在这 30多人的队伍里面发挥作用。
  但是,他怎么也没想到,我正想着如何脱离这个30 多人的队伍,脱离专家系统的研究。奥赛罗的人机博弈,让我对统计概念有了充分的理解,我开始相信,建立大型的数据库,然后对大的语音数据库进行分类,就有可能解决专家系统不能解决的问题。
  怎样向他提这件事?我一直在犹豫,他已经向国防部立项,经费已经到位,专家系统的方向是势在必行的,我是他一手调教出来的大弟子,如果我这么不配合他的方向,他会怎么处理呢?会试着说服我继续做专家系统?会大发雷霆?还是会好言相劝?
  
  再三思考后,我告诉自己,我必须向他坦承我的看法,因为我想起当时海博曼院长对我说的:“读博士,就是挑选一个狭窄并重要的领域作研究,毕业的时候交出一篇世界一流的毕业论文,成为这个领域里世界首屈一指的专家。任何人提到这个领域的时候,都会想起你的名字。”如果我做专家系统,我就愧对了海博曼院长的期许,也浪费了我大学三年苦读,更对不起我自己。
  于是,我决定鼓足勇气,向瑞迪教授直接表达我的想法。我对瑞迪说:“我希望转投统计学,用统计学来解决这个‘不特定语者、大词汇、连续性语音识别’。”
  瑞迪一点都没有生气,他轻轻地问:“那统计方法如何解决这三大问题呢?”这正是我思考很久的三个问题。然后,我就长篇大论地说了十分钟,瑞迪教授耐心地听完我激情的回答后,用他那永远温和的声音告诉我:“开复,你对专家系统和统计的观点,我是不同意的,但是我可以支持你用统计的方法去做,因为我相信科学没有绝对的对错,我们都是平等的。而且,我更相信一个有激情的人是可能找到更好的解决方案的。”
  那一刻,我的感动无与伦比。因为对一个教授来说,学生要用自己的方法作出一个与他唱反调的研究。教授不但没有动怒,还给予经费上的支持,这在很多地方是不可想象的。
  但是,统计学需要大数据库,我们如何才能建立起大的数据库呢?瑞迪教授看到我愁眉不展的样子,再一次给了我支持。他说,“开复,虽然说我还是对你的研究方法有所保留,但是,在科学的领域里,其实也无所谓老师和学生的区别,我们都是面临这一个难题的攻克者,所以,如果你真的需要数据库,那么,让我去说服国防部去帮你建立一个大的数据库吧!”
  统计学的方法也需要非常快的机器,瑞迪教授帮我购买了最新的Sun 4 机器。每次有新的机器,他都会说:“先问问开复要不要。”做论文的两年多,我至少花了他几十万美元的经费。
  瑞迪教授的宽容再次让我感觉到一种伟大的力
  量,这是一种自由和信任的力量。伏尔泰曾说:“我可以不同意你的观点,但是我誓死捍卫你说话的权利!”瑞迪教授这样说:“我不同意你,但是我支持你。”这是一种真正的科学家的精神。他这种“科学面前,人人平等”的信念,深深地影响了我。这种无言的伟大,让我受益终生,也让我以这种信念对待他人的不同意见。
  24 年后,当我的员工郭去疾离职的时候,他是这么描述我的:“8 年来,作为我的师长,开复很多次支持了我的理想,改变了我的命运,也宽容了我的缺点。当你离一个人很近,从他身上学到太多,你可能反而不知道该怎样总结你的收获。但我知道,现在当我遇到一个难以处理的困难,我常常会去想,如果是开复,他会怎么做。假如只能选一条收获来分享,那么开复让我铭记终身的教益是:‘Youcansincerelv disagreeand full heartedlysupport at the same time(你可以同时真诚地反对和全力地支持)。’以前读到开复的文章里提及他的博士生导师怀疑却又支持他的研究方向的时候,我以为那只是一种雅量。而当开复身体力行地一次次怀疑却又支持我的时候,我才慢慢明白这是一种珍贵的领导力。”
  这种领导力只能归功和感谢我的导师——瑞迪教授。
  在导师的这种力量的支持下,我开始了疯狂的科研工作。我每天上午9 点起床,到学校完成自己必须做的课业、助教等工作,中午回家,从中午 l点工作到凌晨2 点,一星期有6 天都是如此,只有星期天是承诺妻子的“休息日”。就算星期天,我也会多次上机去看看我的实验是否在跑。一天18个小时,一周l00 多个小时,我坚持了三年半。
  从1984 年底到1987 年初,我带着另一位学生一起用统计的方法做语音识别。同时,其他30 多人用专家系统做同样的问题。从方法上来说,我们在竞争,但是在瑞迪教授的领导下,我们分享一切,我们用同样的样本训练和测试。在瑞迪教授的支持下,我也慢慢得到了其他教授的认可。
  在1986年底,我的统计系统和他们的专家系统达到了大约一样的水平,40%的辨认率。这虽然还是完全不能用的系统,但毕竟是学术界第一次尝试这么难的问题,大家还是比较欣喜和乐观的。
  1987年5 月,我们大幅度地提升了训练的数据库,我又想出了一种新的方法(triphones)来建模,不但能够用统计学的方法学习每一个音,而且可以用统计学的方法学习每两个音之间的转折。针对有些音的样本不够,我又想出了一种方法
  (generalized triphones)来合并其他的音。这三项工作居然把机器的语音识别率从原来的 40%提高到了80%!统计学的方法用于语音识别初步被验证是正确的方向,我的内心充满了喜悦。瑞迪也同样为我感到欣喜万分,他决定把我的成果带到国际学术会议上去演讲,让世界知道统计学的方法初获成功。而我鼓起勇气对瑞迪教授说,“这是我自己做出的成果,您可不可以让我自己去讲。”瑞迪教授马上回答,“好啊。那很好,我马上给你订机票。”就这样,我带着自己准备4 年的成果,跟着我的恩师出发了。有趣的是,那一天,我开着有 l5年车龄的“老爷车”去接瑞迪教授,没有想到,刚刚走到一半,整个车子都开始冒出滚滚黑烟,我和瑞迪教授只好狼狈不堪地跑下了车。“不好意思,汽缸爆了。”我掀开车盖里看到一幅狼藉的景象。“没事,我们还是赶紧换坐出租车吧,否则要赶不上飞机了。”瑞迪教授安慰我说。就这样,我们好不容易拦下了一辆出租车赶往机场。后来,瑞迪教授的秘书偷偷地告诉我,瑞迪教授其实被吓坏了,他害怕地说,“再也不坐开复的车了。”在这个国防部赞助的语音学术会议上,老师让我演示了自己的研究成果,受到了各高校的瞩目。当时,IBM 公司和斯坦福研究院的教授都非常重视这个结果,来找我问了很多细节。虽然识别率实现了跨越式的前进,但是我一直在问自己,80%的语音识别率有没有可能再提高一步?从学术会议上回来,我回到了自己租住的小屋里,继续做着各种试验和统计,希望有一天语音识别率能够“更上一层楼”。每一天,我几乎都是困到无法撑开眼皮才睡。奇迹在某一天早上发生了,当我睡眼蒙咙地开始敲程序的时候,忽然发现语音识别率一下子提高到了 96%。“天啊!我是不是还在做梦?”我揉了揉眼睛,不敢相信。我赶紧把程序重新敲了一遍,发现语音识别率果然提高到了96%,一股巨大的幸福的眩晕感觉涌了上来。在昨天晚上的一个程序中,我只改写了一些细节,没有想到,正是对这些细节的修改,让我的研究成果取得了突破性的进展。
  1988 年4 月,我受邀到纽约参加一年一度的世界语音学术会议,发表学术论文。赴会的一个月前,我的导师瑞迪教授又给我上了一课,但是不是学术方面,而是市场方面的。
  他对我说:“学术演讲的30 分钟,你只要讲25分钟就行了,最后5 分钟你拿一个话筒传给观众,让他们自己试试,这个系统是不是真的。”
  我说:“但是,会场噪音很大,一定会打折扣,达不到96%,而且那么多日本学者,他们的口音我的系统可没听过。”
  老师说:“实际上你的识别率是90%还是96%,没有什么差别。我们这么做的目的,不是要监测你的识别率,而是要造成一个效果,让每个学者终生都会记得,第一次接触不指定语者系统就是在纽约,在李开复的演讲上。”
  我说:“好吧,照你说的做。但是,识别的速度不够快,让大家等太久不好吧。”“没关系,我让系里面最厉害的黑客来帮你修改程序,帮你做得更快。”瑞迪教授说。他又说:“你该给你的系统取个名字了,这样他们才知道如何称呼你的系统。你的奥赛罗系统都有名字。”于是,我给系统取了名字,叫做 Sphinx(斯芬克斯,希腊的人面狮身)。希腊的人面狮身有人的脸孔、狮子的身体、鸟的翅膀,我取这个名字是希望狮子的身体代表宏伟的统计模型,人的脸孔代表人的语音知识,鸟的翅膀代表系统的速度。在这个会议上,我把96%的语音识别率发表了,也演示了Sphinx 系统。结果就像瑞迪教授所预期的,学术结果和演示效果相映之下,我的成果撼动了整个学术领域。这是计算机领域里最顶尖的科学成果了。语音识别率大幅度提高,让全世界语音研究领域闪烁出一道希望的光芒,从此,所有以专家系统研究语音识别的人全部转向了统计方法。会后,《纽约时报》
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架