登陆注册
1358600000033

第33章 博士生涯:1988年最重要的科学发明

就在我暑期忙着教书,秋天投身奥赛罗时,瑞迪教授从美国国防部得到了300万美元的经费做不特定语者、大词库、连续性的语音识别。也就是说,他希望机器能听懂任何人的声音,而且可以懂上千个词汇,懂人们自然连续说出的每一句话。这三个问题都是当时无解的问题,而瑞迪教授大胆地拿下项目,希望同时解决这三个问题。他在全美招聘了30多位教授、研究员、语音学家、学生、程序员,以启动这个有史以来最大的语音项目。而他也期望我在专家系统方面继续努力,得到突破,在这30多人的队伍里面发挥作用。

但是,他怎么也没想到,我正想着如何脱离这个30多人的队伍,脱离专家系统的研究。奥赛罗的人机博弈,让我对统计概念有了充分的理解,我开始相信,建立大型的数据库,然后对大的语音数据库进行分类,就有可能解决专家系统不能解决的问题。

怎样向他提这件事?我一直在犹豫,他已经向国防部立项,经费已经到位,专家系统的方向是势在必行的,我是他一手调教出来的大弟子,如果我这么不配合他的方向,他会怎么处理呢?会试着说服我继续做专家系统?会大发雷霆?还是会好言相劝?

再三思考后,我告诉自己,我必须向他坦承我的看法,因为我想起当时海博曼院长对我说的:“读博士,就是挑选一个狭窄并重要的领域作研究,毕业的时候交出一篇世界一流的毕业论文,成为这个领域里世界首屈一指的专家。任何人提到这个领域的时候,都会想起你的名字。”如果我做专家系统,我就愧对了海博曼院长的期许,也浪费了我大学三年苦读,更对不起我自己。

于是,我决定鼓足勇气,向瑞迪教授直接表达我的想法。我对瑞迪说:“我希望转投统计学,用统计学来解决这个‘不特定语者、大词汇、连续性语音识别’。”

瑞迪一点都没有生气,他轻轻地问:“那统计方法如何解决这三大问题呢?”这正是我思考很久的三个问题。然后,我就长篇大论地说了十分钟,瑞迪教授耐心地听完我激情的回答后,用他那永远温和的声音告诉我:“开复,你对专家系统和统计的观点,我是不同意的,但是我可以支持你用统计的方法去做,因为我相信科学没有绝对的对错,我们都是平等的。而且,我更相信一个有激情的人是可能找到更好的解决方案的。”

那一刻,我的感动无与伦比。因为对一个教授来说,学生要用自己的方法作出一个与他唱反调的研究。教授不但没有动怒,还给予经费上的支持,这在很多地方是不可想象的。

但是,统计学需要大数据库,我们如何才能建立起大的数据库呢?瑞迪教授看到我愁眉不展的样子,再一次给了我支持。他说,“开复,虽然说我还是对你的研究方法有所保留,但是,在科学的领域里,其实也无所谓老师和学生的区别,我们都是面临这一个难题的攻克者,所以,如果你真的需要数据库,那么,让我去说服国防部去帮你建立一个大的数据库吧!”

统计学的方法也需要非常快的机器,瑞迪教授帮我购买了最新的Sun4机器。每次有新的机器,他都会说:“先问问开复要不要。”做论文的两年多,我至少花了他几十万美元的经费。

瑞迪教授的宽容再次让我感觉到一种伟大的力量,这是一种自由和信任的力量。伏尔泰曾说:“我可以不同意你的观点,但是我誓死扞卫你说话的权利!”瑞迪教授这样说:“我不同意你,但是我支持你。”这是一种真正的科学家的精神。他这种“科学面前,人人平等”的信念,深深地影响了我。这种无言的伟大,让我受益终生,也让我以这种信念对待他人的不同意见。

24年后,当我的员工郭去疾离职的时候,他是这么描述我的:“8年来,作为我的师长,开复很多次支持了我的理想,改变了我的命运,也宽容了我的缺点。当你离一个人很近,从他身上学到太多,你可能反而不知道该怎样总结你的收获。但我知道,现在当我遇到一个难以处理的困难,我常常会去想,如果是开复,他会怎么做。假如只能选一条收获来分享,那么开复让我铭记终身的教益是:‘You can sincerely disagree and full heartedly support at the same time(你可以同时真诚地反对和全力地支持)。’以前读到开复的文章里提及他的博士生导师怀疑却又支持他的研究方向的时候,我以为那只是一种雅量。而当开复身体力行地一次次怀疑却又支持我的时候,我才慢慢明白这是一种珍贵的领导力。”

这种领导力只能归功和感谢我的导师——瑞迪教授。

在导师的这种力量的支持下,我开始了疯狂的科研工作。我每天上午8~9点起床,到学校完成自己必须做的课业、助教等工作,中午回家,从中午1点工作到凌晨2~3点,一星期有6天都是如此,只有星期天是承诺妻子的“休息日”。就算星期天,我也会多次上机去看看我的实验是否在跑。一天18个小时,一周100多个小时,我坚持了三年半。

从1984年底到1987年初,我带着另一位学生一起用统计的方法做语音识别。同时,其他30多人用专家系统做同样的问题。从方法上来说,我们在竞争,但是在瑞迪教授的领导下,我们分享一切,我们用同样的样本训练和测试。在瑞迪教授的支持下,我也慢慢得到了其他教授的认可。

在1986年底,我的统计系统和他们的专家系统达到了大约一样的水平,40%的辨认率。这虽然还是完全不能用的系统,但毕竟是学术界第一次尝试这么难的问题,大家还是比较欣喜和乐观的。

1987年5月,我们大幅度地提升了训练的数据库,我又想出了一种新的方法(triphones)来建模,不但能够用统计学的方法学习每一个音,而且可以用统计学的方法学习每两个音之间的转折。针对有些音的样本不够,我又想出了一种方法(generalized triphones)来合并其他的音。这三项工作居然把机器的语音识别率从原来的40%提高到了80%!

统计学的方法用于语音识别初步被验证是正确的方向,我的内心充满了喜悦。瑞迪也同样为我感到欣喜万分,他决定把我的成果带到国际学术会议上去演讲,让世界知道统计学的方法初获成功。而我鼓起勇气对瑞迪教授说,“这是我自己做出的成果,您可不可以让我自己去讲。”瑞迪教授马上回答,“好啊。那很好,我马上给你订机票。”

就这样,我带着自己准备4年的成果,跟着我的恩师出发了。有趣的是,那一天,我开着有15年车龄的“老爷车”去接瑞迪教授,没有想到,刚刚走到一半,整个车子都开始冒出滚滚黑烟,我和瑞迪教授只好狼狈不堪地跑下了车。“不好意思,汽缸爆了。”我掀开车盖里看到一幅狼藉的景象。“没事,我们还是赶紧换坐出租车吧,否则要赶不上飞机了。”瑞迪教授安慰我说。就这样,我们好不容易拦下了一辆出租车赶往机场。后来,瑞迪教授的秘书偷偷地告诉我,瑞迪教授其实被吓坏了,他害怕地说,“再也不坐开复的车了。”

送瑞迪教授的路上报废的汽车

在这个国防部赞助的语音学术会议上,老师让我演示了自己的研究成果,受到了各高校的瞩目。当时,IBM公司和斯坦福研究院的教授都非常重视这个结果,来找我问了很多细节。

虽然识别率实现了跨越式的前进,但是我一直在问自己,80%的语音识别率有没有可能再提高一步?从学术会议上回来,我回到了自己租住的小屋里,继续做着各种试验和统计,希望有一天语音识别率能够“更上一层楼”。每一天,我几乎都是困到无法撑开眼皮才睡。

奇迹在某一天早上发生了,当我睡眼蒙眬地开始敲程序的时候,忽然发现语音识别率一下子提高到了96%。“天啊!我是不是还在做梦?”我揉了揉眼睛,不敢相信。我赶紧把程序重新敲了一遍,发现语音识别率果然提高到了96%,一股巨大的幸福的眩晕感觉涌了上来。在昨天晚上的一个程序中,我只改写了一些细节,没有想到,正是对这些细节的修改,让我的研究成果取得了突破性的进展。

1988年4月,我受邀到纽约参加一年一度的世界语音学术会议,发表学术论文。赴会的一个月前,我的导师瑞迪教授又给我上了一课,但是不是学术方面,而是市场方面的。

他对我说:“学术演讲的30分钟,你只要讲25分钟就行了,最后5分钟你拿一个话筒传给观众,让他们自己试试,这个系统是不是真的。”

我说:“但是,会场噪音很大,一定会打折扣,达不到96%,而且那么多日本学者,他们的口音我的系统可没听过。”

老师说:“实际上你的识别率是90%还是96%,没有什么差别。我们这么做的目的,不是要监测你的识别率,而是要造成一个效果,让每个学者终生都会记得,第一次接触不指定语者系统就是在纽约,在李开复的演讲上。”

我说:“好吧,照你说的做。但是,识别的速度不够快,让大家等太久不好吧。”

“没关系,我让系里面最厉害的黑客来帮你修改程序,帮你做得更快。”瑞迪教授说。

他又说:“你该给你的系统取个名字了,这样他们才知道如何称呼你的系统。你的奥赛罗系统都有名字。”

《纽约时报》对我的博士论文的报道

于是,我给系统取了名字,叫做Sphinx(斯芬克斯,希腊的人面狮身)。希腊的人面狮身有人的脸孔、狮子的身体、鸟的翅膀,我取这个名字是希望狮子的身体代表宏伟的统计模型,人的脸孔代表人的语音知识,鸟的翅膀代表系统的速度。

在这个会议上,我把96%的语音识别率发表了,也演示了Sphinx系统。结果就像瑞迪教授所预期的,学术结果和演示效果相映之下,我的成果撼动了整个学术领域。这是计算机领域里最顶尖的科学成果了。语音识别率大幅度提高,让全世界语音研究领域闪烁出一道希望的光芒,从此,所有以专家系统研究语音识别的人全部转向了统计方法。

会后,《纽约时报》听说了这个成果,派记者约翰·马可奥夫(John Markoff)来到匹兹堡对我作了采访,文章发表于1988年7月6日,占了科技版首页的整个半版。在这篇文章里,马可奥夫大力报道了我的论文的突破。当时,我只觉得在和一个和蔼可亲的记者聊天,事后,我才知道这是一名才华横溢的着名记者,三次提名普利策奖,并在斯坦福兼教。

后来,《商业周刊》把我的发明选为1988年最重要的科学发明。年仅26岁初出茅庐的我,第一次亮相就获得这样的成功,让我感到很幸运,也让我有了继续向科技高峰攀爬的动力。

同类推荐
  • 世纪谈家桢百年遗传学:谈家桢百岁寿辰纪念画册

    世纪谈家桢百年遗传学:谈家桢百岁寿辰纪念画册

    本书是为了纪念谈家桢诞辰100周年出版的,以画册的形式讲述了我国著名的遗传学家谈家桢一生中求学、从事科学研究和做人的故事,还原一个真实而又生动、伟大而又平凡的谈家桢。
  • 白崇禧传

    白崇禧传

    程思远编著的《白崇禧传——百年中国风云实录》不评论白崇禧个人的功过是非,唯集中记述其毕生经历。白崇禧曾在北伐、抗战帮助过蒋介石,但又三次逼蒋下野。蒋、白之间的悲欢离合,记录了国民党政权从发展、由兴到衰败的历程。
  • 跟邓小平学领导方法

    跟邓小平学领导方法

    本书剖析了邓小平领导工作中,在决策、用人、管理、调研、协调、做思想政治工作、获取民心、进行人际交往和领导讲话等方面高超的方法和杰出的智慧。
  • 张爱玲传:生命有它的图案

    张爱玲传:生命有它的图案

    张爱玲是我国著名女作家,代表作有《倾城之恋》《半生缘》等,本书以张爱玲的生平事实为线索,真实而生动地再现了张爱玲传奇的一生。从张爱玲的个人境遇落笔,用诗一般的文字,加入对张爱玲相关书信、文学作品的解读,完美展现了张爱玲的人生经历。作者写出了张爱玲绚丽惊世的成名过往,并结合人物经历,对其作品进行了深入浅出的鉴赏,尽显其传奇的艺术性与文学性。书中具体描述了张爱玲坎坷动荡的人生经历和深陷迷途、爱恨两难的感情经历。期待通过解读张爱玲的人生往事,能够给现代女性在人生成长道路上多些指导和帮助。
  • 榜样的力量:真实的雷锋

    榜样的力量:真实的雷锋

    本书以雷锋成长历程和人生发展为线索,通过雷锋日常生活中富于启发性的小故事来传达他的精神内涵,包括苦难童年、翻身少年、参加工作、应征入伍等系统内容,同时还包括雷锋生平、日记等,还包括党和国家领导人的题词,图文并茂、生动形象,生动形象地表现雷锋全心全意为人民服务的先进事迹,展现了雷锋充满崇高理想和高尚情怀的短暂人生。
热门推荐
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 大方广佛华严经六十卷

    大方广佛华严经六十卷

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 沧澜大陆之灵元传说

    沧澜大陆之灵元传说

    这里以强者为尊,强者可以得到你想得到的,可以保护自己拥有的,可以保护你所爱的,弱者则不然。灵气是存与天地间的至纯之气,纳入体内可以得到异于常人的力量。沧澜大陆等级划分非常严格,以筑灵、灵徒、灵师、灵皇、灵圣、灵尊、灵元七个等级划分,筑灵是基础之后每级分三品以小中大划分。
  • 英雄联盟之尊法天下

    英雄联盟之尊法天下

    法师为何会被称之为法师?因为能够施法?因为能够凝练精神?错!大错特错!之所以被称之为法师,全是因为那个“法”字!对法则的探索,对本质的追求,对真理的渴望!这才是法师!在这个玄幻魔法的异世界,一场独特的传奇开始被岁月讲述。孤身降临的韩峰携带着英雄联盟的力量,用截然不同的符文之力,带着众多英雄的技能,面对着被魔法和斗气主宰的世界,踏着漫天的诸神缓步而行!
  • 地球上的高手

    地球上的高手

    地球是一个很神奇的星球,自古以来都有美丽而动人神话传说,盘古开天,女娲造人...现在早已进入科技时代,也标志着神坛的没落,但是知道十几年前的一个夜晚,世界各大强国召开了一次紧急会议,其中有什么不为人知的秘密!世间到底有没有神,还是这个世界存在什么强大的生物?一个少年在不断探索这个世间的奥秘,他的命运也由此彻底改变。
  • 两相忘

    两相忘

    十年前,他们是即将走进婚姻殿堂的热恋情侣;十年后,他们是因为一夜情而牵扯上关系的陌生男女;十年的时间,却足以让原本相爱的两人互成陌路,可是一个意外来到的小生命却又将相反驰行的两人重新拉到了一起。可是整整十年的错过,不断出现在他们两人之间的阻碍,已经拥有足够力量保护自己和爱人的沈穆,是能像童话里的王子那样挥舞手中宝剑保护自己心爱的公主,还是像十年前那样被种种的误会蒙蔽,亲手将公主推向地狱的那一幕悲剧再次上演。而原本从新开始的两人却在不经意间先后的将前尘记起,分隔十年时光的爱侣能否否极泰来,一切能不能想他们期望的那样幸福圆满?
  • 请叫我云顶棋圣

    请叫我云顶棋圣

    LOL云顶之弈,一样的英雄,不一样的召唤师。虚空入侵,腥红之月,符文战争……帝国荣耀,贵族光环,骑士精神……叶朝驾驭河灵,拥有无数羁绊光环,青春热血,所向睥睨。
  • 斗罗大陆之龙圣斗罗

    斗罗大陆之龙圣斗罗

    我很喜欢写作,因为唐家三少而走上了写作的道路,希望大家喜欢这部小说,爱上斗罗大陆。谢谢!
  • 大醉半醒

    大醉半醒

    我喜欢的人不是顶级校草,也不是我们望洋兴叹的全年级第一;他沉默在人群中不那么夺目,他也可能被一两个女生暗恋着;但是在他眼里,在我眼里,我们都是互相最特别的角色。我演绎你,你饰演我。