胡郁:让我们的声音传遍世界

2014-08-22 08:42:53来源:科大-历史文化网

■本报记者 沈春蕾

互联网发展到2009年,进入移动互联新时期,科大讯飞终于找到了和互联网的切合点。2010年,科大讯飞发布了全球首个移动互联网智能语音交互平台——讯飞语音云,宣告移动互联网语音听写时代到来。

目前,科大讯飞已占有中文语音技术市场70%以上市场份额,讯飞语音云合作伙伴已经超过了35000家,面向大众的讯飞语音输入法用户数量突破1.5亿。

语速快、条理清晰、思维敏捷。

这是科大讯飞股份有限公司(以下简称科大讯飞)高级副总裁、讯飞研究院院长胡郁给记者留下的第一印象。

在记者阐明关于互联网第二波浪潮的采访主题后,胡郁果断指出:“科大讯飞成立10年来,经历了互联网的两波浪潮,其间公司处于平缓的稳步发展阶段。随着移动互联网时代的到来,也让我们迎来了巨大的转机。”

工作学习两不误

1999年11月11日,在中国科学技术大学(以下简称中国科大)发生了一件大事,6位中国科大的学生因为研制成功我国第一台“能听会说”的中文电脑,获得总计668.85万元的技术股权。

这里提到的“能听会说”电脑的研制是智能计算机研究领域的重要课题,也是我国“863 ”计划支持最早、持续最久的高科技项目。

在校大学生因技术创新而获得数量金额如此巨大的股权资本,这在我国高校历史上还是第一次。在这6 名学生当中,2 人是博士生,1 人是硕士生,3 人是本科生,而胡郁就是那3 位本科生之一,他的专业是电子工程与信息科学。

在当年获得股权奖励6名学生中,刘庆峰是科大讯飞现任董事长,也是当年项目主要成员,主攻汉语语音合成技术,胡郁负责汉语语音库设计,尹波是让电脑“能听会说”软件的主要设计者,黄海兵完成了有声电子邮件的系统设计。

“那段日子虽然艰苦,但也很幸福。”胡郁告诉《中国科学报》记者,我们因此成为了全国首批拥有百万资本的在校学生,却没有迷失方向。

从1999年开始,除了中国科大的学生身份之外,胡郁还多了一重新的身份——安徽中科大讯飞公司(科大讯飞前身)的研究员,主要从事语音合成专项技术研究,也是从那年开始,科大讯飞开始走入人们的视野。

随后的2000年到2011年,胡郁在公司从研究员做起,先后成长为基础研发部经理、讯飞语音联合实验室副主任、安徽科大讯飞公司研究院执行院长、科大讯飞高级副总裁、语音及语言信息处理国家工程实验室常务副主任。

事业快速发展的同时,胡郁也顺利完成了在中国科大的博士学业,并先后前往德国和香港进修,在柏林TFH学院他进行了语音合成韵律建模方面的研究工作。通过香港特区专才引进计划,胡郁在香港大学计算机系开展了语音识别前端鲁棒性方面的学习和研究。

“不进则退。”工科男胡郁在学习的同时开始了创业,也在创业的进程中完成了自己的学业,并且活学活用,不断将智能语音的核心技术成果推向市场。

借互联网东风

胡郁记得在1994年自己接触了最早的互联网,当时还是文字版的BBS(电子公告牌系统),但已经让年轻的他兴奋了好一阵,只是他可能没有想到互联网能让自己在未来成就一番事业。

1994年,是中国互联网出现一系列新变化的重要年份。

1994年5月,中国科学院高能物理研究所设立了国内第一个WEB服务器,推出中国第一套网页,内容除介绍中国高科技发展外,还有一个栏目叫“Tour in China”,开始提供包括新闻、经济、文化、商贸等图文并茂的信息。同月,国家智能计算机研究开发中心开通曙光BBS站,这是中国大陆第一个基于互联网的BBS站。

1994年底,NCFC(中国国家计算机与网络设施)共连接中科院中关村地区30个研究所和北大、清华两校的各类工作站及大中型计算机500台,PC机及终端2000台。网上每天的国际传输数据量达300兆字节,相当于1.5亿汉字。

1995年,胡郁来到了中国科大。而这一年,刘庆峰获得了中国科大电子工程专业学士学位,并且作为项目主要成员参与中国科大“人机语音通信实验室”所承担的国家“863”项目和国家自然科学基金项目。

当年,胡郁在中国科大电子工程系名列前茅,这也让刘庆峰注意到了自己的小师弟,继而有了后面的创业合作。

从1995年到2009年,中国互联网经历了快速成长期。“对科大讯飞来说,1999年到2009年是我们平稳成长的10年。”胡郁说。

他列举了这10年来的一些成就:2000年,科大讯飞智能语音平台开发厂商突破100家,语音产业国家队地位初现;2004年,科大讯飞在国家“863”项目中文语音合成国际评测中大比分囊括所有指标第一,销售收入首次迈过亿元大关;2008年,科大讯飞成功上市,成为中国语音产业界唯一上市企业……

胡郁表示,作为一家与互联网齐头并进的企业,我们希望能借互联网东风发展自身,并且已经作出了一些尝试,但我们也在1999年到2000年看到了互联网存在的泡沫,因此我们最终还是选择了脚踏实地做研发。

互联网发展到2009年,进入移动互联新时期,科大讯飞终于找到了和互联网的切合点。2010年,科大讯飞发布了全球首个移动互联网智能语音交互平台——讯飞语音云,宣告移动互联网语音听写时代到来。

专攻核心技术

互联网的浪潮成就了一批企业,但胡郁以及他所在的科大讯飞管理层都清醒地意识到在这些企业里中部分并不以核心技术见长。

胡郁指出:“我们是从中国科大走出来的企业,我们的特色是语音技术,也希望能成为专攻核心技术的企业。”

在科大讯飞发现语音产品新市场的同时,国际上知名的IT产业巨头纷纷参与其中:2011年10月,苹果公司在其iPhone智能手机中率先推出了智能语音助理应用Siri,并在2012年6月发布的IOS6中支持中文服务;Google公司也在其安卓智能手机操作系统中,推出了Google Now智能语音搜索及问答服务;微软公司将语音技术应用于最新推出的Windows Phone。

面对强敌,科大讯飞表现出自己的冷静,胡郁说:“这些企业的核心技术并不是语音技术,只是随着语音技术的发展,他们看到了商机,希望借此技术推动自己的产品迈入新的市场。”

对科大讯飞来说,公司在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。”胡郁笑称:“面对行业大佬的竞争,我们充满自信。”

科大讯飞确实有这样的底气。目前,科大讯飞已占有中文语音技术市场70%以上市场份额,讯飞语音云合作伙伴已经超过了35000家,面向大众的讯飞语音输入法用户数量突破1.5亿。

2013年,科大讯飞与中国移动、中国电信、中国联通三大电信运营商全面建立战略合作关系。胡郁还向记者透露,未来,不仅每一部手机都将能听会说;每一个玩具、每一台家电、每一辆汽车也将能听会说,科大讯飞正在为此而努力。

记者曾参观过科大讯飞的产品体验厅,电视换台、打开空调、让教学幻灯片唱歌、让行驶噪音环境中的汽车检索地图,这一切只需要一个口令就可以实现。

“智能家居也将是我们未来的主打市场。”胡郁告诉记者,“我们不是一家跟风的企业,我们只是在等待一个机会,移动互联网提供了这样的机会,那么我们也将努力用技术和实力去争取自己的话语权。同时,我们也希望向世界证明,中国的企业依靠核心技术创新和系统技术创新也可以赢得应有的尊重。”

《中国科学报》 (2014-08-22 第14版 中国.互联网)