您所在的位置:首页商情Market › 正文

科大讯飞董事长刘庆峰:打造产学研结合的新型技术公司

Christina 发布于 2012-04-16 11:19 阅读次 

科大讯飞总裁刘庆峰科大讯飞于2010年10月推出第一代讯飞语音云平台。语音云基于云计算技术基础,其智能语音技术向互联网开发者开放,为移动互联网创业者和创新性企业提供语音技术服务。语音应用爆发需要的条件已经逐步成熟,主要表现在关键技术持续进步,达到实用门槛,智能终端、无线网络、云计算平台等环境条件基本完备,语音交互的终端和应用不断涌现。

步中的讯飞

1999年春节前夕,安徽合肥,现在的科大讯飞董事长、当时的中国科技大学在读博士生刘庆峰实际上正面临两难选择。他所在的中国科技大学的语音实验室一直与一家福建企业合作,可对方因为种种问题资金遇上了困难,连实验室的基本工资都发不出。作为这个实验室的负责人,他要么“事了拂身去”,出国并继续他的博士学业——这样整个团队势必会解散;要么留下来牵头带领这帮一起干的伙伴们继续前行。

其实,当时只要刘庆峰说明实际情况,跟自己就半点关系没有,但他还是不动声色地以个人名义借了钱回来给大家发工资。当时的刘庆峰和现在一样,认为未来每一部手机、轿车、家电、玩具,语音都将成为一个基本需求点,而且以科大的技术能力,有可能成为行业领导者。

在此之前,实验室参加“863计划”的比赛刚刚以3.0的高分夺得第一名。中科大的学生当时会聚了全国精英,而在团队里还有一些外面的技术高手,如果解散团队确实太可惜。资方并不懂技术,较为急功近利,经常进行研发方向的调整,把团队折腾得够呛,这时刘庆峰决定站出来解决这一切。这就是科大讯飞的成立故事,从里面不难看出这家公司的一些特征:技术驱动、对语音未来的笃定以及浓浓的校园风格。这使得它和美国硅谷一些知名技术公司拥有相似的气质。

可是语音到底什么时候能够产业化并且获得收益?没有人心里有谱。

其实早在20世纪70年代,世界各国就有很多组织开始研究语音技术,包括语音识别、文本朗读、指令判断等。到20世纪80年代,语音就开始被称为“未来5年的技术”,可过了一个又一个5年,它却似乎永远站在远方,离普通大众的距离从未真正接近过。在国内,20世纪80年代“863计划”也扶持了很多语音实验室进行相关研究,中科大、清华、声学所、语言所等均在其列,只是研究的侧重方向各有不同。

为什么语音技术难以产业化?因为语音技术说白了就是机器对人声音的识别、判断与输出,涉及到不同国家、不同口音的人和大量声学、语言学、数字信号处理知识。作为一项基础技术,它不仅考验语音听和写的能力、搜索能力、语音合成能力,还有复杂得多的与电脑相关的数据库等后台能力。

在单机时代,光是辨别语音所需要的庞大数据库存储和计算能力就让人头疼。要想语音识别准确,就必须有海量数据库进行匹配,还要通过算法来让它实现快捷高效,这几乎是一件不可能完成的任务,硬件的门槛将无数研究者阻挡在技术商用化的门槛之外。

可是从20世纪末开始,一切似乎正在发生变化。互联网的兴起让这样一种模式成为可能:大量的存储计算放在服务器端(云端)来完成,而前端的电脑则只需要采集声音和给出反馈就可以了。只不过网络带宽的限制以及电脑麦克风当时并不普及,语音技术还没获得生根发芽的土壤。

此时的科大讯飞,在拿到第一笔投资、还未能盈利之前,就做出了一项“风险很高”的决定:以企业的方式,与中国在语音研究领域领先或有特色的院校建立联合实验室形成了“产学研”结合的雏形。

它的逻辑很简单:语音技术未来一定很值钱;各个院校拥有不同细分领域的语音技术,融合起来才能具有威力;能将中国最好的做语音研究的人才尽可能网罗到一起。这笔“技术投资”,为讯飞今后的发展提供了坚实的基础,这也是讯飞从技术核心出发的第一项重要决定。

从B2C到B2B

心气高、兵马壮的讯飞,几乎在做第一个产品时就遭遇了挫折。当时科大做了一个面对消费级PC市场的统一输入法,用户可以用语音、手写等各种方式输入中文,可产品辛苦研究出来却没有人买账。

对当时的讯飞来说,消费级市场实在是一个难以跨越的坎,因为它意味着要为产品建立一个全国的销售网络、服务网络,光服务成本就入不敷出。再加上2000年初,“统一输入法”这样的产品并没有市场,消费者根本没有对于语音的认知,而键盘和鼠标已经足以满足他们在PC上简单的输入需求。

这时候,刘庆峰做出了第二个重要决定:砍掉辛苦努力了很长时间的B2C业务,专注于B2B企业级服务。

在之前1999年中国国际高新技术成果交易会上,科大讯飞只有几平方米见方的展台上迎来了几位客人,他们对讯飞的产品表现出不同一般的兴趣与了解。这是华为的人,作为移动通讯设备厂商,他们看到了语音对于移动通信产业的意义。双方几乎一拍即合,华为采购语音引擎,讯飞则成为其技术供应商。

好的技术总会有价值,与消费者相比,企业客户更专业、理解力更强,这让几乎全技术班底的科大讯飞不用再去做那些不擅长的事,将精力聚焦在了语音技术本身和运营服务中。

客户接二连三地来,讯飞也终于摆脱了刚开始的茫然,进入有序发展,并接连引入了联想投资、复星资本等投资方。联想和复兴的风格完全不一样,联想帮助科大建立了管理体系;复兴则完全信任科大,也给了科大更强的信心。2004年依靠B2B,讯飞实现了盈亏平衡。

已经有了一定实力的讯飞开始将目光再次瞄向最终用户,可它却用了一种由企业到用户的曲线方式。它向自己的电信运营商客户如中国电信提出了一项要求:希望从只提供技术引擎,变为自己来直接做运营与维护。这样来与用户发生接触。

与此同时,它还发现了另一个“金矿”,那就是教育市场。学习不过是“听说读写”,其中很多层面涉及语音,通过提供这一垂直场景的带读、朗诵语音评测等技术功能,讯飞已有斩获,基本上对教育市场(学习机)形成了近乎垄断的优势。

2008年,科大讯飞上市。在企业级市场上技术加实干,为它赢得了极大空间,可上市之后干什么?讯飞将目光重新投注在了其初衷上。

当时做统一输入法为什么失败?原因不是模式错了,而是模式没有适合当时的背景。而现在,背景环境似乎已经转向。

2007年开始,移动互联网迅速发展。iPhone手机和Android系统的发布让智能手机迅速开始普及,移动带宽到3G时代得到了明显提升,而手机天然的随身性和麦克风等硬件所赋予的良好交互性,为语音类产品发展提供了天然机遇。

讯飞一方面深入语音研究,对技术最前沿能做到什么样心里有底,另一方面,与数千家合作厂商日复一日的密切接触,能让它对产业引爆点的判断更加精准。

有人觉得,科大讯飞的几个发展点都踩得很正,并且符合语音技术产业化的成熟节奏:成立后不久就找到了华为、中兴等移动设备商作为客户,用稳定的收入站稳了第一步;后来又在合适的时间点与移动运营商合作,同时发现教育市场这片金矿,成为其中语音最有影响力的技术产品提供商。其实,讯飞也不是所有的点都踩到了地方,在这成功的背后,也有经历了许多不为人知的失败,但是讯飞始终坚持的是,朝着既定的方向,一直向前。

科大讯飞总裁刘庆峰科大讯飞于2010年10月推出第一代讯飞语音云平台。语音云基于云计算技术基础,其智能语音技术向互联网开发者开放,为移动互联网创业者和创新性企业提供语音技术服务。语音应用爆发需要的条件已经逐步成熟,主要表现在关键技术持续进步,达到实用门槛,智能终端、无线网络、云计算平台等环境条件基本完备,语音交互的终端和应用不断涌现。

步中的讯飞

1999年春节前夕,安徽合肥,现在的科大讯飞董事长、当时的中国科技大学在读博士生刘庆峰实际上正面临两难选择。他所在的中国科技大学的语音实验室一直与一家福建企业合作,可对方因为种种问题资金遇上了困难,连实验室的基本工资都发不出。作为这个实验室的负责人,他要么“事了拂身去”,出国并继续他的博士学业——这样整个团队势必会解散;要么留下来牵头带领这帮一起干的伙伴们继续前行。

其实,当时只要刘庆峰说明实际情况,跟自己就半点关系没有,但他还是不动声色地以个人名义借了钱回来给大家发工资。当时的刘庆峰和现在一样,认为未来每一部手机、轿车、家电、玩具,语音都将成为一个基本需求点,而且以科大的技术能力,有可能成为行业领导者。

在此之前,实验室参加“863计划”的比赛刚刚以3.0的高分夺得第一名。中科大的学生当时会聚了全国精英,而在团队里还有一些外面的技术高手,如果解散团队确实太可惜。资方并不懂技术,较为急功近利,经常进行研发方向的调整,把团队折腾得够呛,这时刘庆峰决定站出来解决这一切。这就是科大讯飞的成立故事,从里面不难看出这家公司的一些特征:技术驱动、对语音未来的笃定以及浓浓的校园风格。这使得它和美国硅谷一些知名技术公司拥有相似的气质。

可是语音到底什么时候能够产业化并且获得收益?没有人心里有谱。

其实早在20世纪70年代,世界各国就有很多组织开始研究语音技术,包括语音识别、文本朗读、指令判断等。到20世纪80年代,语音就开始被称为“未来5年的技术”,可过了一个又一个5年,它却似乎永远站在远方,离普通大众的距离从未真正接近过。在国内,20世纪80年代“863计划”也扶持了很多语音实验室进行相关研究,中科大、清华、声学所、语言所等均在其列,只是研究的侧重方向各有不同。

为什么语音技术难以产业化?因为语音技术说白了就是机器对人声音的识别、判断与输出,涉及到不同国家、不同口音的人和大量声学、语言学、数字信号处理知识。作为一项基础技术,它不仅考验语音听和写的能力、搜索能力、语音合成能力,还有复杂得多的与电脑相关的数据库等后台能力。

在单机时代,光是辨别语音所需要的庞大数据库存储和计算能力就让人头疼。要想语音识别准确,就必须有海量数据库进行匹配,还要通过算法来让它实现快捷高效,这几乎是一件不可能完成的任务,硬件的门槛将无数研究者阻挡在技术商用化的门槛之外。

可是从20世纪末开始,一切似乎正在发生变化。互联网的兴起让这样一种模式成为可能:大量的存储计算放在服务器端(云端)来完成,而前端的电脑则只需要采集声音和给出反馈就可以了。只不过网络带宽的限制以及电脑麦克风当时并不普及,语音技术还没获得生根发芽的土壤。

此时的科大讯飞,在拿到第一笔投资、还未能盈利之前,就做出了一项“风险很高”的决定:以企业的方式,与中国在语音研究领域领先或有特色的院校建立联合实验室形成了“产学研”结合的雏形。

它的逻辑很简单:语音技术未来一定很值钱;各个院校拥有不同细分领域的语音技术,融合起来才能具有威力;能将中国最好的做语音研究的人才尽可能网罗到一起。这笔“技术投资”,为讯飞今后的发展提供了坚实的基础,这也是讯飞从技术核心出发的第一项重要决定。

从B2C到B2B

心气高、兵马壮的讯飞,几乎在做第一个产品时就遭遇了挫折。当时科大做了一个面对消费级PC市场的统一输入法,用户可以用语音、手写等各种方式输入中文,可产品辛苦研究出来却没有人买账。

对当时的讯飞来说,消费级市场实在是一个难以跨越的坎,因为它意味着要为产品建立一个全国的销售网络、服务网络,光服务成本就入不敷出。再加上2000年初,“统一输入法”这样的产品并没有市场,消费者根本没有对于语音的认知,而键盘和鼠标已经足以满足他们在PC上简单的输入需求。

这时候,刘庆峰做出了第二个重要决定:砍掉辛苦努力了很长时间的B2C业务,专注于B2B企业级服务。

在之前1999年中国国际高新技术成果交易会上,科大讯飞只有几平方米见方的展台上迎来了几位客人,他们对讯飞的产品表现出不同一般的兴趣与了解。这是华为的人,作为移动通讯设备厂商,他们看到了语音对于移动通信产业的意义。双方几乎一拍即合,华为采购语音引擎,讯飞则成为其技术供应商。

好的技术总会有价值,与消费者相比,企业客户更专业、理解力更强,这让几乎全技术班底的科大讯飞不用再去做那些不擅长的事,将精力聚焦在了语音技术本身和运营服务中。

客户接二连三地来,讯飞也终于摆脱了刚开始的茫然,进入有序发展,并接连引入了联想投资、复星资本等投资方。联想和复兴的风格完全不一样,联想帮助科大建立了管理体系;复兴则完全信任科大,也给了科大更强的信心。2004年依靠B2B,讯飞实现了盈亏平衡。

已经有了一定实力的讯飞开始将目光再次瞄向最终用户,可它却用了一种由企业到用户的曲线方式。它向自己的电信运营商客户如中国电信提出了一项要求:希望从只提供技术引擎,变为自己来直接做运营与维护。这样来与用户发生接触。

与此同时,它还发现了另一个“金矿”,那就是教育市场。学习不过是“听说读写”,其中很多层面涉及语音,通过提供这一垂直场景的带读、朗诵语音评测等技术功能,讯飞已有斩获,基本上对教育市场(学习机)形成了近乎垄断的优势。

2008年,科大讯飞上市。在企业级市场上技术加实干,为它赢得了极大空间,可上市之后干什么?讯飞将目光重新投注在了其初衷上。

当时做统一输入法为什么失败?原因不是模式错了,而是模式没有适合当时的背景。而现在,背景环境似乎已经转向。

2007年开始,移动互联网迅速发展。iPhone手机和Android系统的发布让智能手机迅速开始普及,移动带宽到3G时代得到了明显提升,而手机天然的随身性和麦克风等硬件所赋予的良好交互性,为语音类产品发展提供了天然机遇。

讯飞一方面深入语音研究,对技术最前沿能做到什么样心里有底,另一方面,与数千家合作厂商日复一日的密切接触,能让它对产业引爆点的判断更加精准。

有人觉得,科大讯飞的几个发展点都踩得很正,并且符合语音技术产业化的成熟节奏:成立后不久就找到了华为、中兴等移动设备商作为客户,用稳定的收入站稳了第一步;后来又在合适的时间点与移动运营商合作,同时发现教育市场这片金矿,成为其中语音最有影响力的技术产品提供商。其实,讯飞也不是所有的点都踩到了地方,在这成功的背后,也有经历了许多不为人知的失败,但是讯飞始终坚持的是,朝着既定的方向,一直向前。


关键字: 讯飞 刘庆峰 语音技术
分享到: