自从苹果正式在iPhone 4S采用Siri语音技术后,市场对接下来即将推出的iPhone 5机一部发展充满期待,在语音声控越来越深入进驻人类生活的情况下,部分开始切入相关领域的个股,值得长期关注。
80年代美国影集《霹雳游侠》里的经典对话:“伙计”“嗨!老哥”,主要就是描述人与智能汽车的不可能任务,霹雳车不仅会说话,还能接受并执行主人的指令,终于在Siri看到了。
人类自工业革命以来,对“机器”的操作方法从手动、脚踏、以至于口述,都是单方面的传达指令,遇到复杂模式,还必须参阅使用说明书,才能完成操作。而近几年来触控功能盛行,主打最人性化的人机界面,殊不知在很多场合,使用者可能连手都懒得动,最终就应回归到最人性的下达指令模式——声控。
可互动对话,也是搜索引擎
语音辨义功能是人工智能AI中较简易且成熟度高的一环,但真正要做到精确判断不同语言是不容易的,过去在人工智能研究领域中,日本最热衷于开发各种智能机器人,在投入愈10亿美元后,至今仍无法商业化上市,而美国确实选择以个人电脑为应用领域,遂成就了Siri这样划时代的产品。
苹果产品总是给人创新的期待,去年底的iPhone 4S就具备了语音秘书Siri这样的功能,能与使用者对话,并主动搜寻相关网站,进而接收执行命令。
话说Siri的起源,可是美国国防部的人工智能研究计划,当时召集了25家一流学府的300多位顶尖人才,投入自行学习、建构思维的人工智能研究,并于2007年成立Siri公司,继续投入商业化助理秘书辅助软件开发,到2010年才被苹果收购。
起初苹果对Siri也没有给予特别的关爱眼神,主要是语音辨义早就广泛应用在众多手机上,常见的为使用者说出想要联络者的名称,就可以直接拨电话出去。
不过,Siri可不是一般的辨义软件,除了具备精确的语音辨义功能外,因为投入的早、烧的钱多,构筑了相当规模的资料库及演算法,通过人工智能学习功能,可分析问题、找出解答、并提供建议,也是强大的搜索引擎。更重要的是,通过使用者的经验,Siri资料库仍不断更新与新增。
在Siri问世之前,创新有余的中国业者就已经将语音控制的功能放入电视、厨房家电及音乐播放器上,使用者可以对着电视遥控器说出要转的台数、用声音启动家电运作、以及对着音响点歌,动口不动手,但大致上仍只是小范围的互动,回复模式固定,称不上人工智能。
然而,iPhone 4S的Siri功能,目前也仅支持英语、德语、法语三种,对于转折多、发音难的中文,可就没那么容易上口。
为了应对使用者不可预期的要求,资料库必须建立庞大的处理情境,以便让系统快速找出解答。由于一般小家电的指令受限,尚可将资料库存入在微处理器的存储空间,但向Siri这样广泛的个人秘书功能,就必须利用云端的空间来存放资料。
当然,顺畅的网络带宽是必须的,未来应用也不仅局限在手机上,就像今年初陆续有车厂宣布将推出支持Siri的汽车,显示车用电子有其商机。
中文难度高,要靠合成技术
为了要精确辨义,收话品质好坏非常重要,所以iPhone 4S采用了4颗MEMS(微机电系统)麦克风,除了可加强接收端的收话,亦可降低环境噪音。
此外,语音发话的合成技术也不容易,由于中文语音变化多,难以用有限的韵律规则资料库涵盖所有情况,故必须兼有规则库及类神经网络技术,来演算生成语音规律。以确保语音合成自然流畅,并贴近真人发音,而音质好坏,取决于软件的合成技术及发音系统上。
今年中国粗略估计有1.5亿万部智能手机,以及超过3000万台网络电视,要能抗衡Siri,势必得先解决资料云的问题。今年3月下旬,中国联通宣布与科大讯飞共同签署战略合作框架协议,由科大讯飞提供新一代语音云系统,构成中文版语音辨义服务,堪称中国版的Siri。
投资者可适当关注有关语音声控的个股,未来一段时间此类股值得期待。