工控网首页
>

新闻中心

>

业界动态

>

科大讯飞:5年内 科技会场没机器人端茶倒水就太low了

科大讯飞:5年内 科技会场没机器人端茶倒水就太low了

2015/12/23 15:18:46

都说今年是“人工智能之年”,科大讯飞在迎来了年底收官之作。如果说,万物互联对坊间而言还是一个比较模糊的概念的话,那么,今天下午,以“AI复始,万物更新”为主题的科大讯飞2015年年度发布会就是对人工智能的全景性思考。科大讯飞董事长刘庆峰现场指出,已经发展了60年的人工智能未来将迎来三种机遇:

第一,在万物互联的浪潮下,以语音为主、以键盘触摸为辅的人机交互时代已经到来。未来3到5年,我们周围的90%的设备,将不是手机,而是穿戴式设备、智能家居以及可能是服务机器人。这时候没有屏幕离你很远,不可能触摸它,而语音为主的时代正在到来。

第二,人工智能未来一定会像水和电一样无所不在,广泛而深入到影响到我们每一个人生活。我们甚至认为在未来5年之内在这样的会场,一定会有机器人给大家端茶倒水,否则这样一个发布会实在是太没有科技含量。

第三,以语音和语言为入口的认知革命,将推动人工智能梦想成真,这是一条人工智能走认知计算的必由之路。

现场,刘庆峰发布了基于语音交互技术基础上的交互界面——AIUI,以及录音宝、录音笔、讯飞听见网、智学网和E听说等To C产品。

科大讯飞:5年内 科技会场没机器人端茶倒水就太low了

科大讯飞董事长刘庆峰

人工智能发展历程:聪明的助手

1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年中,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而当下,正处于人工智能爆发的前夜。在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度。

“人工智能未来会像水和电一样无所不在”刘庆峰表示。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。

而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,即从语音与语言入手实现机器的认知革命。科大讯飞也正是从这个方向上取得了成果。

从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,包括获得JWSLT机器翻译评测冠军,包括其产品在国内替代人工进行英语口语测试与普通话级别考试,包括其产品在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进,并在这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。

AIUI:机器人未来能参加高考

在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器人能够同人一样参加高考。

而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。

于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。

AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等——科大讯飞一些系列尖端科研成果和完善服务,代表业界最高水准的技术产品。开发者将可以一键获取解决方案,通过集成麦克风阵列、集成SDK以及定制云端服务等方式。

科大讯飞此次也将AIUI应用到了发布会中,现场,所有发言人的演讲被实时同步转写成文字,显示在两侧大屏幕上。

人机交互:打破山东大汉困境

科大讯飞:5年内 科技会场没机器人端茶倒水就太low了

也许你对年初那个被车载语音导航逼疯的山东大汉还印象深刻,一个普通话不标准的山东人,在环境嘈杂的车上,远距离与不那么智能的导航交流,产生的结果就是让人抓狂的识别与交互。而本次发布会上,科大讯飞通过远场抗噪、方言识别、全双工交互、多轮对话、纠错等系列技术,成功打破了山东大汉的困境。

科大讯飞通过定位、麦克风波束形成、回声消除、抗混响、唤醒一系列技术形成的系统解决了远距离识别问题。其次,科大讯飞实现了人机对话控制由单工(如手机语音助手的按一下说一下)转变成全双工(人和机器可以像打电话那样同时听和说)的交互转变。

多轮交互实现了机器对上下文连贯理解,使得人机交流不再是单调的一问一答,而是可以连续交流。再加上对话纠错机制,人可以随时纠正对话中双方的错误,使说过的话不再是覆水难收。通过以上一系列技术形成的系统,极大降低了环境、说法、习惯等对人机交互的干扰,实现高度自然的人机交互体验。

智学网:机器阅卷

在讯飞超脑的应用层上,科大讯飞面向教育市场推出了智学网与E听说。

目前,已有全国31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,希望解决“老师忙、学生盲、资源茫”的教育行业痛点。

具体产品方面,不仅实现了语音与文字的识别、合成与分类,还实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,在教育资源的高效和个性化辅导方面做了试水。

刘庆峰表示,智学网与E听说是之前推出的讯飞超脑的应用产品,未来还将有更多人工智能技术在C端教育市场发力。

目前,科大讯飞中文作文机器阅卷技术在2015年合肥、安庆中学会考上已经取得应用,人机阅卷对比结果显示机器阅卷已经比人工阅卷更准确。

讯飞听见:可能会让速记失业

针对大型会议、现场采访、个人交流等场景下的内容整理需求,科大讯飞集成了单麦克解混响技术、阵列解混响技术、口语化识别等众多最新研究成果,全球首发语音科技产品——讯飞听见录音宝、录音笔和讯飞听见网。

刘庆峰表示,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。

在现场,科大讯飞还邀请了10家知名速记公司的工作人员,进行同台PK。从现场两侧大屏幕效果看,其速度和准确率可能会在未来淘汰很大一部分速记从业人员。

据悉,科大讯飞网能够实现双屏智能编辑、角色自动分离、音频精准定位、快速按句回听、发言实时上屏、格式多种多样等功能;录音宝能解决常见的录音回听不方便、导出录音复杂、录音文件无法重命名等问题;录音笔既增强了传统录音笔的录音音质、播放效果,更配备智能语音转文字服务。

从科大讯飞发布的产品来看,订票、改签、开空调、关加湿器、批改作文等等一律完成,普通话、英语、方言也都能分辨,俨然一个聪明的生活助手,并在没有屏幕的情况下,通过语音完成交互。

正如刘庆峰所说,在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。

投诉建议

提交

查看更多评论
其他资讯

查看更多

未来十年, 化工企业应如何提高资源效率及减少运营中的碳足迹?

2023年制造业“开门红”,抢滩大湾区市场锁定DMP工博会

2023钢铁展洽会4月全新起航 将在日照触发更多商机

物联之星五大榜单揭榜!中国物联网Top100企业名单都有谁-IOTE 物联网展

新讯与肇庆移动圆满举办“党建和创”共建活动暨战略合作签约仪式