科大讯飞高级副总裁杜兰:要在人工智能领域做到全球最好

中国智能家居网 2018-09-10 23:29:13 来原:人民网 
  • 推荐到:

科大讯飞高级副总裁杜兰:人机耦合给生活带来更多变化

今日,由人民日报社和招商局集团联合主办的“新时代、新产业、新动能——2018中国新产业峰会”在深圳举行,科大讯飞高级副总裁、博士杜兰在会议上表示,人工智能将会给我们带来什么?A.I.赋能,世界的下一种可能,每一个人掌握了A.I.,会使自己更强大,人机耦合的方式会给生活和生产带来更多新变化。

以下为杜兰发言全文:

非常高兴今天能够参加由人民日报社和招商局集团共同主办的中国新产业峰会,其实我们也知道,不论是人民日报还是招商局集团,在整个经济社会的发展中,都起到了非常重要的不同领域的引领作用。而人工智能今天要想获得新的发展,就必须要和这样的企业,和这样的一些单位在一起,共同去走进一个新的时代,而且是共同地开拓更多的无限的可能。刚刚看到麦肯锡在周三发布了最新的报道,指出未来AI会是新时代的蒸汽机,而且在不到十年的时间,我们会有70%的企业用上人工智能。

人工智能将会给我们带来什么?A.I.怎样给世界赋能。我们可以让机器模仿人说话声音,这就是语音合成能力的表现。今天我们为了实现这样一个技术,实际上只要一个小时的有效音频就可以达到了。我们看到,越来越多的技术的发展,给我们社会带来了非常多的想象的空间,也带来了无限的可能。

在去年,我认为有一件事情让大家把科大讯飞优点是低调,缺点是过于低调的公司,出现在公众的视野里,就是在2017年6月份,MIT著名的麻省理工科技评论进行了评选,每年都会将最具创新能力的一些技术进行榜单公布。在去年公布“全球50大最具技术创新力企业”的时候,我们看到中国已经有九家企业上榜了,大陆七家,台湾两家,我们看到科大讯飞这样的企业处于全球第六,中国第一的成绩。实际上越来越多的人认识到中国的企业在人工智能这场浪潮中获得非常好的发展机遇。

我们看到下一步发展中,我们发现在整个的过程中,人工智能被中国科技部和国家在各种产业规划里进行一些非常高度的重视,而且我们看到,人工智能产业的国家队也诞生了。去年11月份发布了一个BATI新一代人工智能发展平台,包括科大讯飞的智能语音,百度的无人驾驶,阿里巴巴的城市大脑和腾讯的医疗影像,是横跨各个应用场景的人工智能的方向上进行更多的拓展。我们也会看到,人工智能在中国已经在集聚各种各样的力量。

去年8月份已经有一些媒体知道这样一个消息,但是我们是10月份才公布的。媒体当时用了这样一个标题,叫做“逆天了”,来表达他们对此惊讶的心情。在去年,我们全球第一个通过国家医师资格认证考试笔试的机器人诞生了。8月份我们参加全国医学资格考试,后来我们看到这个成绩,满分是600分,及格分是360分,我们机器人考了456分,这意味着什么?就是说,它超过了96.3%人类考生的成绩,也就意味着它在人类比赛过程中处于前3.7%的位置。这样的一个机器人的诞生,实际上像国家卫计委曾经提出来的,中国每个家庭希望到2020年都有一个医生为大家提供服务,我想在今天,中国社会的环境下,我们的机器人医生会是一个非常好的帮手。

我们看到人工智能已经发展到了一定的阶段,大家对此是众说纷纭的。究竟它是一个泡沫还是一个威胁,它会给我们带来什么?在2014年,科大讯飞首先提出来了我们的观点,我们认为,人工智能,我们把它分成三个阶段,我们要看到我们的技术的边界,今天、明天和后天能做什么,我们究竟能够为人类带来哪些这样的变化。

首先看到第一个阶段,我们的运算智能,实际上就是机器能存会算的能力。这个能力在阿尔法狗战胜了人类,战胜了李世石,战胜了柯洁之后已经成为事实,机器在运算能力上已经超过了人类。

在第二个阶段就是感知智能。指的是我们的机器能看会认和能听会说的能力。而大家如果用讯飞输入法,已经可以听懂你的说话了。这样的能力,实际上我们在部分领域也已经是超过人类的能力了。

第三个阶段是认知智能。认知智能是让机器像人一样去理解和思考的能力。在这个阶段,不论是中国和美国都是进入一个无人区。即使我们在一些认知智能上不断获得突破,但是机器离人的能力实际上还有一定的差距的。

我们看到人工智能的阶段之后就要去思考,我们今天究竟怎样来实现它。比如,我们发现在几百种非常多的算法过程中,我们看到深度神经网络这个算法是最有效的一个方式,也是我们现在工业界为了实现人工智能的各种各样的应用采用的最多的方法。但是,它和人脑的思考相比,会耗费大量的数据。

我们也看到第二种路径就是全脑模拟。今天不论是美国、中国、欧盟,我们都加入到这样的过程中,就是希望用这样的技术来模拟整个人脑的生物过程。像2014年中国科技部提出来了脑计划,也是由科大讯飞来牵头进行,我们也是推出了我们的讯飞超脑,这一点也是希望能够在一定领域获得一些突破。

但是对于我们大家非常有启发的一个事情就是今天,我们希望看到,就是我们过去在模仿鸟类飞行的时候,我们并不是去制造它的翅膀,而是模仿了空气动力学,用这样的动能让我们今天人类能够在空中去飞翔。在智能领域,智能动力学也一样,它是模仿探索人类思考的人脑运转的奥秘,然后通过电子线路来实现它。这样就有可能产生我们今天大家非常关注的超脑。同样,这种智能就会出现,也会给我们带来非常非常多的无限的想象空间。

大家看到我们的成绩单,科大讯飞在这么多年来进行一些努力的时候,我们在语音识别、语音合成、自然语言理解、机器口语翻译、语音评测,后面在图像的理解和识别等诸多领域都是代表了全球比较高的水平,我们在各种比赛中都拿了全球第一。我想告诉大家,分享的比较多的一个成果,就在前天,9月7号,我们刚刚在全球最权威的语音识别领域的比赛中获得了四项任务世界第一的成绩。为什么说这一次的比赛特别值得强调呢?因为它被誉为史上最难的语音识别任务的比赛。因为在这个比赛过程中,我们既有远场的情况,又有高噪声,还有混响的情况下,怎么样机器识别。特别是当人进行自由交谈的过程中,我们的机器在分布式麦克风阵列识别的效果比我们近场识别的效果还要强。这个比赛说明我们不仅仅是在中文语音识别上获得了全球最好的水平,在英文语音识别上也依然是代表了全球最领先的水平。我们也看到,因为分布式麦克风阵列的识别效果非常好,未来我们各种各样的场景下的语音识别和理解的可能性就会越来越多。我们也看到,在这个里面大家都认为科大讯飞是做语音做得非常好,实际上我们一直是在智能语音和人工智能这个方向上进行探索。因为我们用的深度神经网络的算法,不仅仅是在语音识别、合成等等领域进行突破,还在图像识别理解上不断进行突破,还有机器的阅读理解。

值得一看的是SQuAD大赛,曾经微软说过谁能够掌握在自然语言理解能力上的突破,谁就可以未来在人工智能上掌握先机。在斯坦福举办的SQuAD大赛中间,我们看到脸书、谷歌、微软、IBM等非常多的单位都参加,是将十万篇的英文给机器去理解、阅读,由人来出题目,机器来回答,我们首次是代表亚洲进行参赛,就拿到了全球第一,而且刷新和改写了这样一个世界纪录。

我们再看到像Cityscapes这样一个比赛是由奔驰汽车厂家举行的,实际上是来探索我们在自动驾驶领域的图像的识别和理解技术。有44个单位参加,包括谷歌在内。我们也依然拿了全球第一。

越来越多的这样的在人工智能领域方向上的突破,给我们带来非常强的无限的可能。

今天我们说讯飞是一家登山型的企业,因为我们一直是用了最笨的办法,始终是坚持,19年一直做这样一个事情。上世纪我们庆峰董事长非常心怀梦想,带着很多科大毕业优秀的高材生,天姿骄子一起去做一个事情,就是要将中文语音市场掌握在中国人手里,并且做到全球最好,而今天,我们实现了,我们已经看到了非常非常多的未来。1999年创立以后,包括我们2000年成立这样的产业化基地,到2008年顺利上市,2009年我们占领了整个中文语音市场70%的份额。今天也是非常非常多的机会呈现在我们面前。在人工智能第三次浪潮到来的时候,其实我们是需要去思考的,这一次人工智能浪潮的复兴究竟能够走多远,能够走得多大,我想其实就是和人工智能发展的核心三个要素有关系。

一方面是我们刚才看到的核心的能力、核心算法,这是我们的核心。第二就是行业大数据的累积,其实中国今天面临着非常好的创新创业的氛围,而且移动互联网的发展,带来了非常多的大数据,在这里聚集。而且尤其还有我们第三个核心要素就是我们的行业专家。我们在和媒体谈融合的时候,人民日报社的各位领导、老师就是我们的行业专家,要参与进来,和我们一起定标准。所以,我们今天看到人工智能发展,就需要去将大家一起凝聚起来。

我们看到人工智能如果未来和社会生产、生活的方方面面发生关系,主要是看会改变哪两个方向?一方面是现在万物互联的背景下,人机交互,我们认为语音是个非常自然的方式。它就像人和人一样,人和机器未来会用语音进行一种沟通。第二,人工智能的特点,就是我们的人工智能可以学习最优秀的人类的能力,并且可以轻松地超越90%的普通人。我们要将这种能力把它好好用起来,其实就是非常有价值的工作了。

我们在人工智能产业化应用上也是会着重从不仅仅给个人赋能,还要给行业赋能来进行。刚才北外的彭校长提到希腊语,我们的希腊语也在33种语言内,我们可以用它进行比较日常的交互,而且也希望能够帮助大家去拓展更多的领域。在个人上,我们也希望可以真的推荐大家用一下讯飞输入法,因为今天已经是有6亿的用户,它的准确率高达98%,我相信您用完以后基本上是离不开了,而且还有22种方言,包括说中文可以很快地翻译成英文和大家交流。还有灵犀,是人和机器对话交流的窗口,可以调用后台非常多的的能力和你进行互动。

我们看看行业领域上的一些应用。首先我们在教育领域,其实教育领域是我们非常非常重视的一个战略方向。今天我们在整个教学考评管的各个领域都推出了相应的产品,我们在打造整个中国智慧教育的第一品牌。我们今天推出来的人工智能的一些方法,可以在后台将我们的学生的大数据,通过我们的方法进行学习和判断,给每个学生提供个性化的服务,让我们孩子每个人接收到的信息是根据他学习的知识图谱来进行定制的。这样会使得我们学生的学习时间大为减少,以及提高老师的各种效率。中国说了这么多年的因材施教的梦想,我们希望用我们的技术能给他们带来一些帮助。

像在医疗领域,首先大家能想到的,我们在牙科医生给您治疗的时候,或者B超的医生给您做腹腔检查的时候,他的两个双手都在忙碌着,如果他带了我们这样一个定时麦克风的耳机,通过说就可以把他说的话进行诊断的语言用结构化的方式记录下来,自动生成一个病例。实际上这是可以大大节约一线医生的时间的。

同时,我们的家庭医生的助手,像中国很多慢病,比如高血压、糖尿病,是需要医生实时进行关注和关心,我们这样的后台医生助手就可以为大家提供这种服务,还可以通过我们的语音机器人自动跟您去沟通,然后来观察和关心询问你的病情情况。

还有人工智能的辅助诊疗平台,在这个平台上,因为得益于去年8月份参加医疗影像识别大赛,我们拿了第一,我们不断刷新,像TB肺结节这样的病历,我们达到94.1%的准确率。这个准确率实际上已经接近了三甲医生诊断的水平。这样一些能力能为我们的医生提供一个辅助的诊断,在今天,在中国,我们已经有很多医院采用了这样一个医疗问诊平台,为医生提供更多的辅助的诊疗手段。

我们再看车载领域。2015年我们和美国NUANCE进行一场比赛,宝马在选择它的伙伴的时候,后来车速进行到100公里,车窗打开,而且空调声、各种噪声的环境下,真正能够达到可用门槛的语音交互能力只有科大讯飞一家。我们也看到,今天我们不仅仅是和宝马、奔驰、雷克萨斯等等非常多的30多家厂商和100多款车型进行了合作,未来我们相信汽车会是我们娱乐和工作、生活非常轻松的平台,语音在这种场景下就是一个刚需,能够帮到大家更安全地进行驾驶。

再看客服。为了提高它的能力,我们在客服领域用我们的机器人进行回答,可以帮助人工座席进行分流,我们为运营商、银行系统的客服进行服务,基本上代替了30%的人工,现在语音交互的能力让你感到越来越亲切。比如大家现在打电话给海底捞,跟你聊了半天的机器人小美,你不注意你都不知道它是一个机器人,它可以快速为你订餐、服务,这实现了你和客户之间的交流。

今天非常多的媒体朋友在这儿,在A.I. 媒体领域做了很多的探索,我们的技术实际上是希望它能够在采、编、播、审、存各个环节得到运用。比如采访领域,记者在前线写看到了很多情况,他自己要写下来,或者他采访我们著名的巴曙松教授,他其实就可以用我们的设备,把他的语音转成文字,不需要他一点一滴地去打,然后在编的环节,我们很多的音视频的资料,如果用我们的系统去转写一个小时的音视频5分钟就可以转写出来了,播的领域也会带来很多想象的空间,我们的机器人可以合成各种各样的声音。比如说前段时间,我们在中央电视台做了一个尝试,大家知道著名的播音员李易老师的声音是非常亲切,但是他已经去世了,我们用他的声音合成以后,讲解了《创新中国》,在央视首映礼上,他的学生,他的很多非常关注的人,非常感动,看到了声音又回到了他的身边。而且两会前还推出了和南方财经频道推出了虚拟主持人,用他们最著名的主播合成了一个机器人,可以替他去播股市新闻、财经新闻等等,非常非常多的应用场景就会出现了。

审核和保存和管理这样的环节上,我们的音视频中间的资料的审核通过机器会比人看得又快又准。

我们再看A.I.会给我们的生活带来什么样的变化。还是核心的语音交互的能力。现在市面上大家见到的机器人,如果是人机交互的方式,实际上70%多都是使用了科大讯飞后台给它的各种能力。包括在我们的客厅,在家庭里面通过这样的魔飞麦克风,可以通过它控制空调、冰箱等等,非常非常多的方式可以用语音去实现了。

我们从2010年已经将这样的语音云平台,这样的能力开放给了广大的开发者,开发者聚集越多,今天我们看到是一个非常好的形式,比如说在今天已经有89万的创业团队在上面凝聚了,而且覆盖的终端也达到了非常多的数据。我们也看到,它每一天给我们带来的日均使用次数是高达47亿人次。A.I.新的时代,我们不仅仅是给科学家去成就,让他希望用我们的算法和他的核心熟悉的领域相结合,同时我们也是希望给我们开发者赋能,也希望越来越多的人参与到这样一个时代。我们说A.I. 的时代,不仅仅是从业者的时代,更是我们在座每一个人的新时代。同样今天我们通过开场篇也想和大家传达我们的价值观,今天比人类更强大的不是A.I.,而是属于掌握了A.I.的人类。我们每一个人掌握了A.I.,会使自己更强大,我们的人机耦合的方式会给我们的生活和生产带来新变化。谢谢大家。

原标题:科大讯飞高级副总裁杜兰:人机耦合给生活带来更多新变化

扫一下,关注中国智能家居网微信号