当前位置: 新豪天地登录网址 > 科学研究 > 正文

语音技术有望保障移动互联,信息时代

时间:2019-09-19 00:27来源:科学研究
“如何面对新的挑战?唯一的办法就是借助于人工智能技术。”张钹指出。 语音技术有望保障移动互联“最后一厘米”安全 新豪天地登录网址,来源:《中国科学报》2017-06-08彭丽 “引

“如何面对新的挑战?唯一的办法就是借助于人工智能技术。”张钹指出。

语音技术有望保障移动互联“最后一厘米”安全

新豪天地登录网址,来源:《中国科学报》2017-06-08彭丽


“引擎,发动。”在电影《2012》里,众人为无法启动汽车着急,一位俄罗斯人只说了一句话就潇洒地开走了汽车。这样的场景不再科幻,在日常生活已触手可及。

“只需要解决好语音识别和声纹识别就能实现。”近日,在成都召开的世界未来科技论坛上,清华大学语音和语言技术中心主任郑方表示,语音信号形简意丰,语音技术构筑起的声音密码能保障移动互联“最后一厘米”的安全。该论坛由中国科学院、中国工程院和成都市人民政府联合主办。

移动互联,安全是大问题

信息技术的发展给安全识别带来了巨大挑战。以往的识别技术出现诸多漏洞。例如,美国斯坦福大学最新研发的一款人脸跟踪软件将人脸识别推到了风口浪尖。它可以通过摄像头捕捉用户的动作和面部表情,然后使用该软件驱动视频中的目标人物做出一模一样的动作和表情,效果极其逼真。

指纹与虹膜同样也难逃被攻击的厄运。2016年世界移动通信大会上,《华尔街日报》记者做了一个实验:他将手指在软胶模上按压,待模具成型后,使用一种黏土橡皮泥形成指纹模,iPhone手机瞬间被指纹膜解锁。而早在2015年,著名的混沌计算机俱乐部安全研究员Jan Starbug在接受采访时声称,高清晰度图像就能模拟出人的虹膜。这给生物识别科学家带来了很大冲击。

在此次论坛上,郑方援引了《2015中国电子银行调查报告》数据:有14.1%的用户在使用直销银行的过程中发生过个人信息泄露甚至是资金遗失的情况。“未来,移动互联网的安全威胁还将向平板电脑、智能电视、iOS设备等延伸。”

“解决问题的关键在于人的远程身份认证。”郑方将上述问题定义为信息安全的“最后一厘米”,要做的就是解决好人机之间的一致性。他坦言,目前包括对安全性要求极高的手机银行等在内的很多应用,其安全手段都还没有完全解决人机之间的一致性问题。

声音具有独一无二的优势

如何才能解决好人机一致性的问题?郑方给出的答案是:生物特征识别。他表示,要证明“我是我”通常有三种手段:一种是根据“我知道什么”,比如接头暗号、取款密码等;一种是根据“我有什么”,比如身份证件、IC卡、银行U盾等;还有一种是根据“我是谁”,即不凭借任何外界材料,“自己证明自己”。

用自己证明自己,就是所谓的生物特征识别。生物特征实际上包含两大类,大众熟知的通常是第一类生理特征,比如指纹、人脸、掌纹、虹膜、视网膜,包括DNA。郑方指出,还有一类是近来才逐步进入大众视野的行为特征,比如声纹、签名、步态、手势、键盘敲击等。“这些行为特征具有不断变化的特点。”两类生物特征都具有唯一性。

不过随着人工智能的飞速发展,那些被认为具有天然优势的生理特征,由于其外在表现缺少变化反倒越来越成为一种劣势。“原因在于这些特征容易被模仿。一旦不慎‘遗失’或被非法窃取,就会一‘丢’百丢。”郑方在接受《中国科学报》记者采访时表示,作为行为特征的声音信号具有形简意丰的特质,只要把丰富的语音信息加以综合利用,比如将语音识别与声纹识别相结合防止录音假冒,或是将情感识别与声纹识别相结合防止被胁迫,就能有效保障移动互联“最后一厘米”的安全。

郑方表示,声音的优势还在于可借此实现统一语音平台,用一句话解决所有问题。他以银行转账为例:用户只需要对着手机说:给张三转1000元钱,就能实现自动转款。此时,系统实际上同时完成了业务识别、意图理解及身份认证三个步骤。“从一句话里就能提取出身份、内容、性别、语种、口音、情感等信息,这就是声音具有的独一无二的优势。”郑方说。

智能语音产业前景广阔

几年前,郑方在各种场合作报告介绍语音识别和声纹识别技术时,鲜有人接受。转眼间,与语音技术相关的应用已雨后春笋般涌现,并形成了从核心技术研发到知识库提供再到应用、服务的完善产业链。

目前郑方团队的研发成果“声密保”已在国家信息中心投入使用,并预装上中国建设银行手机银行客户端,内测的最新版本具备了防录音、适应时变等能力。此前一年,其团队研发的声纹识别产品在建行试用,至今零投诉,用户也呈几何级增长。据悉,建行将对声纹取款、声纹支付、声纹转账等多领域进行全面覆盖。

“21世纪是语音的世纪。”郑方坚信,伴随智能语音技术的不断成熟及其与其他信息技术的不断融合,智能语音将在更多垂直行业得到应用,并推动这些垂直行业加快向智能化方向发展。智能家居、智能汽车、可穿戴设备都将是智能语音重要的应用场景。

编辑:华山

“21世纪是语音的世纪。”郑方坚信,伴随智能语音技术的不断成熟及其与其他信息技术的不断融合,智能语音将在更多垂直行业得到应用,并推动这些垂直行业加快向智能化方向发展。智能家居、智能汽车、可穿戴设备都将是智能语音重要的应用场景。

声音具有独一无二的优势

据中国银联统计,有14.1%的直销用户在经营活动中会发生个人隐私数据泄密,甚至发生资金损失。因为使用智能手机或使用智能设备的人未必是合法的人。专家们管这叫“人机的一致性”,或信息安全的“最后一厘米”,即人与设备之间基本处于1厘米状态。“在这1厘米之间,在人机一致性方面,最关键的问题是远程的身份认证或网上身份认证,在技术上如何保证准确性?采用人工智能的最新技术防护,可为钱袋子保驾护航。”清华大学信息技术研究院教授郑方,在7月31日“人工智能与信息安全”前沿研讨会上表明了自己的观点。

一句话,解决所有问题

指纹与虹膜同样也难逃被攻击的厄运。2016年世界移动通信大会上,《华尔街日报》记者做了一个实验:他将手指在软胶模上按压,待模具成型后,使用一种黏土橡皮泥形成指纹模,iPhone手机瞬间被指纹膜解锁。而早在2015年,著名的混沌计算机俱乐部安全研究员Jan Starbug在接受采访时声称,高清晰度图像就能模拟出人的虹膜。这给生物识别科学家带来了很大冲击。

移动互联,安全是大问题

清华唯一控股新成立的得意音通信息技术研究院在会上举行了成立大会,并将应用于门禁的声纹技术安全性进行了现场演示。其首席架构师肖永明介绍,声纹技术系统只需第一次使用时留下声音,日后通过说话方式就可把门打开,而即便自己的录音语音却无法开锁。

用自己证明自己,就是所谓的生物特征识别。生物特征实际上包含两大类,大众熟知的通常是第一类生理特征,比如指纹、人脸、掌纹、虹膜、视网膜,包括DNA。郑方指出,还有一类是近来才逐步进入大众视野的行为特征,比如声纹、签名、步态、手势、键盘敲击等。“这些行为特征具有不断变化的特点。”两类生物特征都具有唯一性。

“21世纪是语音的世纪。”郑方坚信,伴随智能语音技术的不断成熟及其与其他信息技术的不断融合,智能语音将在更多垂直行业得到应用,并推动这些垂直行业加快向智能化方向发展。智能家居、智能汽车、可穿戴设备都将是智能语音重要的应用场景。

语音识别作为人工智能的一项技术,在研讨会上展示了自身优势。

声音具有独一无二的优势

如何才能解决好人机一致性的问题?郑方给出的答案是:生物特征识别。他表示,要证明“我是我”通常有三种手段:一种是根据“我知道什么”,比如接头暗号、取款密码等;一种是根据“我有什么”,比如身份证件、IC卡、银行U盾等;还有一种是根据“我是谁”,即不凭借任何外界材料,“自己证明自己”。

信息时代:“最后1厘米”信息攻防不断升级

不过随着人工智能的飞速发展,那些被认为具有天然优势的生理特征,由于其外在表现缺少变化反倒越来越成为一种劣势。“原因在于这些特征容易被模仿。一旦不慎‘遗失’或被非法窃取,就会一‘丢’百丢。”郑方在接受《中国科学报》记者采访时表示,作为行为特征的声音信号具有形简意丰的特质,只要把丰富的语音信息加以综合利用,比如将语音识别与声纹识别相结合防止录音假冒,或是将情感识别与声纹识别相结合防止被胁迫,就能有效保障移动互联“最后一厘米”的安全。

(原载于《中国科学报》 2017-06-08 第4版 综合)

“声纹技术之所以安全,是因为包含了固定和变化的特征,使其安全性大大提高。”肖永明说,目前这项技术已在中国建设银行等多家企业推广应用。

郑方表示,声音的优势还在于可借此实现统一语音平台,用一句话解决所有问题。他以银行转账为例:用户只需要对着手机说:给张三转1000元钱,就能实现自动转款。此时,系统实际上同时完成了业务识别、意图理解及身份认证三个步骤。“从一句话里就能提取出身份、内容、性别、语种、口音、情感等信息,这就是声音具有的独一无二的优势。”郑方说。

在此次论坛上,郑方援引了《2015中国电子银行调查报告》数据:有14.1%的用户在使用直销银行的过程中发生过个人信息泄露甚至是资金遗失的情况。“未来,移动互联网的安全威胁还将向平板电脑、智能电视、iOS设备等延伸。”

中科院院士张钹阐述,“人工智能既有助于信息安全,同时也给信息安全带来诸多危险。”因为进攻方、入侵方完全可以利用人工智能技术加强进攻能力。随着网络的发展扩张,可能被入侵的地方或进攻的地方也会随之增加,漏洞会愈来愈多,缺陷也会增多,可进攻的地方也就越来越多。

信息技术的发展给安全识别带来了巨大挑战。以往的识别技术出现诸多漏洞。例如,美国斯坦福大学最新研发的一款人脸跟踪软件将人脸识别推到了风口浪尖。它可以通过摄像头捕捉用户的动作和面部表情,然后使用该软件驱动视频中的目标人物做出一模一样的动作和表情,效果极其逼真。

几年前,郑方在各种场合作报告介绍语音识别和声纹识别技术时,鲜有人接受。转眼间,与语音技术相关的应用已雨后春笋般涌现,并形成了从核心技术研发到知识库提供再到应用、服务的完善产业链。

每天拿着手机点点画画、说说笑笑,人们无法知晓自己的信息有多少被泄露。“信息时代无隐私”,或许可以这样安慰自己。然而,一旦钱袋子被窃,人们再也无法淡定了。

《中国科学报》 (2017-06-08 第4版 综合)

“引擎,发动。”在电影《2012》里,众人为无法启动汽车着急,一位俄罗斯人只说了一句话就潇洒地开走了汽车。这样的场景不再科幻,在日常生活已触手可及。

可见,在信息通道的“最后1厘米”处,攻防技术竞争在不断升级。

一句话,解决所有问题 语音技术有望保障移动互联“最后一厘米”安全

郑方表示,声音的优势还在于可借此实现统一语音平台,用一句话解决所有问题。他以银行转账为例:用户只需要对着手机说:给张三转1000元钱,就能实现自动转款。此时,系统实际上同时完成了业务识别、意图理解及身份认证三个步骤。“从一句话里就能提取出身份、内容、性别、语种、口音、情感等信息,这就是声音具有的独一无二的优势。”郑方说。

“智能包括许多不同的能力:论理能力、联想能力、假设能力以及很多不同的能力。这几项只是其中一部分。”他说。

如何才能解决好人机一致性的问题?郑方给出的答案是:生物特征识别。他表示,要证明“我是我”通常有三种手段:一种是根据“我知道什么”,比如接头暗号、取款密码等;一种是根据“我有什么”,比如身份证件、IC卡、银行U盾等;还有一种是根据“我是谁”,即不凭借任何外界材料,“自己证明自己”。

智能语音产业前景广阔

“人工智能的进展得益于大量的数据,而数据如何驱动人工智能的发展?”庄炳湟自答,“第一,观测维度问题;第二,掌握统计分析;第三,数据量够不够”。

■本报记者 彭丽

指纹与虹膜同样也难逃被攻击的厄运。2016年世界移动通信大会上,《华尔街日报》记者做了一个实验:他将手指在软胶模上按压,待模具成型后,使用一种黏土橡皮泥形成指纹模,iPhone手机瞬间被指纹膜解锁。而早在2015年,著名的混沌计算机俱乐部安全研究员Jan Starbug在接受采访时声称,高清晰度图像就能模拟出人的虹膜。这给生物识别科学家带来了很大冲击。

业界发现,已有人使用人工智能技术使攻击智能化,所制造的新病毒或入侵新手段,可自动寻找网络的缺陷进行进攻,攻击速度越来越快,出现频率也在增高。

在此次论坛上,郑方援引了《2015中国电子银行调查报告》数据:有14.1%的用户在使用直销银行的过程中发生过个人信息泄露甚至是资金遗失的情况。“未来,移动互联网的安全威胁还将向平板电脑、智能电视、iOS设备等延伸。”

“解决问题的关键在于人的远程身份认证。”郑方将上述问题定义为信息安全的“最后一厘米”,要做的就是解决好人之间的一致性。他坦言,目前包括对安全性要求极高的手机银行等在内的很多应用,其安全手段都还没有完全解决人机之间的一致性问题。

李军告诉与会者,“研究人员常常用人工智能方法抽取或自动抽取一些攻击方的特征。找到特征后,能较快了解攻击来自哪里,进行阻击。然而,这一手段也可以被其他人用来自动挖掘软件的漏洞或后门,可以使攻击方快速发现一些特征和漏洞,更快地实现攻击”。

“只需要解决好语音识别和声纹识别就能实现。”近日,在成都召开的世界未来科技论坛上,清华大学语音和语言技术中心主任郑方表示,语音信号形简意丰,语音技术构筑起的声音密码能保障移动互联“最后一厘米”的安全。该论坛由中国科学院、中国工程院和成都市人民政府联合主办。

不过随着人工智能的飞速发展,那些被认为具有天然优势的生理特征,由于其外在表现缺少变化反倒越来越成为一种劣势。“原因在于这些特征容易被模仿。一旦不慎‘遗失’或被非法窃取,就会一‘丢’百丢。”郑方在接受《中国科学报》记者采访时表示,作为行为特征的声音信号具有形简意丰的特质,只要把丰富的语音信息加以综合利用,比如将语音识别与声纹识别相结合防止录音假冒,或是将情感识别与声纹识别相结合防止被胁迫,就能有效保障移动互联“最后一厘米”的安全。

在庄炳湟记忆中,神经网络研究之初,不曾被归属于人工智能。而今天,学术界都希望神经网络能纳入传统的符号逻辑,做一些深层的研究。自上世纪50年代开始,经过70年代、80年代、90年代,科学家们在实验室做了许多工作,语音识别技术出现了诸多新进展。但直到2007年,学术界才认为,语音识别是人工智能的一部分。

“引擎,发动。”在电影《2012》里,众人为无法启动汽车着急,一位俄罗斯人只说了一句话就潇洒地开走了汽车。这样的场景不再科幻,在日常生活已触手可及。

目前郑方团队的研发成果“声密保”已在国家信息中心投入使用,并预装上中国建设银行手机银行客户端,内测的最新版本具备了防录音、适应时变等能力。此前一年,其团队研发的声纹识别产品在建行试用,至今零投诉,用户也呈几何级增长。据悉,建行将对声纹取款、声纹支付、声纹转账等多领域进行全面覆盖。

庄炳湟表示,“我对得意音通有一些期许。因为在很多特定功能下,人工智能做得比人好。在声音方面,1991年就已证明,对连续数字的识别,超过10-11个,机器一定做得比人好。因为一般人要识别一串数字,需要转换,记忆会产生困难,在这个过程中,人很容易出错。对于1秒钟的声音,声纹技术识别错误率仅3%。而1秒钟的声音,对人耳而言时间太短,难以判别”。

移动互联,安全是大问题

“只需要解决好语音识别和声纹识别就能实现。”近日,在成都召开的世界未来科技论坛上,清华大学语音和语言技术中心主任郑方表示,语音信号形简意丰,语音技术构筑起的声音密码能保障移动互联“最后一厘米”的安全。该论坛由中国科学院、中国工程院和成都市人民政府联合主办。

应邀参加论坛的美国工程院院士庄炳湟阐释了人工智能的内涵,回顾了人工智能探索的一些历程。

目前郑方团队的研发成果“声密保”已在国家信息中心投入使用,并预装上中国建设银行手机银行客户端,内测的最新版本具备了防录音、适应时变等能力。此前一年,其团队研发的声纹识别产品在建行试用,至今零投诉,用户也呈几何级增长。据悉,建行将对声纹取款、声纹支付、声纹转账等多领域进行全面覆盖。

信息技术的发展给安全识别带来了巨大挑战。以往的识别技术出现诸多漏洞。例如,美国斯坦福大学最新研发的一款人脸跟踪软件将人脸识别推到了风口浪尖。它可以通过摄像头捕捉用户的动作和面部表情,然后使用该软件驱动视频中的目标人物做出一模一样的动作和表情,效果极其逼真。

“实际上,科学家开展语音识别研究工作时,几乎没有想过是人工智能的一部分。而今天,大部分人都会把这类研究归类于人工智能。”庄炳湟指出。

几年前,郑方在各种场合作报告介绍语音识别和声纹识别技术时,鲜有人接受。转眼间,与语音技术相关的应用已雨后春笋般涌现,并形成了从核心技术研发到知识库提供再到应用、服务的完善产业链。

用自己证明自己,就是所谓的生物特征识别。生物特征实际上包含两大类,大众熟知的通常是第一类生理特征,比如指纹、人脸、掌纹、虹膜、视网膜,包括DNA。郑方指出,还有一类是近来才逐步进入大众视野的行为特征,比如声纹、签名、步态、手势、键盘敲击等。“这些行为特征具有不断变化的特点。”两类生物特征都具有唯一性。

清华大学信息科学与技术国家实验室常务副主任李军认为,“人工智能是一把双刃剑,要看掌握在什么人手里,为什么样的目标服务。人工智能技术既可以让生活更美好,也确实让信息安全面临很多严峻挑战”。

“解决问题的关键在于人的远程身份认证。”郑方将上述问题定义为信息安全的“最后一厘米”,要做的就是解决好人之间的一致性。他坦言,目前包括对安全性要求极高的手机银行等在内的很多应用,其安全手段都还没有完全解决人机之间的一致性问题。

中国建设银行信息技术管理部总经理金磐石介绍,自使用声纹识别等新一代技术以来,中国建设银行手机银行保证绝对安全。依靠新一代银行系统,中国建设银行服务于全球6.83亿个个人客户,20余万台自助设备。手机银行用户已经达到2.2亿户。高峰时,每天交易量是8.97亿笔,每秒钟达到1.15万笔,可用率99.99%,重要的系统达到100%。一年365天,停机时间不超过52分钟。

编辑:科学研究 本文来源:语音技术有望保障移动互联,信息时代

关键词: