新闻
您的位置:新闻>>详细信息

微软AI讲堂走进上海交大

发布时间:2017-04-19

 

以“拥抱智能,对话未来”为主题的讲座,于4月13日在陈瑞球楼报告厅开展。此次讲座由微软亚洲研究院(下述简称亚研院)主办,由上海交通大学工程训练中心及电院团委共同承办。其中亚研院国际计算语言学协会(ACL)候任主席,微软亚洲研究院副院长周明博士作了题为“以深度神经网络为基础的自然语言处理”学术报告。这天的讲堂独具魅力,报告厅座无虚席,小编相信,如此高的人气不仅是因为这次讲座能满足大家对微软最新科技的好奇,更是因为周明博士深入浅出的讲解。在两小时的介绍与讲解中,周明博士用微软开发的app、机器人小冰等实例,结合算法,向大家展示人工智能的发展现状。在一声声惊叹中,小伙伴们都对AI和NLP领域有了初步的了解并产生了浓厚的兴趣。
 
 
 
下面,就让小编带大家回顾一下这次讲座。
在讲座中,周明博士主要谈到两个方面,其一是微软亚洲研究院在自然语言处理领域的创新,其二是深度神经网络在自然语言处理中的应用。
  
首先周明博士向同学们介绍了微软机器翻译的发展:微软的机器翻译项目从2006年立项开始,至今已逾10年。微软先后在2010年和2012年实现了机器翻译的第一、第二版,并在2014年实现了skype translation的实时语音翻译,这一项目让两位没有掌握共同语言的人实现了交流的可能。在2016年,微软翻译更是更进一步,利用深度神经网络进一步优化了翻译的准确性。同时,微软翻译更是将支持范围扩大到了方言。
 
博士接下来还介绍了微软的产品和应用软件:Skype Translator、必应词典、必应翻译、必应输入法、微软对联、微软字谜等等。这些产品也都是人工智能算法发展的见证者。
 
然而说起微软人工智能,其代表作还是微软小冰。想必很多同学都用过微软小冰。小冰聊天机器人拥有超过4000万用户,超过200亿次的对话,拥有自我学习和演进能力神经网络建模。用过小冰的同学应该
会有一个感受,ta与以往的聊天机器人有些区别。小冰回复的不是机器简单僵硬的语句,而是生活化的语言,与小冰交流会带给你真正与人交流的体验。
那么你是否思考过小冰跟你对话时的处理方式?
是在基于庞大的数据库下,对用户输入的语句进行搜索后,在语料库中找到一个回答,直接复制,返回给用户。还是另有算法?
 
小编在这里先卖个关子。
 
接下来周博士介绍了在人工智能发展春天中使得机器翻译技术突飞猛进的算法——深度神经网络算法(Deep Neural Network)。“深度“ 在这里指的是神经网络中含有诸多层数。
 
周博士用类比的方法,深入浅出的讲解这种算法。让我们一起回忆一下:
真正的神经元通过输入和强度的组合决定要不要生成脉冲。而人工神经元不会产生脉冲,但会生成一个数值。神经元的函数就是通过非线形函数计算输入的加权乘以权重之和。神经网络会通过模型调整边的权重让它更可能去得到正确答案。也就是说计算机通过编译后的数据的权重来决定输出。
 
在DNN算法下,编译器与解码器按照权重输出。当然在结合语言学知识(按照树结构解码相应字符串)(Linguistic knowledge)和相应领域背景知识(domain knowledge),输出的句子能更加准确。
 
周博士这样感叹到:我们将之前的软件用DNN算法重新更新后,效果出奇的好。机器翻译技术突飞猛进,一年增长了4个点(在此之前,在全世界的计算机科学工作者的努力下,每年增长为1个点左右)。
 
在介绍如此强大的算法之后,让我们回到小冰——聊天机器人这个话题上。

对于聊天机器人的实现,我们需要对用户输入的内容进行分析。周博士介绍了一种话题敏感的神经网络的反应机制(TA-Seq2Seq)。正是这个算法,让机器人的抓住聊天时的关键,使得给出的回答丰富不刻板。
  
 
让我们通过可视化来了解一下这个强大的算法吧!(u1,u2,u3,u4为用户输入,Response为机器人的回答)

有了这些,machine还可以做阅读理解啦!
 
周博士介绍:在目前的测试中,100道题机器可以答对76道,而人平均答对84道。在更强劲的算法下,机器超过人的阅读理解能力将可能实现。当你想了解某个网页的具体信息时,大多数情况下,你需要仔细浏览其中的信息。而在机器能阅读理解并能对提问进行反应的机制下,你只需要向一个储存网页相关信息的机器人进行提问,这样就能快速得到你想要的信息了。
   
接下来,讲座进入到提问环节。
 
在问答环节,周博士不时对提问者的精彩提问发出赞叹。回答时总能结合自己研究的领域,给出专业的回答。同时,令小编印象深刻的是周博士严谨的态度,遇到不确定的问题,他没有一带而过,而是表示需要回去讨论确定才能给出答复。
 
有同学问周老师如何才能快速地入门自然语言处理这一研究领域?
周明博士这样回答:自然语言处理包括句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、问答系统和对话系统等部分。随着深度学习在图像识别、语音识别领域的大放异彩,人们对深度学习在NLP的价值也寄予厚望。再加上AlphaGo的成功,人工智能的研究和应用变得炙手可热。自然语言处理作为人工智能领域的认知智能,成为目前大家关注的焦点。万事开头难,在这里我提出一些建议,希望能帮助碰到问题的同学建立信心。
首先在NLP领域快速学会第一个技能,比如找到一个开源项目,自己编程实现一下这个示范程序的算法。再按照项目提供的标准测试集测试自己实现的程序,在此基础上,再看看自己能否进一步完善算法或者实现,取得比示范程序更好的结果。其次,选择第一个好题目。要找到自己喜欢的研究领域,然后充分调研这个领域目前的发展状况,在这些基础上进行选题创新。这是对学术型研究生的建议。希望能对正在研究NLP的同学有所帮助!
 
 
小编认为大师与新锐的信息技术人才的对话,是一种技术思想交流,也是一种研究态度的传承。
 
   “Computers are useless. They can only give you answers.” - Pablo Picasso
在最后,引用Pablo Picasso的名言作为结语。虽然在某些领域,计算机的智能似乎已经超越了人类智力达到的高度,但实际上计算机也只是在已有算法和数据结构下,将答案返回给用户。当我们希望追求更卓越AI性能时,还要靠一代代信息人才对算法的改进和完善。希望这次讲座,能激发大家的热情,解决大家对于AI的困惑,这也正是微软亚洲研究院的举办这次活动的初衷。
 
 编辑:楚朋志                 
摄影:微软学生俱乐部