未来IT什么样?——微软亚洲研究院展示前瞻技术
- 2013-11-5 13:00:53
- 类型:原创
- 来源:电脑报
- 报纸编辑:邓晓进
- 作者:
【电脑报在线】10月30日,微软亚洲研究院创新日活动上,21项创新应用项目让记者体验了一次奇幻的技术旅程。
10月30日,微软亚洲研究院创新日活动上,21项创新应用项目让记者体验了一次奇幻的技术旅程。
有帮助电脑感知人情绪的3D面部表情跟踪;
有基于Kinect的手语翻译系统;
还有给中风患者上肢康复训练的应用、手机上的发型设计、利用大数据预测城市未来……
所有项目都体现了微软亚洲研究院在自然用户界面、云计算和移动技术、大数据和机器学习上最新成果,它们正在逐步变成微软产品的一部分,最终影响和改变人们的工作和生活。
Azure上的数字文化遗产保护
微软正在将IT技术应用到文化遗产保护上面
利用Windows Azure可以实现文化遗产的虚拟保护
下午15点20分,在北京中关村丹棱街5号微软大厦1号楼,研究员打开的两台电脑屏幕上都显示同样场景里的同一个罗马雕塑作品,区别是两台电脑影像中分别有两位研究员的身影。
“我正在和东京大学的研究人员实时讨论这个雕像。” 微软研究员说明影像中另一人此时在东京。
“我们与东京大学合作开发了一个3D远程协作框架,利用Windows Azure,实现文化遗产的虚拟保护。”该项研究的成果包含用于展示巨型文化遗产3D模型的高效显示系统,以及供远程用户与这些3D模型之间进行互动的通信框架。
已有的建模技术已经能够让用户建立大型的3D模型。然而由于普通硬件的性能制约,这些大尺寸模型无法被实时分享并呈现在用户的电脑上。
这个借力云平台的大尺寸3D模型显示系统,可以很好地处理模型和图像的数据,有效平衡服务器和客户端的负载,用户能够在云中顺畅地对大数据进行操作。
微软的文化遗产保护项目不止一个。在“eHeritage:敦煌飞天”项目中,微软研发的十亿级像素数字相机系统用拍微距的精细展现出丰富景深。
敦煌莫高窟以精美的壁画闻名于世。然而,人为的破坏和生态的恶化,使敦煌这一历史文化遗产面临着严峻的考验。
微软亚洲研究院向敦煌研究院捐赠的专门为莫高窟量身定制的十亿级像素数字相机系统 “飞天号”,特色是利用焦点合成技术来高精度地捕捉被拍摄物的立体细节。
当拍摄具有复杂景深变化的斜披、洞顶和佛龛时,“飞天号”能够自动计算景深,分次拍摄多张同一场景但焦点不同的图像,然后将所有的图像合成,使得同一场景下的每尊塑像、每处壁画都呈现焦点清晰的影像,阴影区域也保留了丰富的细节。
研究员介绍的这幅图像,景深1.5米,通过程序控制拍摄点,一共有15层平面,自动拍摄2个多小时,最后压缩成一张照片。
“一般相机是不可能做到的,我们利用软件工具计算在不同景深下需要多少层清晰的叠加。”
记者看到电脑上的成像照片,可以随意放大观看每一细部,都是无比清晰。
技术改善生活
基于Kinect的手语翻译系统
3D表情系统可以实现人脸的快速3D建模和处理
对于有听力障碍的尹丹丹同学来说,基于Kinect的手语翻译系统,帮助她实现了与人自然交流的梦想。
目前世界各地有3.6亿的听力障碍人士,其中来自中国的听力障碍患者人数将近2100万。微软亚洲研究院和中科院计算所、北京联合大学合作开发的手语翻译系统,将给他们带来福音。
这项研发以微软研究院在翻译和自然语言处理、语音和手势识别等自然用户界面领域的广泛研究成果为基础,其所应用的技术除 Kinect For Windows外,还包括必应词典、微软翻译、语言建模和3D建模等来自微软亚洲研究院的技术。在现场,演示了两个场景的应用。一个是在医院,一位听力障碍患者通过该系统用手语叙说自己的病情,相应的自然语言会呈现在电脑屏幕上,医生听清了,然后用语音继续追问,医生的话立即转换为手语在电脑上由一个虚拟人表达出来,患者也可即刻明白医生要求。
这样的实时交谈还可以发生在机场问讯处,一位使用手语的姑娘通过该系统一样可以担当咨询员的工作,旅客的问路和其他问讯可以自然进行。
另一个利用Kinect的项目,为康复领域带来新的方法。在韩国,研究员们已经利用Kinect开发了自动化机能评估工具和简易的康复计划,看似简单的手指抓举虚拟物块游戏,可以帮助患者逐步恢复手的机能。
除了帮助病人,让更多普通人生活更美好,创新活动上还有几个应用吸引了不少记者驻足。
比如手机上的3D发型设计,通过这款APP,仅凭借单张影像便可创建一个逼真的3D头发模型,这正是该研究成果的核心所在。
用户只需要划几下屏幕,就能在手机上创建全新的虚拟发型,欣赏其效果。可以改变头发长短,也可以改变不同颜色,直到找到自己喜欢的发型,下一次去理发店就可以展示给理发师做一款最适合自己的。
洪小文院长亲自和美国研究员斯科特演示的语音实时翻译系统,又将帮助多少人实现环游世界的梦想?
微软的实时语音翻译系统集合了来自微软研究院下属多家实验室以及全球各地合作伙伴的几项突破性研究成果,包括语音识别、文本翻译、个性化语音合成等,将人们的交谈内容从一种语言同步地转换成另一种语言,并尝试保留使用者本人的语音特征。该系统突破性地利用了深层神经网络(DNN)技术,相较传统技术,大幅提升了口语对话识别成文本的准确度。
洪院长演示的对话场景中他说的每一句中文都变成流畅的英语,斯科特的英语句子也变成中文语音,他们的演示赢得阵阵掌声。
IT技术预测未来
“针对全球问题的预测模型”利用了微软的云计算系统Azure
对时下热点——大数据的应用研究,在微软研究员们的项目中有不少体现。
“针对全球问题的预测模型”利用微软的云计算系统Azure,对环境数据进行存储和分析;再运用机器学习技术建立预测模型,将其应用于预测服务中,并可以根据需要在任何设备上运行。
“这些预测可以告诉我们那些严重的问题可能会在何时何地发生。比如`,利用卫星数据和机器学习技术,可以做城市化进程中可用土地的预测,并推测出采取相应措施来减缓或解决这些问题的结果及影响。”研究员说这将使预测变得简单易行。
刚当选MIT2013年35位全球杰出青年创新者的郑宇研究员介绍了用“大数据如何推断空气质量”项目。
这一项目现在可以涵盖北京、上海等4个城市,让人们通过电脑或手机,实时直观地看到某一街道或某一时间段的空气质量,以便我们做出更明智且更有利于健康的决策:例如何时何地最适合户外运动,或者何时应戴上口罩或关上窗户。
在北京的城市地图上,看到北边的空气质量相对南边好一些,12:00至14:00这段时间空气质量最差。上海的东部靠海一带空气更清新。。。
“目前人们只能借助监测站才能准确判断某个地点的空气质量,然而监测站却很有限。为了应对这一挑战,我们根据现有监测站所提供的空气质量数据以及城市里的其他多种数据来源(包括气象情况、交通流量、人员流动趋向、路网结构、人口集中点等),运用数据挖掘和机器学习技术,对大数据加以充分利用,并在监测信息和对应结果之间建立一个隐式映射,从而可以实时推断出包含细颗粒物信息的城市空气质量数据。”
郑宇说很快空气监测项目将扩展到全国10个城市。
“在微软研究院,我们一直努力营造开放的研究环境,激发新想法、新发现的诞生。”负责微软研究院全球各核心研究机构及学术合作部的周以真博士表示,“过去十五年里,微软亚洲研究院始终鼓励研究人员加强内外部合作,在这里取得的突破性成果从未间断过。相信未来,还将会有更多微软亚洲研究院的研究通过推进科学技术进步,改变人们生活,造福整个社会。”
让数据活过来
大多数Office用户可能非常希望对Excel中的2D图表功能(包括饼图、条形图或一些其他形式)进行可视化,为演示文稿提供支持。Kevin Fan负责的一款先进的Excel 3D数据可视化工具“Power Map”,正带给用户全新的发现。
“这是从70年代到现在几十年间全球发生的自然灾害的情况统计,红色表示红山喷发,绿色代表台风,黄色是地震,蓝色是龙卷风,黑色是城市人口数量。”Kevin指着大屏幕上全球地图,向记者解释这个立体的数据图。
我们看到按照时间的先后顺序,地球上的各城市点上人口柱在上升,地球上的颜色和区域在变化,那些让人眼花的数据通过颜色和地理位置的映射,变得直观。
Power Map允许用户将大量数据以3D可视方式映射到必应地图上,并通过3D柱形图、泡泡图/饼图、热量图和区域图等形式实现数据的可视化。这个工具能够让至关重要却容易混淆的数据变得易于理解。
未来生活核心就是IT技术
对话周以真博士(微软全球资深副总裁)
电脑报:现在的技术让人们的信息越来越多存放在公共空间,在帮助人们生活便利时,隐私行为也越多地暴露在其他人面前。微软怎么看待这个问题?
周以真:微软非常重视可信赖计算。可信赖计算包含可靠、可用、安全、隐私保护四个方面。过去十多年微软已有很多成果展示,我自己从事的研究是聚焦在隐私保护。
未来仍是这四条路线:
让系统能抵御安全攻击;对用户承诺隐私保护策略,决不让用户信息落入不该看到的人手中;保证系统24小时运行通畅;以及让用户可以理解,可以快速上手。
电脑报:用户该如何取舍技术带来的便利功能和隐私问题?
周以真:同事也经常问我,某项技术隐私问题如何处理?有时候,真的不要把它当成一个问题,把它放一边吧,这会帮助你打开思路。
19世纪照相机出现时就出现过此类争论,技术的发展让人们适应了新的环境,有些当时觉得是隐私的问题,过后都不再是隐私。
用户需要根据自身情况平衡追新技术和保护隐私的问题。我自己就不会将生活中的一切事情与众分享,有些人则愿意让大家看到他一举一动。
电脑报:周博士有多年任卡内基梅隆大学计算机科学系副主任的经历,对编程语言也有研究,可否对大学生推荐那种编程语言最适合现在学?
周以真:对大学生来说,不需要特别强调那种编程语言更实用,应该学的是针对不同应用该掌握的方法。我自己30多年的经历也是,面对云计算,我该用什么工具,对于多核、移动设备,该用那种语言,需要根据不同的方向选择。
有迹象表明,新的编程语言将包含基于概率的建模,其推动力是越来越多的不确定性和规模化效应。
让机器能感知人的感情,未来的计算机能自行行动,这样的架构将是一个新的领域,那就不只是编程语言的更新。 
本文出自2013-11-04出版的《电脑报》2013年第43期 A.新闻周刊
(网站编辑:pcw2013)
读者活动
48小时点击排行
编辑推荐
论坛热帖
网站地图 | 版权声明 | 业务合作 | 友情链接 | 关于我们 | 招聘信息
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sin*.c*m 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sin*.c*m 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号