- 2017/11/3 16:17:45
- 类型:原创
- 来源:电脑报
- 报纸编辑:电脑报
- 作者:
作者简介:现任美国斯坦福大学人工智能实验室和视觉实验室主任,斯坦福大学终身教授、谷歌云首席科学家,主要研究方向为机器学习、计算机视觉、认知计算神经学。2011年3月,荣获斯隆研究奖计算机科学奖。2015年12月,入选2015年“全球百大思想者”。
我曾说我在北京最冷的冬天感受到了人工智能的狂热,时隔一年,我认为这份热情有增无减。但也有人开始担心,人工智能的发展是否会枯竭?无可非议,任何一个学科的发展都需要源源不断的动力,而动力的源头、基础就是支持所有科学发展最本质的源泉。
无论是动物智能,还是机器智能,视觉系统就是它们非常重要的基石、源泉。在过去的几亿年中,不同生物的视觉系统不断发展,至今已成为人类大脑中最复杂的系统。因此,在计算机识别领域,视觉系统同样是重要研究。
而关于视觉系统的重要性,举例来说一个人出现1/10秒的时间,人们就能够通过他站的姿势、穿的衣服来很快识别出这个人具体的信息。亦或者,一个小孩通过游戏、通过画画以及各种工具来建立对世界的认知,这是认知视觉系统,能够促进她的理解、交流、协作、互动等等。所以我们强调,视觉系统是非常关键的,是它让我们开始探索世界。
后来,我们从中受到启发,开始解决最为基本的图像识别问题。到现在,计算机领域和专家发明了无数技术,取得了非常大的进展和进步。我们已经能够看到计算机识别系统的错误率已经降低了10倍。
同时,GPU技术以及深度识别技术的发展对于视觉研究起着重要的作用。通过量化研究,我们将有更丰富的方法来了解世界。具体来说,视觉识别技术是通过后台分析众多标签,再通过不同标签、不同属性、不同关系来描述物体,最终通过数据库和信息集来进行更精确的研究。这些基于视觉系统而衍生出的科技带给人工智能更快地发展。
不过为了人工智能能够长足的发展,仅仅有这些技术是不够的。通常我们会使用上千个标签来、句子、问答信息等来构成一个数据库,以完成更精确的研究,而不仅仅是完成物体识别本身。但绝大多数搜索引擎使用的算法对于我们想要的图像搜索功能来说,都是不达标的。
因此,我们又开始探索一种新的呈现方法。通过在大型数据库中输入非常长的描述性段落,然后和图像进行对比,这样能够达到更好的搜索效果。但是,找到大量场景图像是非常复杂的,如果手动构建的话,更是繁杂。这样的情况之下,我们研发出了一个自动生成场景技术,相比现有的激活技术更加高效。
另外,LSTM概念的出现,让语言之间的关系被建立了起来。如果给电脑一个图像,它将不仅能够描述简单的语句,如男孩、工人,而是能够描述出穿着黑色T恤的男孩正在弹吉他、穿着橙色工作服的工人站在路边工作。这样的工作,就是我们所追求的深度捕获。
技术发展的速度是非常可观的,但遭受非议也是难以避免的。无论是几百年前触犯宗教伦理敏感性的地心学和日心学,还是现在同样被认为触犯伦理的视觉系统,这都是人类探索过程中不得不经历的。除了不断扩展科学的边界,人类也在不断挑战伦理、法制、道德的规则。
脑科学、认知学本来就是通过人类启发而形成的,人工智能和人的关系更是交互、互相帮助的关系,而不是人工智能把人给替代掉。就像仅经过3天训练就以100:0完胜AlphaGo的AlphaGo Zero,它让人们开始担心人工智能可能会渐渐脱离人的管制。但我认为这是不存在的,严格来说,围棋是一个人造的封闭世界,人工智能有完全的可观测条件去迭代,不至于上升到使社会失控这一伦理问题上去。
所以我希望,当涉及到社会,人伦等方面问题时,所有关注、从事人工智能的学者,以及关注人类社会发展的专家一定要更走近一些,多一些交流和讨论,一起来探索这样所谓敏感边界或者是未知的事情。(本文根据公开演讲整理而来)
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号