- 2017/3/28 10:52:38
- 类型:原创
- 来源:电脑报
- 报纸编辑:电脑报
- 作者:
寻找中国AI企业独角兽系列报道之二:
@本报记者 熊雯琳
企业档案:
方向:AI个性化推荐
成立时间:2012年3月
员工人数:3000
2016年营收状况:60亿元人民币
估值:110亿美元
融资情况:2012年7月,今日头条获得SIG海纳亚洲等数百万美元A轮投资;2013年9月获得DST等数千万美元B轮投资;2014年6月,完成由红杉资本领投、新浪微博跟投的C轮1亿美元的融资。
这家公司正在风口:拥有中国最大的媒体渠道,每个月为1.6亿用户提供服务,每天有7800万人在上面观看新闻、视频。然而它并非媒体,而是一家以人工智能和机器学习做资讯个性化推荐的技术公司。
没错,这家公司就是今日头条。这家成立仅5年的互联网公司发展相当迅猛,其以人工智能和机器学习为驱动核心的内容分发模式,引起了百度、阿里等互联网巨头的“注意”:百度将“内容分发”定为2017年战略重点,在“内容分发”这一领域,今日头条和百度、腾讯、阿里几大巨头站在了同一赛道里。
近日,本报记者独家探访了今日头条总部,并且和刚刚成立1年的今日头条人工智能(AI)实验室科学家李磊博士聊了聊。
位于北京北三环边的中航大厦闹中取静,远远的就能看到外墙上显眼的红色LOGO,而当天正好赶上今日头条面试日,一楼的沙发坐满了等待排队预约的求职者。这家正在高速发展的公司需要不断引入新鲜血液。
就在记者到访之前两天,今日头条刚刚公布微软亚洲研究院常务副院长马维英日前离职微软,加入今日头条出任副总裁,管理今日头条人工智能(AI)实验室的消息。
作为一家技术型公司,今日头条如何将人工智能技术落地到产品运营中的?不论是国内还是国外,成立仅4年就成立独立的人工智能实验室的公司并不多见,这个“神秘”的组织到底是做什么的?又承担了今日头条的哪些工作?
人工智能如何把信息分发做好?
根据TrustData发布的数据显示,2015年10月,今日头条平均用户每日打开时长为41.8分钟,而网易新闻和凤凰新闻分别是26.1分钟和24.7分钟,腾讯新闻仅为19.8分钟,不到今日头条的一半。2016年8月,今日头条的平均用户每日打开时长已经超过70分钟。
数据背后显示的其实是人工智能的威力。
作为一款个性化信息推荐引擎产品,今日头条是国内最早一批把人工智能结合到移动应用场景中的产品:利用人工智能推荐算法提升信息分发效率。
实际上,在今日头条最开始成立的两年,很多人都认为今日头条只是一个新闻客户端,而如今,整个行业都在走向“智能分发”这条路。今日头条也因此估值超过110亿美元。如今,今日头条上的内容越来越丰富,从文字到图片、视频、直播甚至问答、寻人。
2016年,今日头条还成立了专注于人工智能的头条实验室,很多人慢慢开始理解今日头条是一家技术公司。
今日头条创始人张一鸣曾表示,今日头条是把算法、工程、产品、运营这几个方面在应用层面结合得最早的一家公司。
那么人工智能如何帮助今日头条把信息分发这件事做好的?在李磊看来,首先是需要有好的创作内容。去年奥运会期间,头条实验室推出一个自动写作机器人Xiaomingbot(谐音小鸣 bot,即“张一鸣”),它会跟进奥运会赛程自动写新闻稿。“这就是我们通过技术帮助它自动创作。“而信息分发的第二方面是需要做推荐,需要好的推荐算法。据李磊介绍,推荐的背后则涉及到理解内容和拥护,“理解内容本身需要很多储备,比如词袋模型,主题模型、语义分歧,关键词提示等等。“第三个方面是互动。今日头条将信息推给用户,而用户会在读完以后与信息有交互以及评论。
“只有以上几个部分做好了才能将信息与用户的匹配做好,让推荐更精准和个性化。”李磊说。
访谈:让机器更了解你,就能得到你想要的内容
人物介绍:李磊,今日头条科学家、人工智能(AI)实验室总监。毕业于上海交通大学计算机系本科,卡耐基梅隆大学计算机系博士,加州大学伯克利分校博士后研究员。其博士毕业论文获美国计算机学会SIGKDD最佳论文之一。在机器学习、数据挖掘和自然语言理解方面于国际顶级学术会议发表论文30余篇,拥有三项美国技术发明专利。
AI与机器人寻找中国AI企业独角兽系列报道之一::今日头条人工智能实验室成立时间挺早的,一般大公司在成立四年的时候似乎没有这个机构设计的。能不能给我介绍下今日头条人工智能实验室具体是做什么的?
李磊:今日头条其实从2012年成立至今只有4年时间,你可以想想成立4年的时候那些大公司在做什么?谷歌还在做搜索、facebook有研究院,百度还没有实验室。而今日头条在2014年的时候就意识到整个团队要在前沿技术上做非常大的投入。因为我们的产品和用户数量非常大,对人工智能的需求也非常大,我们如何把推荐做好,那么首先就是要学会运用机器学习、数据挖掘等技术来理解文章的主题、人物关系等等。而且对于机器学习来说,数据越多越有意义。去年初我们日活用户达到3800万的时候,我们相应也成立这个实验室。目前我们有七位正式员工,还有一些实习生。
我们实验室成立的初衷有两点:第一个是希望能够推动人工智能技术方面的研究,包括机器学习、自然语言理解、计算机视觉、人机交互与机器人等领域,与产品、技术相关的长期性问题和开放性问题的研究;第二我们也承担一部分产品研发的责任。比如我们有一些研发的产品已经已经运用到今日头条的产品上。比如写稿机器人和一些视频内容的分析理解等。
AI与机器人:写稿机器人,听起来很有趣,好多人都是因为它对今日头条有了全新的认识,作为它的同行我也很感兴趣。
李磊:这个是我们在去年奥运会期间做的一个新闻自动生成机器人,名叫Xiaomingbot。在去年8月里约奥运会的16天内自动创作了四百多篇文章,围绕乒乓球、羽毛球、足球、网球四个类别写 。在短短16天内,读者总计一百万。后面通过数据分析发现,在同一时间由专业体育记者所写的体育新闻阅读率和XiaomingBot写出的新闻阅读率差不多,甚至XiaomingBot新闻阅读率会更高一些。
当然我们做新闻机器人的目的并不是取代新闻记者,而是帮助作者更快的创作出更高质量的内容。
AI与机器人:今日头条的用户,很多会吐槽,首页打开并不是我想要的内容,甚至推荐大多是比较低俗,甚至比较八卦的内容?
李磊:这个就涉及到推荐算法中新用户冷的启动问题。我们的算法是默认在你首次启动时候给你推荐关注人数较多的新闻,而八卦、热点等正是人民群众喜闻乐见的,所以会出现在首页,但随着你的阅读、评论等行为的发生,机器能够更多了解你的偏好,从而去推荐给你相关的内容。
当然,有些用户会说,大家都关注的东西我并不感兴趣,针对这些情况,我们也在做对冷启动用户的推荐算法调整,包括热点内容与其他内容的平衡等等。
AI与机器人: 这个平衡似乎很难?比如有些人一段时间喜欢体育新闻,可过阵子又不关注了,用户是善变的。
李磊:这又涉及到另外一个问题。我们现在采用的推荐算法有两个,一个叫利用,也就是说从分析你过去的阅读行为,利用这些数据对你进行预测,比如你可能过去对体育感兴趣,我们就会为你推荐体育新闻;另一个叫发现,即尽可能去发现一些新的兴趣点,可能是你喜欢的,也可能是你讨厌的。用户可以通过点击页面上的“不感兴趣“与客户端互动,不断去调整,让我们抓住你额外的兴趣。这个实际上到技术端是比较难的问题。我们也会想一些办法去更多了解用户,比如希望用户关注一些头条号,我们通过用户的订阅行为来分析和推荐。
要知道,机器自动推荐每天的量非常大,这是人工不可能完成的任务,尤其是面对7800万日活用户,还要求每个人首页个性化,这是非常难的。当然,我们在过去一年也对算法进行了调整,比如对标题党以及低质内容的识别已经有非常大的改进,随着数据的增多,我们的识别率会越来越高。
AI与机器人:在加入今日头条之前,您曾经在百度深度学习研究院工作了两年,能不能从个人的角度来谈谈,如今在内容分发、人工智能两块已经形成竞争的两家公司?
李磊:毫无疑问,这两家公司都是以人工智能为主的公司。尤其是在中国,企业研究院做的最好的事微软亚洲研究院,而百度是本土最好的。我们也会参考他们的模式。
资讯
阿里游戏发布2017战略:10亿布局IP生态
(本报记者 熊雯琳)3月16日,阿里游戏在背景发布了年度战略布局,包括10亿资金助力游戏IP生态发展,并与阿里文学、阿里影业、优酷联手推出“IP裂变计划”、推进手游全球发行等,并宣布开启阿里游戏全球发行联盟战略。
途家与蚂蚁金服达成战略合作
(本报记者 熊雯琳)3月23日,途家在京公布了2017年的“3+1”发展战略,从消费者、经营者、置业者和区域化这四个纬度展开介绍途家新一年的战略,包括聚焦用户体验的产品服务升级、基于经营者的多平台一键管理和途管家产品、基于可经营地产的两大解决方案、全域旅游导向的片区合作等多项内容被首度披露。
 报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sin*.c*m 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号