写点什么

除了抖音和头条,字节跳动的 AI 实力有多强?

  • 佚名

  • 2018-11-16
  • 本文字数:3175 字

    阅读完需:约 10 分钟

除了抖音和头条,字节跳动的AI实力有多强?

近日,字节跳动(今日头条母公司)人工智能实验室举行了一场 AI Openday 活动,字节跳动副总裁、人工智能实验室负责人马维英介绍了人工智能实验室的使命、愿景,十分少有地披露该公司在 AI 领域的进展。


如今,这家媒体公司已然超越 Uber,成为全球最大、估值最高的独角兽企业。字节跳动迅猛成长的背后,人工智能有多大的功劳呢?

超越 Uber 成全球价值最高独角兽


根据 CBINSIGHT 报告显示,今日头条(字节跳动)已经以 750 亿美元的估值,成功超越 Uber,成为全球价值最高的独角兽企业。


日媒称,软银集团本月通过软银愿景基金(Vision Fund)和其它方式向字节跳动投资 30 亿美元。


在资本市场中,字节跳动向来是各大投资公司的“宠儿”,这样一家不缺乏资本青睐的媒体公司,人工智能究竟做得怎么样?

AI Lab:公司内部的研究所和技术服务商

在 2018 人工智能大会上,字节跳动副总裁、人工智能实验室负责人马维英曾经表示,技术出海是字节跳动全球化发展的核心战略,而人工智能技术则是字节跳动全球化取得当前进展的关键。


在海外,字节跳动的 Tik Tok 等产品发展非常快。下图显示,字节跳动的产品目前已经覆盖了全球 150 个国家和地区、75 种语言,并且在 40 多个国家和地区在的应用商店都名列前茅。



为不断扩大庞大的海外版图,字节跳动需要一个强大的人工智能团队提供支持。2016 年,字节跳动人工智能实验室(AI Lab)应运而生,为平台输出海量内容提供 AI 技术支持。


AI Lab 对自身的定位,是作为公司内部的研究所和技术服务商。


据悉,AI Lab 团队聚集了包括大家熟知的马维英、李航、李磊等大牛,在 2018 年一年的时间里,AI Lab 团队总人数从 65 人增长至 150 人,计算机视觉、自然语言、机器学习、系统 &网络的团队人数比去年增加一倍,而语音 &音频、安全以及美国 AI Lab 的团队人数也飞速增长。

四大目标和使命

马维英表示,AI Lab 的职责是为公司未来的两到五年研发产品,并具有以下四个主要的使命和目标:


  • 第一,为公司在人才方面吸引、储备、培养最优秀更高端的技术人才。

  • 第二,有了人才就能发展技术,提供各种帮助便利,支持人才来开发核心关键的技术。

  • 第三,在此过程中,不断建设一个完整包含技术、工程和产品的 AI 团队。马维英表示,AI Lab 跟传统的研究团队不一样,传统团队做基础研究,而 AI Lab 的目标是在这个过程中,从人才发展技术,最终建设团队,而且这个团队是包含了技术、工程和产品一个完整的人工智能团队,为公司今天现有的产品和业务提供核心技术支持和服务。AI Lab 不但具有学术研究能力,也重视工程产品能力,确保让技术成功落地。

  • 第四,为公司在学术界以及基础科研方面做出积极贡献,与高校联合培养人才。

不设论文发表 KPI,更重视技术实践


在基础研究方面,字节跳动的 AI Lab 研究领域包括计算机视觉、自然语言处理、机器学习、语音 &音频处理、数据 &知识挖掘、计算机图像学、系统 &网络、信息安全以及工程 &产品。


而字节跳动做基础研究的目的,是为了更好地落地和应用,因此,相比于发表论文,参加学术会议,马维英更愿意看到技术应用付诸实践。



其实,AI Lab 已将很多 AI 技术应用到实际产品中,大家相对比较熟悉的可能是在抖音、火山、西瓜等 app 中的应用,如把手机摄像头变成人工智能相机,抖音的美颜、美体、滤镜、人体人脸关键点识别、手势识别等,背后都是由实验室团队提供的服务。


再比如 2018 年世界杯期间接入今日头条直播间的视频分析,嵌入西瓜视频的封面生成、视频理解、背景虚化、利用深度卷积神经网络抽取关键视频片段,并总结为更精简的短视频,等等。


作为内容创作和交流的平台,字节跳动对版权系统非常重视,新的视频新的图片上来,都会对图片和视频进行版权保护。在审核方面,音频审核和音频指纹保护都运用了大量分布式机器学习。


另外,字节跳动的自动写稿机器人小明,获得了吴文俊技术发明二等奖。今年中国计算机学会,字节跳动在端上智能、人工智能相机、抖音上的 CV 应用获得了中国计算机学会的科技进步卓越奖(该奖项最高奖)。


另外,字节跳动还把内部的一些技术向 B 端开放,通过 SDK 提供给开发人员使用,这个平台也获得了 2018 年科协双创周的颠覆性创新榜前十强。

人才观:一个好的研究员胜过一百人

人才培养理念

AI Lab 自己独特的招聘理念,部分源自于马维英在微软亚洲院受到的影响:


  • 给予足够的自由和空间。做科研,一个优秀的研究人才甚至一个天才,胜过一百人。这就是对人才的热爱,对人才的培养和重视,给予他们充分的自由,在每个技术领域去吸引去招聘最优秀的人才,加入之后给他们足够的自由和空间,自己选择做什么。

  • 喜欢有想法,非常自驱,愿意不断学习,心态更开阔,更加无惧的研究人员。不太喜欢害怕失败,看短期利益的人。欣赏有梦想,要做了不起的事情,有勇气的人。

  • 除了基础研究,还强调应用技术并获得实时反馈,从真实的问题来倒推研究。公司不把发表论文设为 KPI,更注重实际应用落地,但鼓励有想法的员工写下自己的想法,参加学术会议。

招人标准

在媒体采访中,马维英还透露了自己一般的招聘标准:


  • 数学基础要好。数学功底能够对所有数学的模型能够有一个很好的直觉或者透彻的了解,而不是只是简单的应用。

  • 实践能力、编程能力。有很好的想法但却没有实践的能力,也是不够的。

  • 态度,团队合作、人际沟通、表达和软素质相关能力。

AI Lab 需要很勇敢,替公司冒最大的风险

AR 和 VR 被很多人认为是未来科技发展的方向。对于这两个方向,马维英表示,AI Lab 现在更多是持续关注其技术的发展,做好未来的储备,等到整个市场或者产品成熟的时候,公司内部有这样的需求时就能够立刻支撑公司的产品。


“它是和内容产业非常紧密相关的未来技术。AI Lab 在 VR 上做得相对少一点,AR 做得比较多,虚拟跟现实的融合,也是接下来我认为会有很大发展机会的方向之一。其实有时候最终不见得我们赌对,但实验室必须需要储备,人工智能实验室要替公司来赌,这很重要。AI Lab 需要很勇敢,哪怕风险很大,AI 实验室一定要替公司冒最大的风险。如果我们不冒的话,其它部门都没办法承担某些风险。我们要替公司看未来,甚至有颠覆式创新,新的创新出来可能会影响公司现在业务和产品,我们要及早把未来事先储备好。所以,我们也非常重视内容领域的颠覆式创新,AR、VR 都算,这也是为什么我们实验室里有这方面的投入。”

未来是一个 AI 和人类共同学习进步的时代


从 PC 时代到移动互联网时代,步入今天的 UGC 时代,智能手机的发展让每个人都可以随时随地创作并分享内容。人工智能的赋能更是让整个内容分发更加智能化、个性化、社交化和无所不在化。于是,有人发出 AI 是否会替代人类的疑问。对此,马维英认为,AI 在未来更多是辅助而不是取代创作。人帮机器,机器也帮人。人工智能需要大数据,需要和用户不断交互来学习。未来,将是一个人工智能和人类共同学习的时代,一起发展向前。


而连接人与信息,促进创作、交流,在字节跳动的产品中有四种主要管道。首先是人工智能个性化推荐,让信息找到用户;其次是搜索; 第三,助理越来越普及。助理需要进一步解决语音识别跟语音合成,以及自然语言理解、自然语言生成和对话的问题。 最后,今天还有很多信息与内容也在社交圈、社区进行传播。每一个管道今天都能够用人工智能来重新定义。


最后插播一点马维英在媒体采访中透露的自己在招人时的小习惯,希望能帮助有意加入字节跳动的同学们“对症下药”、有的放矢,小编只能帮你到这了~


当然,对我个人来讲,这么多年招了这么多人也面试这么多人,我有一个我觉得是我自己的“天赋”。我面试的人会非常重视跟他进行眼神交流。我大概十分钟,就能了解他聪不聪明,或者够不够坦诚。我觉得我有这个能力在面试过程中看到他可能不容易被看到的那一面。




会议推荐:12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-16 19:047669

评论

发布
暂无评论
发现更多内容

架构实战模块一:架构图

小飞同学

#架构实战营

React源码解读之React Fiber

flyzz177

React

ReactDOM.render在react源码中执行之后发生了什么?

flyzz177

React

从汽车之家效能平台建设看汽车行业研发数字化之路

之家技术

数字化 汽车 构架 效能度量 效能

架构实战营-模块1-作业

zealot0317

MySQL执行计划之explain详解

@下一站

程序 MySQL优化 dba 11月日更 11月月更

模块一作业提交

Geek_7d539e

React源码分析1-jsx转换及React.createElement

goClient1992

React

FL Studio2023新版本功能爆料将引入4款全新插件!创作力UP!

茶色酒

FL Studio

设计原则 — 多用组合,少用继承

Lemoon Can

面向对象设计原则 设计原则

API安全中的数据隐私保护步骤

穿过生命散发芬芳

API安全 12月月更

React源码分析3-render阶段(穿插scheduler和reconciler)

goClient1992

React

十大开源测试工具和框架

FunTester

模块一:课程作业

peter

#架构实战营

极客时间运维进阶训练营第七周作业

9527

前端工程师leetcode算法面试必备-二分搜索算法(上)

js2030code

JavaScript LeetCode

设计原则 — 基于接口而非实现编程

Lemoon Can

面向对象设计原则 设计原则

架构实战营-模块一作业

落叶挂云霄

React源码分析2-深入理解fiber

goClient1992

React

群晖DS218+做maven私服(nexus3)

程序员欣宸

maven 12月月更 群晖

王者荣耀商城异地多活设计

π

Verilog 设计方法

智趣匠

流程 Verilog 设计方法

架构实战营(第10期)模块一作业

Geek_e5f2e5

架构实战营模块一作业

周烨

超详细FL Studio水果2023新版更新功能讲解!80项更新与改进!

茶色酒

FL Studio FL Studio 21 FL Studio21

模块七-王者荣耀商城异地多活架构设计

Geek_b35d92

商城 构架 王者荣耀

微信业务架构图 & 学生管理系统

chinandy

架构设计

React Context源码是怎么实现的呢

flyzz177

React

从观察者模式到Java事件处理机制(上)

老农小江

设计模式 java 编程 事件机制

从观察者模式到Java事件处理机制(下)

老农小江

设计模式 java 编程 事件机制

ChatGPT中文版杀疯了,已登录AI模型市场

felix

除了抖音和头条,字节跳动的AI实力有多强?_AI&大模型_InfoQ精选文章