【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

字节跳动能在海外建立信任吗?

  • 2020-08-06
  • 本文字数:2475 字

    阅读完需:约 8 分钟

字节跳动能在海外建立信任吗?

本文最初发表在 Interconnected ,经原作者 Kevin Xu 授权,由 InfoQ 中文站编辑并分享,内容在不改变原意的基础上作了编辑和整理。


上个月,有消息称字节跳动准备禁止中国内部员工访问海外产品的代码库。尽管许多中国科技公司都有全球化雄心,但字节跳动在这方面是一枝独秀。它的各种社交媒体产品在中国市场和其他几个大的互联网市场(如美国,印度和东南亚)都拥有海量用户规模并深入影响着本地的文化。


这些成就随之而来的是更多与地缘政治有关的审查。


与其对中国科技公司所做的一切条件反射性地持怀疑态度,不如从技术角度深入研究字节跳动如何实现这种内部分离,以在海外建立信任,缓解合理的地缘政治担忧。

很多的 RBAC

简单的答案是 RBAC(基于角色的访问控制), 且需要很多很多的 RBAC。


通过针对单个角色设计一组身份和访问管理(IAM)策略,字节跳可以根据产品限制每个员工的访问。在中国的所有职能部门(工程、数据分析、增长、市场营销等)的员工只能访问产品代码库、生产数据库以及与中国市场产品相关的所有副本,如今日头条、抖音、西瓜。同样的规则也适用于其海外产品(如 TikTok、Helo、BaBe、Lark)的非中国雇员。


这种“隔离”必须沿着整个技术堆栈进行,从前端 UI,到 AI 算法驱动的内容层,到后端服务器端层,到数据库层,一直到数据中心里的计算和存储资源。PingWest 的报告暗示,这种类型的分离可能已经从内部中间件团队的分裂开始了。



因此,字节跳动的每项功能都需要两组人员来支持其在国内和国外的不同产品。这比分离技术堆栈要难得多。这两个“平行宇宙”之间的任何合作,甚至一般的常规交流,可能都必须完全切断。如果字节跳动也是这么想的话,那它在 2020 年底前将员工数量 从大约6万人增长到10万人的计划也就不奇怪了。把这 4 万人的增长换个角度看,Facebook 在 2019 年底的所有工作人员人数也就是 4.5 万人。如此,在今年剩下的短短几个月内字节跳动内部还有很多 IAM 政策要实施,有很多 YAML 文件要管理。对于人力资源和招聘部来说,干净的离职可能是最困难的,因为他们正在极力达到招聘目标。


当如此庞大的员工团队开始往返全球各地出差时,管理数据和系统访问的细节会变得越来越富有挑战 — 当然目前由于 COVID-19 的原因,这还是不是一个问题。但字节跳动可以从硅谷其他大厂那里学到经验,这些公司中绝大多数已经有在员工出差旅行时对数据和系统访问进行地域隔离的最佳实践,尤其是在进出中国时。


当然,必须有一个中心团队来长期管理,改进和实施这组复杂的 IAM 策略。 这个团队在公司管理架构上应该放在哪里?既然他们两边都可以看到,那谁能加入这个团队?他们又应该向谁汇报? 这些都是很重要,但目前还是没有答案的问题。


所有这些措施在技术和运营层面都是可行的,虽然具体落实和维护工作将极为痛苦,也会对打造一个统一的公司文化有巨大挑战,但都是可以做到的。如果字节跳动能做到,它将成为有全球化扩张雄心的所有中国科技公司的样板。


(再说个小插曲:这个“隔离”架构让我想起了美国总统选举连任时 Hatch Act 法案是如何运作的。白宫的普通员工和连任选举活动之间是完全隔离的,但总统任命的高官,如内阁成员,可以合法地两边介入。)


对于要管理 10 万多员工的 RBAC 这么具体而枯燥的事情,成败确实都在细节里。假设这些细节操作完美, 字节跳动仍然需要为第三方组织提供一种长期持续的审计和验证方法。 虽然字节跳动建立的各种“ 透明中心”的意图很不错(可以说比 Facebook 或 YouTube 在这方面做的都更多),但这些中心似乎专注于人为内容管理,看似更像是面对媒体的公关部门,他们说服不了多少技术专家。


那与技术界建立信任的最佳方式是什么?开源。


开源

作为一个开源的支持者和实践者,我觉得开源迭代是打造既可靠又可信的科技方案的最好方法。


阳光总是最好的消毒剂。开源就是科技界的阳光。


很少有科技大厂开源 RBAC 实现和 IAM 策略的例子。我不认为这是因为 RBAC 本身有什么不适合开源的特性。完全可以删除业务和组织逻辑,而只开源实现机制。但大型科技公司通常会开源一些具有外部战略价值的东西,比如创建一个开发者生态系统(苹果使用 Swift,微软使用 VSCode)。RBAC 很少具有任何战略价值,它很平凡,很无聊。


然而,对于政府监管机构,网络安全审计机构和提倡专有保护的组织(三批对字节跳动持怀疑态度最高的听众)来说,RBAC 的实施方式既不平淡,也不无聊。


每个科技公司对其战略差异的看法和关注点都不一样。正如我在“ 为什么Facebook不做云的生意?”中所提到的,因为 Facebook 已经下定决心要统治全球的社交媒体,而对拥有云 PaaS 业务不感兴趣,它开源了其数据中心的设计,以实现更高的基础设施效率这个战略目标。而 Google 将其数据中心设计视为一种竞争优势,所以保持专有,没有开源。


Facebook 的产品差异在于其算法驱动的社交媒体,而不是数据中心。同样,字节跳动的差异也在于它的算法驱动的社交媒体,而不是它的 RBAC 实现(也没什么公司以 RBAC 做差异)。不同的是,开源 RBAC 对字节跳动具有战略价值,可以帮助赢得一种它目前最缺乏的资源:信任。


可惜,字节跳动在创建,贡献或管理开源项目方面没什么成果和记录。鉴于其独特的潜力和目前所处的困境,字节跳动迅速补上对开源的认识和相关能力是非常必要的。虽然目前没有一个大规模开源 RBAC 的模板字节跳动可以用。但除了从公开代码来建立信任之外,开源群体里有很多实践可以借鉴,如社区论坛、开放文档、透明治理等等。


要赢得全球观众的信任,需要做的事情 远远超过 从迪斯尼挖高管,或 雇前国会议员做“说客”。我在“ 为什么华为该赴美上市”中也提到了, 甚至雇到了帮特朗普连任的主筹款人,回报也不怎么样。


所有这些需要做的工作都很艰苦,很琐碎,很乏味,但都不是无法做到的。


原文链接:


https://interconnected.blog/can-bytedance-build-trust/#chinese-version-below


作者介绍:


Kevin Xu,Interconnected 创始人和作者,跨国企业服务创业公司高管及顾问,目前专注开源科技创业风险投资。此前曾在斯坦福计算机及法律研究院、布朗大学国际关系专业就读。可通过   LinkedIn  与作者互动交流。


公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2020-08-06 17:001838
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 489.7 次阅读, 收获喜欢 1966 次。

关注

评论 2 条评论

发布
用户头像
怀璧其罪,这和信任没啥关系。家畜都很善良,我十分相信这一点,然而好吃啊!
2020-08-07 10:37
回复
用户头像
想在国外赢得信任,除非不是中国公司。
2020-08-07 08:38
回复
没有更多了
发现更多内容

如何预防勒索攻击事件?这份安全自查指南请查收

京东科技开发者

数据安全 数据加密 系统安全

原创 | 使用JPA实现DDD持久化-领域模型:对象的世界

编程道与术

Java hibernate 编程 mybatis jpa

原创 | 使用JPA实现DDD持久化-O/R映射元数据:映射注解分组

编程道与术

Java hibernate 编程 mybatis jpa

不满意社区的轮子,我们自创了一套 React Hooks 风格的数据加载方案

LeanCloud

API React Hooks

北京奥森小景

小马哥

摄影 美景 奥森 28天写作

《算法导论》.pdf

田维常

甲方日常 65

句子

工作 随笔杂谈 日常

没有它你的DevOps是玩不转的,你信不?

华为云开发者联盟

容器 DevOps 微服务

原创 | 使用JPA实现DDD持久化-O/R映射元数据:类级映射-实体和值对象

编程道与术

Java hibernate 编程 mybatis jpa

使用JPA实现DDD持久化-O/R映射元数据-特殊属性映射:ID、Version和Transient

编程道与术

Java hibernate 编程 mybatis jpa

业务中台建设-数据

孝鹏

架构 中台 数据 赋能

《css大法》之使用伪元素实现超实用的图标库(附源码)

徐小夕

CSS css3 大前端 CSS小技巧

话题讨论 | 30 张图解高并发服务模型你必须这些

程序员柠檬

话题讨论

话题讨论 | 立一个近期的flag,你会想到什么?

xcbeyond

话题讨论

英特尔携手德晟达、游密,发布云会议终端解决方案,打造视听新体验

E科讯

关于Kubernetes和Docker关系的八个问题

杨明越

可见性是什么?(通俗易懂)

叫练

volatile JMM 多线程 synchronized

人脸识别是如何实现的

anyRTC开发者

ios 音视频 WebRTC 人脸识别 安卓

一文教你看懂缓存穿透、击穿、雪崩、降级等异常

鄙人薛某

Java 缓存 后端 缓存击穿 缓存雪崩

operator-sdk & kubebuilder

QiLab

k8s operator-sdk kubebuilder crd

Mybatis 中xml和注解映射,这次终于搞明白了

田维常

mybatis

情报合成研判系统开发,智慧警务解决方案

t13823115967

智慧公安

全球熵ETV系统APP软件开发

系统开发

安装MySQL后,需要调整的10个性能配置项

Simon

MySQL percona server

时序数据库DolphinDB与Druid的对比测试

DolphinDB

数据分析 时序数据库 Druid 数据库选择 DolphinDB

开发实践丨用小熊派STM32开发板模拟自动售货机

华为云开发者联盟

物联网 小熊派 开发板

话题讨论 | 选择做一个程序员,你后悔过吗?

xcbeyond

话题讨论

区块链司法存证应用落地应用解决方案

t13823115967

区块链落地开发

Java架构速成笔记:七大专题,1425页考点,挑战P8岗

Java架构追梦

Java 学习 面试 java架构

P8架构挑战:七大专题1425页考点,你能成功吗?

小Q

Java 学习 程序员 架构 面试

网咯请求中的 connectTimeout 和 soTimeout

不在调上

字节跳动能在海外建立信任吗?_AI&大模型_Kevin Xu_InfoQ精选文章