AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

近三代操作系统开发元老一起创业搞 AI Agent 操作系统,AI 大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

  • 2024-11-29
    北京
  • 本文字数:4461 字

    阅读完需:约 15 分钟

大小:2.05M时长:11:54
近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

一群曾经参与构建 Android 平台的前谷歌、Stripe 高管,如今创建了一家专注于开发 AI 智能体操作系统的新公司/dev/agents,并已经在种子轮筹集到 5600 万美元。

 

/dev/agents 正在构建全新的 AI agent 操作系统,为开发者提供与 AI agent 合作所需的工具。该公司的愿景是打造一个中央系统,该系统能够对每个用户建立共同的理解,并提供必要的 UI 模式、开发者平台以及周边生态系统,以便构建一类新的、令人愉悦的产品。

 


“史诗般的团队”

 

越来越多的科技企业正着手开发所谓 AI 智能体,这些智能体可以执行诸如航班预订或者代码编写等任务,且期间只需极少量的人为介入。这些工具的目标在于提高生产力,让人们能够与 AI 直接交互,且实际体验高度接近与人类同事或助手协同工作。

 

但/dev/agents 的创始人们认为,这其中还缺少关键的一环。如果 AI 智能体有朝一日将如当下的应用程序一样无处不在,那么开发人员肯定需要一套通用技术框架将这些服务连接起来并允许其相互通信——其功能定位就类似于苹果 iOS 或者谷歌 Android 系统。

 

/dev/agents 公司联合创始人兼 CEO David Singleton 表示,“我们需要在 AI 领域创造出 Android 时刻。”

 

Singleton 帖子下面很多网友表达了自己的期待。

 


值得的关注的是,/dev/agents 的创始团队被网友称为是“史诗般的团队”。“作为投资人,我们遇到了许多企业家,但很少遇到像这个这样出色的创始团队”,CapitalG 公司也如此说道。

 

作为本世纪各大计算平台变革的先驱,创始团队的 David Singleton、Hugo Barra、Ficus Kirkpatrick 和 Nicholas Jitkoff 已经开发出了每天有数十亿人使用的软件。Barra 指出,“这是一支曾经参与最近三代操作系统的开发队伍。”他指的自然是 Android、可穿戴设备和 AR/VR 这三大系统平台。

 

  • David Singleton 在创业之前,曾在 Stripe 担任首席技术官近 7 年,在建立金融渠道方面发挥了关键作用。这之前,Singleton 还曾在谷歌担任 Android 产品工程副总裁,负责监督 Android 新界面的开发,特别是移动界面的开发。在谷歌任职期间,他创立了为智能手表和其他可穿戴设备设计的 Android 操作系统版本 Android Wear。

 

  • Hugo Barra 的职业生涯始于计算机行业的早期关键时刻,他开发了一系列产品。大学毕业后,Barra 与他人共同创立了一家公司,专注于开发语音识别技术,这项技术后来为苹果第一代 Siri 提供了支持。之后,他在 Android 生态系统中工作了近十年,先是在谷歌负责 Android 操作系统的产品管理,随后在小米担任全球副总裁,负责建立全球智能手机业务。最近,Barra 在 Meta 担任了四年副总裁,负责管理 Oculus VR 产品。此后,他成为 Detect(一家 AI 健康诊断公司)的联合创始人兼首席执行官。

 

  • Ficus Kirkpatrick 是移动计算转型的早期先驱之一。他曾是 Danger Hiptop(也称为 T-Mobile Sidekick)的创造者之一,这款手机是第一款始终连接到互联网的现代智能手机。在 Google 收购 Danger 之前,Kirkpatrick 是原始 Android 团队的工程师。后来,他加入谷歌担任工程主管,成功将 Google Play 打造成一家价值数十亿美元的企业。最近,他与 Hugo Barra 合作,担任 Meta 的副总裁,负责虚拟现实(VR)和增强现实(AR)平台的开发。目前他担任/dev/agents 的 CTO 一职。

 

  • Nicholas Jitkoff 在 Chrome OS、Android 和 Oculus 等新计算平台的设计中扮演了关键角色,专注于探索性输入、交互和系统设计。他曾是 Material Design 的首席设计师,负责构建 Google 的整体界面框架。此外,Jitkoff 还曾担任 Dropbox 的设计副总裁,并后来领导了 Figma 的核心系统和 AI 设计团队。

 

“我们都能感受到 AI 智能体的巨大潜力空间。但从开发者的角度出发,现在想靠它做出好的产品实在太过困难。”Singleton 说道。

 

Kirkpatrick 转发 Singleton 的话很简单:让我们重新发明应用程序。Barra 则表示,“回归 Android 本源,为人类和 AI 智能体构建一个新的操作系统。”

 

为了解决这个问题,/dev/agents 计划构建一款能够运行在手机、笔记本电脑甚至是车载系统上的云端操作系统。该公司还希望开发一套新型用户界面,让人们能够更加顺畅自然地与各种硬件设备上的智能体进行交互。

 

除了四位创始人之外,/dev/agents 还有另外两名员工。其中,Björn Bringert 领导谷歌搜索在安卓系统上的发展近 10 年,使其用户数量超过了十亿。之后,他领导了沃尔沃汽车在线、连接性和商业数字产品的发展。最近,他一直在构建从电动货运自行车、海上救援无人机和便携式电子设备到移动应用、网络应用、后端服务和各种 AI 原型产品。

 

该公司目前也在扩大团队:“我们正在寻找以用户为中心、注重工艺、具有开拓精神、不太自视甚高的人加入我们旧金山的团队。我们雄心勃勃,但又务实。我们奔跑迅速,但注重细节。我们认为创造未来的最佳方式是每天坚持不懈地取得进步。”

 

Singleton 表示,该公司计划保持相对灵活的运营形态,类似于 Android 早期开发团队。该公司打算着力投入的一个主要方向在于计算推理,这也是为 AI 智能体构建操作系统所必需的前置科技。

 

Karpahy 等知名人士参投

 

/dev/agents 总部位于旧金山,其在本周二宣布完成了由 Index Ventures 领投、Alphabet 成长投资基金与谷歌旗下 CapitalG 等联合跟投的大型种子轮融资。据一位未获授权公开披露细节信息的知情人士透露,此轮融资已经将/dev/agents 的估值拉升至 5 亿美元。

 

创始人的背景正是左右投资决策的关键因素。“考虑到这家公司的员工以及创始人阵容与市场需求的契合度,就能意识到他们的开发目标必将大有可为。”对于 Index Ventures 合伙人 Nina Achadjian 说道,她与 Singleton 在谷歌工作时就已经相识。

 

CapitalG 合伙人 Jill Chase 则表示,“他们选择的是一条千载难逢的机遇赛道。”过去一年多以来,Chase 本人一直在苦苦找寻为 AI 智能体开发操作系统的企业投资对象。

 

而最引人关注的则是数十位天使投资者也参与进来,其中包括 Scale AI 公司 CEO Alexandr Wang、Palo Alto Networks CEO Nikesh Arora 以及 OpenAI 联合创始人 Andrej Karpahy 等知名人士。

 

Andrej Karpathy 在去年提出了 LLM 操作系统的概念,当时在硅谷引发了热议。

 


Karpathy 提出的 LLM OS 在概念上类似一颗“大脑”,相当于 GPT-4 大语言模型的涡轮增压版,设想以每秒 20 Hz 的“心率”以 token 为单位保持运行。所谓 token 单位,用以表示系统预期的语言处理能力——作为大模型一项必不可少的技能,未来用户下达命令可能如同好友之间的寒暄般轻松随意。

 

该系统的内存使用能容纳 128K tokens 的 RAM,意味着其能够轻松处理大量文本。而其中设想的文件数据存储系统为“Ada002”。对视频和音频等 I/O 外设的支持绝非临时起意,如今的多模态模型已经开辟出一种新的可能性:大模型可以观看无声电影并实时生成故事脚本,或者根据雨滴敲打窗户的白噪音创作交响乐。

 

Karpathy 的蓝图中也不乏开发者们熟悉的软件工具。Python 解释器加上终端或将拥抱自然语言操作指令。也许未来的编程工作,就像跟好友谈天说地般轻松自然。

 

Karpathy 当时的想象就预示了计算范式将会迎来巨大转变。LLM OS 让人们开始重新构想自己的日常数字交互方式与体验:在未来,“请安装最新更新”这种当下常规的操作在多数用户眼中将变得如同计算机系统维护一样复杂——毕竟已经完全由大模型操作系统代劳了;而“帮我找条回家的最佳路线”也不再只是冷冰冰的行程规划,而是一段关于日程安排的深入讨论。

 

Karpathy 所展现的未来不仅建立在更复杂的算法之上,还将与同理心与情感共鸣密不可分——种种传统上只属于人类的心灵体验,也许将成为能够在人机之间分享的真切感受。

 

如果说,当时的 LLM OS 还只是纯粹的思想实验,那 Singleton 几人的创业则是在为实现这个思想实验提供助力。

 

巨头们的 Agent 战争

 

如今,人工智能系统已经能够主动与计算机界面互动,而不仅仅停留在处理文本和图像上。

 

操作系统提供了硬件和软件之间的基本接口。而生成式 AI 正以并行操作系统的形式出现,协调大规模计算基础设施和复杂应用程序之间的交互,这些应用程序现在被重新定义为 AI agent。这种转变不是简单的自动化或逐步改进。

 

原来由英特尔、ARM 和 SPARC 主导的硬件层,现在正在不断发展以满足 AI 工作负载的需求。Nvidia 、Groq、Cerebras 等公司正在提供下一代硬件,专门研究 AI 专用处理器。而原来戴尔、HPE 和 IBM 等 OEM(原始设备制造商)的提供服务器、存储和网络设备来运行操作系统驱动的应用程序,现在变成 AWS、Microsoft Azure 和 Google Cloud 等云平台引领着 AI 技术栈,提供针对生成 AI 优化的基础设施和服务。

 

在传统的操作系统内核中,管理内存和进程等低级功能。在生成式 AI 技术栈中,语言模型(如 Llama、Gemma、Mistral 和 Phi)充当核心,使系统能够生成类似人类的文本、图像甚至代码。Apple Intelligence 和 Microsoft Copilot+ PC 是 GenAI 模型如何成为操作系统不可或缺的一部分的早期例子。正如内核对于操作系统的功能至关重要一样,这些模型是 AI 系统的基石。

 

与核心操作系统实用程序类似,嵌入模型、矢量数据库和如 LangChain 和 LlamaIndex 等编排框架等 AI 工具现在已成为关键组件。它们简化了处理复杂工作流程的过程,使 AI agent 能够检索知识并有效地执行任务。这些框架还为开发人员和组织提供了一个“shell”,用于构建、训练和部署 AI agent。

 

在传统技术栈中,应用程序构建在操作系统之上,用于执行特定任务并为用户提供价值。在生成式 AI 技术栈中,AI agent 承担这些应用程序的角色,但是它们的能力远远超过传统软件。AI agent 是自主的、能够与环境交互,从数据中学习并执行从客户服务到软件开发等各种领域的任务。

 

目前,围绕 AI agent 的整个生态正在逐渐建立和完善。所有领先的人工智能公司都承诺将推出自主 AI agent,而 OpenAI 最近也大肆宣传这种可能性。

 

几周前,在 Reddit 的论坛上,OpenAI 首席执行官 Sam Altman 表示,“我们将拥有越来越好的模型”,但“我认为下一个重大突破将是 agent。”OpenAI 首席产品官 Kevin Weil 也表示,“2025 年将是 agent 系统最终进入主流的一年。”

 

本月,有消息称 OpenAI 公司计划于 2025 年 1 月,以研究预览和开发工具的形式,推出名为“Operator”的自动化 AI 智能体,可以独立控制计算机并执行各种任务。此举加剧了开发 AI agent 科技巨头之间的竞争:微软最近宣布构建了强大的 AI agent 生态;Anthropic 推出“computer use”功能,而据报道谷歌也在准备自己的版本,将于本月发布。

 

这些公司希望 AI agent 能够提供一种将强大但昂贵的 AI 模型货币化的方法,那这条路能否带来理想的效果,需要时间验证,但应该不会太久。

 

参考链接:

https://www.bloomberg.com/news/articles/2024-11-26/former-google-stripe-executives-raise-56-million-for-ai-agent-startup?leadSource=uverify%20wall

https://www.capitalg.com/insights/dev-agents-the-operating-system-for-ai-agents/

https://x.com/karpathy/status/1723140519554105733

https://medium.com/@marcelheinz/the-llm-os-a-glimpse-into-the-future-of-tech-with-andrej-karpathy-3bcbc0baf339

https://www.forbes.com/sites/janakirammsv/2024/09/25/if-generative-ai-is-the-new-operating-system-agents-are-the-new-apps/

2024-11-29 09:5010408

评论

发布
暂无评论
发现更多内容

幂等最佳实践

得物技术

数据 幂等 API 一致性 请求

元宇宙时代NFT的价值衡量

CECBC

为冬奥加油——利用贝塞尔曲线实现冰墩墩

战场小包

前端 canvas 冬奥会 2月月更

“区块链”将彻底改变人类社会文明,颠覆世界最强大的企业

CECBC

MongoDB在vivo评论中台的应用案例

MongoDB中文社区

mongodb

前端培训:Vue3 的自定义指令

@零度

Vue 前端开发

官宣 | 极狐GitLab SaaS来了

极狐GitLab

关于极狐GitLab SaaS,你应该知道这些!

极狐GitLab

DevSecOps SaaS平台

报名开启 | 2月25日,索信达监管合规产品线上发布会

索信达控股

【C语言】 初始函数 & 数组

謓泽

数组 C语言 函数 2月月更

艾瑞咨询:青云科技入选中国开源软件产业图谱

青云技术社区

云计算 开源 混合云

Mysql数据库表中有索引为什么还是查询慢?

慕枫技术笔记

数据库 2月月更

Go学习笔记——同构复合类型

为自己带盐

Go 学习笔记 2月月更

MongoDB University 中文字幕视频上线!

MongoDB中文社区

mongodb

全方位构建信创生态体系,焱融科技完成海光 CPU 生态兼容性认证

焱融科技

云计算 分布式 高性能 文件存储 生态

用UML来描述领域模型吧

蜜糖的代码注释

UML 领域建模 2月月更

Tapdata 在线研讨会:如何快速上手 Tapdata Cloud?

tapdata

数据库 Cloud

跨项目度量,CTO、PMO们的好帮手

阿里云云效

阿里云 云原生 敏捷开发 CTO 研发度量

DevSecOps端到端的安全能力构建为什么重要

极狐GitLab

安全 DevSecOps

什么字体更适合程序员?

lencx

程序员 字体设置 主题

深入解析 Flink 细粒度资源管理

Apache Flink

大数据 flink 开源 编程 实时计算

【Python训练营】Python每日一练----第23天:字符计数

是Dream呀

2月月更

数字货币或将消灭银行!未来3至5年,银行业可能将崩溃?

CECBC

java培训:JVM参数配置

@零度

JVM JAVA开发

8分钟了解TDengine的WAL机制

TDengine

数据库 tdengine 开源 物联网

面试突击23:说一下线程生命周期,以及转换过程?

王磊

使用APICloud AVM多端组件快速实现app中的搜索功能

YonBuilder低代码开发平台

前端 APP开发 APICloud 跨端开发 跨端框架

优酷 IPv6 演进和实践指南

阿里巴巴终端技术

ipv6 移动网络

大数据培训:Flink 快照分析

@零度

flink 大数据开发

剖析react核心设计原理--异步执行调度

有道技术团队

【网络安全】知名网络安全企业有哪些?

行云管家

网络安全 数据安全 堡垒机

近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源_AI&大模型_褚杏娟_InfoQ精选文章