QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

近三代操作系统开发元老一起创业搞 AI Agent 操作系统,AI 大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

  • 2024-11-29
    北京
  • 本文字数:4461 字

    阅读完需:约 15 分钟

大小:2.05M时长:11:54
近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

一群曾经参与构建 Android 平台的前谷歌、Stripe 高管,如今创建了一家专注于开发 AI 智能体操作系统的新公司/dev/agents,并已经在种子轮筹集到 5600 万美元。

 

/dev/agents 正在构建全新的 AI agent 操作系统,为开发者提供与 AI agent 合作所需的工具。该公司的愿景是打造一个中央系统,该系统能够对每个用户建立共同的理解,并提供必要的 UI 模式、开发者平台以及周边生态系统,以便构建一类新的、令人愉悦的产品。

 


“史诗般的团队”

 

越来越多的科技企业正着手开发所谓 AI 智能体,这些智能体可以执行诸如航班预订或者代码编写等任务,且期间只需极少量的人为介入。这些工具的目标在于提高生产力,让人们能够与 AI 直接交互,且实际体验高度接近与人类同事或助手协同工作。

 

但/dev/agents 的创始人们认为,这其中还缺少关键的一环。如果 AI 智能体有朝一日将如当下的应用程序一样无处不在,那么开发人员肯定需要一套通用技术框架将这些服务连接起来并允许其相互通信——其功能定位就类似于苹果 iOS 或者谷歌 Android 系统。

 

/dev/agents 公司联合创始人兼 CEO David Singleton 表示,“我们需要在 AI 领域创造出 Android 时刻。”

 

Singleton 帖子下面很多网友表达了自己的期待。

 


值得的关注的是,/dev/agents 的创始团队被网友称为是“史诗般的团队”。“作为投资人,我们遇到了许多企业家,但很少遇到像这个这样出色的创始团队”,CapitalG 公司也如此说道。

 

作为本世纪各大计算平台变革的先驱,创始团队的 David Singleton、Hugo Barra、Ficus Kirkpatrick 和 Nicholas Jitkoff 已经开发出了每天有数十亿人使用的软件。Barra 指出,“这是一支曾经参与最近三代操作系统的开发队伍。”他指的自然是 Android、可穿戴设备和 AR/VR 这三大系统平台。

 

  • David Singleton 在创业之前,曾在 Stripe 担任首席技术官近 7 年,在建立金融渠道方面发挥了关键作用。这之前,Singleton 还曾在谷歌担任 Android 产品工程副总裁,负责监督 Android 新界面的开发,特别是移动界面的开发。在谷歌任职期间,他创立了为智能手表和其他可穿戴设备设计的 Android 操作系统版本 Android Wear。

 

  • Hugo Barra 的职业生涯始于计算机行业的早期关键时刻,他开发了一系列产品。大学毕业后,Barra 与他人共同创立了一家公司,专注于开发语音识别技术,这项技术后来为苹果第一代 Siri 提供了支持。之后,他在 Android 生态系统中工作了近十年,先是在谷歌负责 Android 操作系统的产品管理,随后在小米担任全球副总裁,负责建立全球智能手机业务。最近,Barra 在 Meta 担任了四年副总裁,负责管理 Oculus VR 产品。此后,他成为 Detect(一家 AI 健康诊断公司)的联合创始人兼首席执行官。

 

  • Ficus Kirkpatrick 是移动计算转型的早期先驱之一。他曾是 Danger Hiptop(也称为 T-Mobile Sidekick)的创造者之一,这款手机是第一款始终连接到互联网的现代智能手机。在 Google 收购 Danger 之前,Kirkpatrick 是原始 Android 团队的工程师。后来,他加入谷歌担任工程主管,成功将 Google Play 打造成一家价值数十亿美元的企业。最近,他与 Hugo Barra 合作,担任 Meta 的副总裁,负责虚拟现实(VR)和增强现实(AR)平台的开发。目前他担任/dev/agents 的 CTO 一职。

 

  • Nicholas Jitkoff 在 Chrome OS、Android 和 Oculus 等新计算平台的设计中扮演了关键角色,专注于探索性输入、交互和系统设计。他曾是 Material Design 的首席设计师,负责构建 Google 的整体界面框架。此外,Jitkoff 还曾担任 Dropbox 的设计副总裁,并后来领导了 Figma 的核心系统和 AI 设计团队。

 

“我们都能感受到 AI 智能体的巨大潜力空间。但从开发者的角度出发,现在想靠它做出好的产品实在太过困难。”Singleton 说道。

 

Kirkpatrick 转发 Singleton 的话很简单:让我们重新发明应用程序。Barra 则表示,“回归 Android 本源,为人类和 AI 智能体构建一个新的操作系统。”

 

为了解决这个问题,/dev/agents 计划构建一款能够运行在手机、笔记本电脑甚至是车载系统上的云端操作系统。该公司还希望开发一套新型用户界面,让人们能够更加顺畅自然地与各种硬件设备上的智能体进行交互。

 

除了四位创始人之外,/dev/agents 还有另外两名员工。其中,Björn Bringert 领导谷歌搜索在安卓系统上的发展近 10 年,使其用户数量超过了十亿。之后,他领导了沃尔沃汽车在线、连接性和商业数字产品的发展。最近,他一直在构建从电动货运自行车、海上救援无人机和便携式电子设备到移动应用、网络应用、后端服务和各种 AI 原型产品。

 

该公司目前也在扩大团队:“我们正在寻找以用户为中心、注重工艺、具有开拓精神、不太自视甚高的人加入我们旧金山的团队。我们雄心勃勃,但又务实。我们奔跑迅速,但注重细节。我们认为创造未来的最佳方式是每天坚持不懈地取得进步。”

 

Singleton 表示,该公司计划保持相对灵活的运营形态,类似于 Android 早期开发团队。该公司打算着力投入的一个主要方向在于计算推理,这也是为 AI 智能体构建操作系统所必需的前置科技。

 

Karpahy 等知名人士参投

 

/dev/agents 总部位于旧金山,其在本周二宣布完成了由 Index Ventures 领投、Alphabet 成长投资基金与谷歌旗下 CapitalG 等联合跟投的大型种子轮融资。据一位未获授权公开披露细节信息的知情人士透露,此轮融资已经将/dev/agents 的估值拉升至 5 亿美元。

 

创始人的背景正是左右投资决策的关键因素。“考虑到这家公司的员工以及创始人阵容与市场需求的契合度,就能意识到他们的开发目标必将大有可为。”对于 Index Ventures 合伙人 Nina Achadjian 说道,她与 Singleton 在谷歌工作时就已经相识。

 

CapitalG 合伙人 Jill Chase 则表示,“他们选择的是一条千载难逢的机遇赛道。”过去一年多以来,Chase 本人一直在苦苦找寻为 AI 智能体开发操作系统的企业投资对象。

 

而最引人关注的则是数十位天使投资者也参与进来,其中包括 Scale AI 公司 CEO Alexandr Wang、Palo Alto Networks CEO Nikesh Arora 以及 OpenAI 联合创始人 Andrej Karpahy 等知名人士。

 

Andrej Karpathy 在去年提出了 LLM 操作系统的概念,当时在硅谷引发了热议。

 


Karpathy 提出的 LLM OS 在概念上类似一颗“大脑”,相当于 GPT-4 大语言模型的涡轮增压版,设想以每秒 20 Hz 的“心率”以 token 为单位保持运行。所谓 token 单位,用以表示系统预期的语言处理能力——作为大模型一项必不可少的技能,未来用户下达命令可能如同好友之间的寒暄般轻松随意。

 

该系统的内存使用能容纳 128K tokens 的 RAM,意味着其能够轻松处理大量文本。而其中设想的文件数据存储系统为“Ada002”。对视频和音频等 I/O 外设的支持绝非临时起意,如今的多模态模型已经开辟出一种新的可能性:大模型可以观看无声电影并实时生成故事脚本,或者根据雨滴敲打窗户的白噪音创作交响乐。

 

Karpathy 的蓝图中也不乏开发者们熟悉的软件工具。Python 解释器加上终端或将拥抱自然语言操作指令。也许未来的编程工作,就像跟好友谈天说地般轻松自然。

 

Karpathy 当时的想象就预示了计算范式将会迎来巨大转变。LLM OS 让人们开始重新构想自己的日常数字交互方式与体验:在未来,“请安装最新更新”这种当下常规的操作在多数用户眼中将变得如同计算机系统维护一样复杂——毕竟已经完全由大模型操作系统代劳了;而“帮我找条回家的最佳路线”也不再只是冷冰冰的行程规划,而是一段关于日程安排的深入讨论。

 

Karpathy 所展现的未来不仅建立在更复杂的算法之上,还将与同理心与情感共鸣密不可分——种种传统上只属于人类的心灵体验,也许将成为能够在人机之间分享的真切感受。

 

如果说,当时的 LLM OS 还只是纯粹的思想实验,那 Singleton 几人的创业则是在为实现这个思想实验提供助力。

 

巨头们的 Agent 战争

 

如今,人工智能系统已经能够主动与计算机界面互动,而不仅仅停留在处理文本和图像上。

 

操作系统提供了硬件和软件之间的基本接口。而生成式 AI 正以并行操作系统的形式出现,协调大规模计算基础设施和复杂应用程序之间的交互,这些应用程序现在被重新定义为 AI agent。这种转变不是简单的自动化或逐步改进。

 

原来由英特尔、ARM 和 SPARC 主导的硬件层,现在正在不断发展以满足 AI 工作负载的需求。Nvidia 、Groq、Cerebras 等公司正在提供下一代硬件,专门研究 AI 专用处理器。而原来戴尔、HPE 和 IBM 等 OEM(原始设备制造商)的提供服务器、存储和网络设备来运行操作系统驱动的应用程序,现在变成 AWS、Microsoft Azure 和 Google Cloud 等云平台引领着 AI 技术栈,提供针对生成 AI 优化的基础设施和服务。

 

在传统的操作系统内核中,管理内存和进程等低级功能。在生成式 AI 技术栈中,语言模型(如 Llama、Gemma、Mistral 和 Phi)充当核心,使系统能够生成类似人类的文本、图像甚至代码。Apple Intelligence 和 Microsoft Copilot+ PC 是 GenAI 模型如何成为操作系统不可或缺的一部分的早期例子。正如内核对于操作系统的功能至关重要一样,这些模型是 AI 系统的基石。

 

与核心操作系统实用程序类似,嵌入模型、矢量数据库和如 LangChain 和 LlamaIndex 等编排框架等 AI 工具现在已成为关键组件。它们简化了处理复杂工作流程的过程,使 AI agent 能够检索知识并有效地执行任务。这些框架还为开发人员和组织提供了一个“shell”,用于构建、训练和部署 AI agent。

 

在传统技术栈中,应用程序构建在操作系统之上,用于执行特定任务并为用户提供价值。在生成式 AI 技术栈中,AI agent 承担这些应用程序的角色,但是它们的能力远远超过传统软件。AI agent 是自主的、能够与环境交互,从数据中学习并执行从客户服务到软件开发等各种领域的任务。

 

目前,围绕 AI agent 的整个生态正在逐渐建立和完善。所有领先的人工智能公司都承诺将推出自主 AI agent,而 OpenAI 最近也大肆宣传这种可能性。

 

几周前,在 Reddit 的论坛上,OpenAI 首席执行官 Sam Altman 表示,“我们将拥有越来越好的模型”,但“我认为下一个重大突破将是 agent。”OpenAI 首席产品官 Kevin Weil 也表示,“2025 年将是 agent 系统最终进入主流的一年。”

 

本月,有消息称 OpenAI 公司计划于 2025 年 1 月,以研究预览和开发工具的形式,推出名为“Operator”的自动化 AI 智能体,可以独立控制计算机并执行各种任务。此举加剧了开发 AI agent 科技巨头之间的竞争:微软最近宣布构建了强大的 AI agent 生态;Anthropic 推出“computer use”功能,而据报道谷歌也在准备自己的版本,将于本月发布。

 

这些公司希望 AI agent 能够提供一种将强大但昂贵的 AI 模型货币化的方法,那这条路能否带来理想的效果,需要时间验证,但应该不会太久。

 

参考链接:

https://www.bloomberg.com/news/articles/2024-11-26/former-google-stripe-executives-raise-56-million-for-ai-agent-startup?leadSource=uverify%20wall

https://www.capitalg.com/insights/dev-agents-the-operating-system-for-ai-agents/

https://x.com/karpathy/status/1723140519554105733

https://medium.com/@marcelheinz/the-llm-os-a-glimpse-into-the-future-of-tech-with-andrej-karpathy-3bcbc0baf339

https://www.forbes.com/sites/janakirammsv/2024/09/25/if-generative-ai-is-the-new-operating-system-agents-are-the-new-apps/

2024-11-29 09:508828

评论

发布
暂无评论
发现更多内容

企业为何开始选择使用成品训练数据集?

澳鹏Appen

人工智能 机器学习 大数据 数据集 数据流

手起刀落,连斩获阿里(四面)+字节(四面)+美团(三面)三家一线大厂Offer!

Java架构追梦

Java 架构 面试

面试笔记(二)线程池连环炮

U2647

Thread 4月日更

BBK智能合约系统开发|BBK智能合约APP软件开发

系统开发

有了这个框架,平台开发谁还手敲代码?

华为云开发者联盟

华为云 智慧园区 MainPortal 统一门户 HDC2021

超低功耗LoRa无线通信应用实践

不脱发的程序猿

物联网 无线通信 4月日更 LoRa 无线通信模组

“区块链+版权”应用保护者

电微13828808271

教你一个著名的流行数据格式:Python JSON

华为云开发者联盟

Python 数据 Python JSON JSON序列化 半结构化数据

CSS实现动画环绕下划线效果

Sakura

4月日更

3d导航栏

赫鲁小夫

4月日更

模块一:课后作业

sN0wpeak

架构实战营

“区块链+”,应用积分营销

电微13828808271

区块链

对于数据,科技小白提出了灵魂三问:从哪儿来?到哪儿去?能干什么?

华为云开发者联盟

人工智能 安全 数据 数据采集 网络人工智能

这6个浏览器插件,让你的浏览器大为不同。

彭宏豪95

chrome 浏览器 插件 chrome扩展 4月日更

拍乐云 x 扬帆出海 x LiveCloud:音视频出海专家干货分享

拍乐云Pano

flutter ios android WebRTC RTC

假期后来一波干货:一文理清JVM和GC

比伯

Java 程序员 架构 JVM 计算机

Rust从0到1-结构体-定义和实例化

rust struct 结构体

情指勤一体化指挥调度平台建设,重点人员管理平台

Spring Boot + RabbitMQ实现订单过期自动取消功能

Lonely Sufferer

RabbitMQ springboot

架构实战营-模块1-微信业务架构-学生系统架构备选方案

吴建中

平面设计之PS(前序)

空城机

PhotoShop ps 4月日更

牛比特小矿工系统开发|牛比特小矿工软件APP开发

系统开发

架构实战营模块 1 作业

Geek_2b52aa

架构实战营

架构训练营

架构训练营

人生苦短,我用Python之小游戏

Bob

开发者 Python 游戏编程 4月日更 -python

你在备战“字节”时一定需要这个,程序员进大厂指南+算法已开源

Java架构师迁哥

架构实战营第一次作业

CmHuang

架构实战营

书单|互联网企业面试案头书之运营篇

博文视点Broadview

7 个非常实用的 Shell 拿来就用脚本实例!

JackTian

Linux 编程 Shell 脚本语言 运维工程师

「架构实战营」模块一作业

between

架构实战营

【Java 试题】AQS解析

程序员架构进阶

AQS Java源码 28天写作 4月日更

近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源_AI&大模型_褚杏娟_InfoQ精选文章