便携式大语言模型才是智能手机的未来_生成式 AI_Mark Pesce_InfoQ精选文章

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么

登录/注册



大小：760.47K时长：04:19

便携式大语言模型才是智能手机的未来

本文最初发布于 The Register 博客。

智能手机的创新已经停滞。不久前发布的 iPhone 15 确实带来了一些不错的功能。但在一段时间内，我的 iPhone 13 还是可以满足我的需求，我不会急于更换。我之前的 iPhone 用了四年。

在这款手机之前，我有充分的理由购买来自库比蒂诺的年度升级版本。但现在，我们能从中得到什么呢？iPhone 15提供了 USB-C 接口、更好的摄像头和更快的无线充电。这些功能都很好，但对大多数用户来说却并不是必需的。

然而，鉴于目前近乎疯狂的人工智能创新浪潮，智能手机很快也会变得更好。

几乎每个拥有智能手机的人都可以通过 App 或浏览器访问“三大”人工智能聊天机器人——OpenAI 的 ChatGPT、微软的 Bing Chat 和谷歌的 Bard。

这已经很好了。不过，除了这些“通用”人工智能聊天机器人之外，一项由另一家大型科技巨头牵头的秘密工作似乎正在占据上风。

早在 2 月份，Meta AI Labs 就发布了LLaMA——这是一个训练数据集和参数数量都变小了的大型语言模型。对于大型语言模型的工作原理，我们在直觉上还是会将其与更多的参数和更大的容量等同起来——例如，人们认为 GPT-4 有一万亿甚至更多的参数，尽管 OpenAI 对这个数字守口如瓶。

Meta 的 LLaMA 只有区区 700 亿个参数，甚至有一个版本只有 70 亿个。

那么，是不是说 LLaMA 只有 GPT-4 的千分之一呢？这就是有趣的地方。虽然 LLaMA 从来没有在任何基准测试中击败过 GPT-4，但它并不差——在许多情况下，它已经不是一般的好了。

LLaMA 是按 Meta 的方式开源的，研究人员可以使用其工具、技术来训练模型并迅速作出显著的改进。仅仅在几周之内，就出现了Alpaca、Vicuna 等大型语言模型，每一个都优化得比 LLaMA 还好——同时，在基准测试中也和 GPT-4 越来越接近。

当 Meta AI 实验室在 7 月份发布LLaMA2的时候——许可不再那么以 Meta 为中心——成千上万的 AI 程序员开始针对各种用例对它进行调整。

Meta AI 实验室自己也不甘落后，他们几周前发布了自己的微调版本Code LLaMA——内嵌到 IDE 中提供代码补全功能，或者简单地提供分析和修复代码。此后两天之内，一家名为Phind的初创公司就将 Code LLaMA 优化为一个可以在单项基准测试中击败 GPT-4 的大型语言模型。

这是第一次，算是对OpenAI、微软和谷歌的一次警告。看似“微小”的大型语言模型也可以足够好，同时还足够小，不必在飞机机库大小的云计算设施中运行，不用像那样消耗大量的电力和水资源。相反，它们可以在笔记本电脑甚至智能手机上运行。

不是理论上可以。几个月来，我一直在 iPhone 13 上运行MLC聊天应用。它运行有着 70 亿个参数的 LLaMA2 模型并没有什么问题。这个迷你模型不如有着 130 亿个参数的 LLaMA2 模型亮眼（但我的智能手机没有足够的内存来容纳它），但它在尺寸和性能之间做了很好的平衡。

iPhone 15 也没有——尽管苹果的规格说明书省略了有关 RAM 的细节信息。

这些面向个人的大型语言模型——在私有设备上运行——将很快成为智能手机操作系统的核心功能。它们会获取你所有的浏览数据、活动和医疗数据，甚至是财务数据——所有我们今天交给云计算用来对付我们的数据——它们会不断改进自己，更准确地体现我们的精神、身体和财务状况。

它们会咨询，会鼓励，会警告。它们不会取代大量的通用模型，但它们也不会将我们所有的个人数据泄露到云端。大多数智能手机已经有足够的 CPU 和 GPU 来运行这些面向个人的大型语言模型，但它们需要更多的 RAM。只要多一点内存，我们的智能手机就能变得更加智能。

原文链接：https://www.theregister.com/2023/09/13/personal_ai_smartphone_future/?td=rt-3a

评论

发布

暂无评论

架构实战营毕业总结

架构实战营

经济学人：若比特币价格清零会怎样？

centos8 mediasoup 搭建

webrtc developer

WebRTC mediasoup

给Arm生态添把火，腾讯Kona JDK Arm架构优化实践

开源腾讯 jdk 腾讯开源 KonaJDK

堡垒机品牌就认行云管家！为什么呢？

云计算系统运维堡垒机 IT运维云计算运维

架构师训练营-毕业设计

容器化 | ClickHouse on K8s 基础篇

数据库 Kubernetes Clickhouse

EMQ 映云科技成为开源项目 Vue.js 定期捐赠者

EMQ映云科技

Java 开源大前端 emq

业界良心啊！第五次更新的Spring Cloud Alibaba升级太多内容

公众号_愿天堂没有BUG

Java 编程程序员架构面试

云原生 | 混沌工程工具 ChaosBlade Operator Node 篇

数据库云原生混沌工程

Fil今日价格行情？Fil未来多少钱一枚？

区块链分布式存储 IPFS fil价格 fil行情

基于KubeEdge实现中国移动10086客服云边协同平台

华为云原生团队

云计算开源运维边缘计算边缘技术

底层即真理！Netty+Redis+ZooKeeper解读高并发架构

公众号_愿天堂没有BUG

Java 编程程序员架构面试

八家知名大厂联合手写的Java面试手册刚上线！竟就到达巅峰？

Java 架构面试 JVM 多线程

多线程、分布式、高并发都不懂？你拿什么跳槽？

公众号_愿天堂没有BUG

Java 编程程序员架构面试

腾讯WeTest零售行业质量解决方案

阿里这份15w字Java核心面试笔记！GitHub凭借百万下载量位居榜首

Java 架构面试微服务多线程

多张图片的形式

太为难我了，阿里面试了7轮（5年经验，拿下P7岗offer）

Java 编程程序员架构面试

容器化 | ClickHouse on K8s 部署篇【建议收藏】

数据库 Kubernetes Clickhouse

二本渣渣5面阿里，从准备简历到“直怼”面试官，经历了什么？

Java 程序员架构面试计算机

去哪儿网数据同步平台技术演进与实践

Qunar技术沙龙

数据库数据中台 ES 数据同步 Kafk

好评如潮，PerfDog两年迭代正式启动商业化探索

“区块链”赋能智慧社区，多维度提升管理质效

区块链智慧社区

工具 | 使用 CLion 编译调试 MySQL 8.0

MySQL 数据库

机会！痛点！难点！中国游戏泛娱乐企业出海攻略全解析

游戏出海直播社交APP出海泛娱乐社交

银行小程序隐私安全如何做？诊疗一体，一步到位

云时代的到来会淘汰运维人员吗？运维工作可以一直做吗？

云计算运维云服务 IT运维云时代

终于有人把TCP协议与UDP协议给搞明白了

Java 编程程序员计算机 java技术宅

IM开发技术学习：揭秘微信朋友圈这种信息推流背后的系统设计

即时通讯 IM 微信朋友圈

牛客网论坛最具争议的Java面试成神笔记，GitHub已下载量已过百万

Java 架构面试算法架构师