AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

零一万物发布最新旗舰模型,百万 token 仅 0.99 元!李开复:定价没有亏本

  • 2024-10-16
    北京
  • 本文字数:3054 字

    阅读完需:约 10 分钟

大小:1.46M时长:08:29
零一万物发布最新旗舰模型,百万 token 仅 0.99 元!李开复:定价没有亏本

10 月 16 日,继上半年千亿参数模型 Yi-Large 之后,零一万物正式对外发布最新旗舰模型 Yi-Lightning。与 Yi-Large 相比,Yi-Lightning 在模型性能更进一步的前提下,推理速度方面也迎来极大提升。

 

零一万物内部评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)仅为 Yi-Large 的一半,最高生成速度也提升了近四成,大幅实现了旗舰模型的性能升级。

 

外部模型中,零一万物选择与 GPT-4o 做对比:

 

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    据零一万物介绍,Yi-Lightning 推理速度的提升,一方面得益于其自身的 AI Infra 能力,另一方面,Yi-Lightning 选择采用 Mixture of Experts(MoE)混合专家模型架构,并在模型训练过程中做了新的尝试。

     

    MoE 模型由多个专家网络(Experts)构成,这种模型设计使其能够根据任务难度,动态选择激活哪些专家网络,这种动态选择机制旨在平衡推理成本和模型性能,确保模型在处理不同难度任务时既高效又准确。在训练过程中,MoE 模型会激活所有专家网络,以确保模型能够学习到所有专家的知识;而在推理阶段,根据任务的难度,模型只会选择性地激活更匹配的专家网络。

     

    激活参数的规模和模型总参数的规模是 MoE 模型的两个关键概念。通常来说,激活参数与模型总参数的比例越大,模型的稀疏度就越高。虽然稀疏度的增加会极大程度上降低训练和推理成本,但是也会导致模型性能下降,显著加大训练难度。因此,如何在保持模型性能接近最优的同时,尽可能减少激活参数的数量以降低训推成本、提升推理速度,是 MoE 模型训练的重点目标。

     

    具体到 Yi-Lightning 模型的训练,零一万物的模型团队进行了如下尝试,并取得了正向反馈:

     

    1. 独特的混合注意力机制(Hybrid Attention)。与 Mistral AI 采用的 Sliding Window Attention(滑动窗口注意力机制)不同,零一万物采用了混合注意力机制(Hybrid Attention),只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention),以平衡模型在处理长序列数据时的性能和计算资源消耗。此外,零一万物还引入了跨层注意力(Cross-Layer Attention, CLA)的设计,允许模型在不同的层次之间共享键(Key)和值(Value)头,从而减少对存储资源的需求。通过应用跨层注意力, Yi-Lightning 能够在不同层次之间更有效地共享信息,进一步提高了模型的推理效率。据悉,通过结合这两项技术,Yi-Lightning 在面对长序列数据时,KV 缓存大小实现了 2 倍至 4 倍的减少;某些层次的计算复杂度也由序列长度的平方级降低到线性级。

     

    1. 动态 Top-P 路由。动态 Top-P 路由就像是 MoE 模型中做出选择的“把关人”,可以根据任务的难度动态自动选择最合适的专家网络组合,而无需人工干预。与传统的 Top-K 路由机制相比,动态 Top-P 路由能够更灵活地根据任务的难度调整激活的专家网络数量,从而更好地平衡推理成本和模型性能。动态 Top-P 路由机制的引入也是 Yi-Lightning 能够实现“极速推理”的一大原因。

     

    1. 多阶段训练(Multi-stage Training)。在 Yi-Lightning 的训练规划中,零一万物还改进了单阶段训练,使用了多阶段的训练模式。训练前期,零一万物模型团队更加注重数据的多样性,让模型尽可能广泛吸收不同的知识;而在训练后期则会更加侧重内容更丰富、知识性更强的数据。通过各有侧重的方式, Yi-Lightning 得以在不同阶段吸收不同的知识,既便于模型团队进行数据配比的调试工作,同时在不同阶段采用不同的 batch size 和 LR schedule 来保证训练速度和稳定性。在有较多新增数据、或者想要对模型进行专有化时,零一万物也可以基于 Yi-Lightning 进行快速、低成本的重新训练。

     

    在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

     


    目前,Yi-Lightning 已上线 Yi 大模型开放平台(https://platform.lingyiwanwu.com/),每百万 token 仅需 0.99 元,直逼行业最低价。

     

    李开复明确表示,零一万物在 Yi-Lightning 的定价上并没有亏本。“零一万物也在做 App,我们知道做 App 需要控制成本,所以我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天 0.99 元/百万 token 的价格。”

     

    李开复表示,“从成立的第一天起,零一万物就同时启动了模型训练、AI Infra、AI 应用三大团队,当三个团队都成熟了以后再对接到一起。零一万物将这一模式总结为模基共建、模应一体两大战略——AI Infra 能力助力模型训练和推理,以更低的训练成本训练出性能领先的模型,以更低的推理成本支撑应用层的探索。”

     

    发布会上,李开复也再次回应了关于此前有称大模型公司放弃预训练的传闻。“据我所知,这六家公司融资额度都是够的,我们做预训练的 production run,训练一次三、四百万美金,这个钱头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。”

     

    首度发布 AI 2.0 数字人

     

    此外,零一万物也首度对媒体公布了全新 ToB 战略下的首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型 Yi Lightning 实践于具体行业解决方案。

     

    基于以 Yi Lightning 模型为代表的 Yi 模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与 AI 1.0 时代完全不同的数字人解决方案。角色大模型为零一万物 AI 2.0 数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。 


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      零一万物表示,AI 2.0 数字人配备了“AI 大脑”——在电商话术大模型加持下,数字人能够基于模型自有知识库与外接数据库,自主生成直播话术,也能够快速、精准地识别直播弹幕的互动意图,给出对应解答。

       

      Yi-Lightning 模型接入后,零一万物 AI 2.0 数字人对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。随着与客户合作进程的不断深入,基于模型本身强大的函数调用能力,零一万物 AI 2.0 数字人还能够丝滑地与客户原有营销、物流系统互动,实现从引流到下单的全流程陪护。

       

      据介绍,零一万物的 AI 2.0 数字人解决方案涵盖了 AI 伴侣、IP 形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的 GMV 提升。其中某头部酒旅企业在接入 Yi-Lightning 全新加持的数字人直播后,GMV 较此前上升 170%。

       

      “这样的 to B 工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以全世界的范畴来说,to B 供应商基本都是当地的,即便在中国要买 SAP 的产品也是 SAP 中国卖给你,所以跨国设立分公司做 to B 绝对不是我们或其他创业公司能做的,所以 to B 的国外就放弃了,做 to B 就做国内,做 to B 就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是我们 to B 的做法。”李开复表示。

       

      而零一万物的 to C 布局主要在海外。首先,当团队开始做零一万物时国内还没有合适的中文模型,只有在国外先尝试,尝试了一段时间后就有了心得,迭代出了一些比较好的产品。其次,to C 产品在中国国内走流量有一个很大的问题,流量的成本越来越高但用户可能还有相当的流失,在这样的环境里就要非常谨慎。“现在当下最大的理由还是国外做 to C 产品,我们变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出。”李开复表示。

       

      2024-10-16 16:3211805

      评论

      发布
      暂无评论
      发现更多内容

      Java程序员简历这么写,还过不了筛选算我输!

      Java架构师迁哥

      从零开始学习ThingJS之创建/销毁物体

      ThingJS数字孪生引擎

      JavaScript 3D 3D可视化 数字孪生

      腾讯云大神亲码“redis深度笔记”,字字珠玑,全是精华

      Java 程序员 架构 面试

      暑期 2021 | Serverless Devs 最全项目申请攻略来啦!

      阿里巴巴云原生

      开源 Serverless 开发者 云原生 活动

      Geek 青年说北京沙龙分享

      看山

      Geek青年说

      怎样节省 2/3 的 GPU?爱奇艺 vGPU 的探索与实践

      爱奇艺技术产品团队

      深度学习 gpu

      新生代小鲜肉之代码生成器

      蛋先生DX

      node.js 效率工具 自动化 生成代码

      促成“零碳”社会的全面实现,华为云让技术更有温度

      xiaotan

      华为云

      阿里云 AI 编辑部获 CCBN 创新奖,揭秘传媒行业解决方案背后的黑科技

      阿里云CloudImagine

      阿里云 媒体 CCBN

      持续测试 | DevOps 时代的高效测试之钥

      CODING DevOps

      DevOps 持续测试 迭代式测试

      “四大模型”革新NLP技术应用,揭秘百度文心ERNIE最新开源预训练模型

      百度大脑

      开源 nlp

      千亿级数据迁移mongodb成本节省及性能优化实践

      杨亚洲(专注MongoDB及高性能中间件)

      MySQL 数据库 mongodb 架构 分布式数据库mongodb

      .Net Core Configuration Etcd数据源

      yi念之间

      etcd .net core

      非官方不权威Java面试宝典

      北游学Java

      Java 面试

      Serverless Devs 的官网是如何通过 Serverless Devs 部署的

      阿里巴巴云原生

      Serverless 开发者 运维 云原生 存储

      公安重点人员情报研判分析系统,可视化大屏系统

      如何优化你的HTTPS?

      运维研习社

      https HTTP2.0 5月日更

      个推“D-M-P”三步走, 打造每日治数平台,助力行业数字化升级

      个推

      大数据 数据中台 数据治理 数据智能

      第五课作业

      杰语

      dubbo-go v3 版本 go module 踩坑记

      阿里巴巴云原生

      容器 开发者 云原生 中间件 dubbogo

      量化马丁策略系统搭建,网格策略交易系统

      并发王者课-青铜8:分工协作-从本质认知线程的状态和动作方法

      MetaThoughts

      Java 多线程 并发 并发王者课

      Springboot actuator不可不注意的安全问题-可越权-可脱库

      果果果

      安全 springboot

      五分钟开发属于你自己的代码生成器

      蛋先生DX

      node.js 效率工具 生成代码 JavaScrip

      「信创」风口,国产数据库的新机遇

      BinTools图尔兹

      数据库 数据安全 dba 数据库管理 tdsql

      阿里面试题:MySQL 磁盘满了,怎么办?

      Java架构师迁哥

      日常Bug排查-系统失去响应-Redis使用不当

      无毁的湖光

      Java redis

      简单又灵活的权限设计?

      蛋先生DX

      数据库设计 权限系统 权限 权限架构 rbac

      思想与落地

      型火🔥

      架构 分布式 微服务 哲学

      刚刚接触视频剪辑,怎么快速剪视频?

      奈奈的杂社

      阿里云携手 VMware 共建云原生 IoT 生态,聚开源社区合力打造领域标准

      阿里巴巴云原生

      阿里云 容器 开发者 云原生 k8s

      零一万物发布最新旗舰模型,百万 token 仅 0.99 元!李开复:定价没有亏本_AI&大模型_褚杏娟_InfoQ精选文章