AICon上海「Agent与多模态解决方案专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

巨头们火力全开:AI 应用边界再扩张 | 大模型一周大事

  • 2024-04-15
    北京
  • 本文字数:2402 字

    阅读完需:约 8 分钟

巨头们火力全开:AI应用边界再扩张 | 大模型一周大事

大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我们回顾过去一周的大模型重大事件吧。

一、重点发现

AI 创新不止步,金山办公、谷歌、OpenAI、蚂蚁集团接连升级或推出新产品,持续拓展应用范围。大模型基础研究不断取得突破,能解码 mRNA 非翻译区序列的大模型为预测 mRNA 功能和设计 mRNA 疫苗新序列提供了新的可能。同时,亚马逊云科技、阿里云通义千问、aiXcoder 等企业或团队也开源了各自的大模型,提升了 AI 在视频生成、文本控制、代码编写等领域的能力。此外,多家公司在具身智能领域取得了新进展。谷歌、英特尔推出了一系列 AI 相关更新和新产品,推动了行业基础设施能力的发展。本文将为你揭示这些新品的魅力和价值。

二、具体内容

大模型持续更新

大语言模型

  1. 4 月 7 日,亚马逊云科技宣布,Mistral AI 的 Mistral Large 模型现已在 Amazon Bedrock 平台上正式可用。

开源领域

  1. 4 月 7 日,阿里云通义千问再次开源了一款大语言模型——拥有 320 亿参数的 Qwen1.5-32B。

  2. 4 月 7 日,北大-兔展 AIGC 联合实验室发布了复现 OpenAI 公司的 sora 的开源 Open-Sora-Plan v1.0.0 模型。该模型大幅提升了视频生成质量和文本控制能力,能生成 10 秒、24 FPS 的 1024×1024 视频及高分辨率图像,并支持华为昇腾 910b 等国产 AI 芯片的训练与推理。

  3. 4 月 9 日,aiXcoder 团队开源了全自研 aiXcoder 7B 代码大模型。该模型专注于代码生成与补全任务,提供了个性化训练、私有化部署和定制化开发的解决方案,以满足不同企业的特定需求。

  4. Mistral AI 开源了 Mistral 8X22B 大模型,共有 1760 亿个参数,Context 长度为 6.5 万个 token,可通过 Torrent 下载。

科研领域

  1. 普林斯顿大学王梦迪领导的研究团队开发了全球首个能够解码 mRNA 非翻译区序列的大模型。这一模型的应用目标是精确预测 mRNA 转录为蛋白质的功能,并设计用于 mRNA 疫苗的新序列。该研究的论文为「A 5’ UTR Language Model for Decoding Untranslated Regions of mRNA and Function Predictions」,已被《Nature Machine Intelligence》采纳。

  2. 朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。该研究探讨了三种合成数据类型:bioS、bioR 和 bioD,分别代表使用英语模板编写的人物传记、由 LlaMA2 模型辅助撰写的人物传记,以及可以控制细节的虚拟知识数据。研究重点在于分析基于 GPT2、LlaMA 和 Mistral 的语言模型架构。

应用探索

新产品新应用/功能

  1. 4 月 9 日,金山办公发布了专为组织和企业设计的办公新质生产力平台 WPS 365。该平台集成了升级的 WPS Office、新发布的 WPS AI 企业版及 WPS 协作,实现了文档、AI、协作的无缝整合。用户仅需一个工具,即可调用各类主流大模型。

  2. 谷歌升级了 Gemini 1.5 Pro 大语言模型,为其新增音频分析能力,可直接从音频文件中提取关键信息,无需转换为文字。

  3. 4 月 10 日,OpenAI 宣布 GPT-4 Turbo with Vision 版现已对外开放,用户现可通过 API 接口对其进行访问。此外,该功能支持使用 JSON 模式和函数进行调用。

  4. 4 月 11 日,蚂蚁集团的智能研发平台 CodeFuse 新增了一项新功能——“图生代码”,该功能允许开发人员通过产品设计图快速生成相应的代码,显著提高了前端页面开发的效率。目前,这项新功能正处于内部测试阶段。

智能体

  1. 4 月 9 日,在 Google Cloud Next 2024 大会上,谷歌推出 Vertex AI Agent Builder,是一个帮助企业构建 AI 智能体的新工具,它使得构建和部署生成式对话智能体变得简单快捷。

具身智能

  1. 逐际动力的人形机器人 CL-1 在最新视频中展示了其改进的上楼梯和跑步能力,同时在实时地形感知、全身运动控制和硬件性能上都有所提升。CL-1 能够交替上楼梯,流畅完成跑步动作,并优化了运动控制和硬件结构,实现了更强的稳定性和动力性能。

  2. 斯坦福大学的 ALOHA 家务机器人团队发布了最新研究 Yell At Your Robot,使用者能够通过喊话纠正机器人的错误动作。机器人能动态提升动作水平、调整策略,并根据反馈不断自我改进。

基础设施

  1. 4 月 9 日,曾担任特斯拉 Autopilot 项目负责人以及 OpenAI 科学家的 Andrej Karpathy 推出了一个创新项目,名为“llm.c”,该项目通过仅 1000 行代码便能在 CPU 和 fp32 精度下实现对 GPT-2 模型的训练。

  2. 4 月 9 日,在 Google Cloud Next 2024 大会上,谷歌宣布了一系列 AI 相关的更新和新产品。Gemini 1.5 Pro 在 Vertex AI 平台上提供了公共预览版。谷歌还推出了三大开源工具:Max Diffusion、Jetstream 和 MaxText,这些工具旨在支持生成式 AI 项目和基础设施。在硬件方面,谷歌云宣布推出首款自主研发的 Arm 处理器 Axion,据称其性能比竞争对手高出 30%,能效提高了 60%。此外,谷歌推出的 CodeGemma 是基于 Gemma 模型的代码生成和补全工具,它提供了智能代码补全、高准确性和多语言支持,能够简化开发人员的工作流程。Google DeepMind 发布的 RecurrentGemma 是一系列开放权重语言模型,基于 Griffin 架构,通过局部注意力和线性循环实现快速推理。Google Vids 是谷歌推出的 AI 视频创建工具,它允许用户在 Google Workspace 中与其他工具如文档和表格一起制作视频,并支持实时协作。最后,Gemini Code Assist 是谷歌推出的企业级 AI 代码完成和辅助工具,旨在提供更准确的代码建议和处理大段代码的能力。

  3. 4 月 10 日,在 Vision 2024 大会上,英特尔展示了由其子公司 Habana Labs 开发的最新款高性能 AI 加速器——Gaudi 3,并计划在 2024 年第三季度正式推出。


报告预告

Sora 来袭,国内如何迅速跟上?开源在大模型市场进程中的价值正在被重新定义吗?人型机器人重回视野,其能力是否有所提升和刷新?Devin 和智能编码助手是同一条赛道上的不同节点?多家企业宣布 All in AI,对市场意味着什么?InfoQ 研究中心即将发布的《2024 年第 1 季度大模型监测报告》,即将给出答案。



2024-04-15 15:122969

评论

发布
暂无评论
发现更多内容

6 月亚马逊云科技培训与认证课程,精彩不容错过!

亚马逊云科技 (Amazon Web Services)

架构师 培训 认证

SeaTunnel 加入开源之夏!一起来拿奖金

Apache SeaTunnel

Apache 大数据 开源 workflow Seatunnel

工业质检如何以“智”取胜?15分钟上手工业零部件检测全流程方案

百度开发者中心

FinClip+系列 | VUE前端开发框架核心原理

Speedoooo

Vue 前端框架 移动开发 移动端开发 小程序容器

抢先预约 | 阿里云无影云应用线上发布会预约开启

阿里云弹性计算

无影云电脑 云应用

毕设不会做,怎么办?

图灵教育

机器学习 深度学习 毕设

攻防演练中常见的8种攻击方式及应对指南

青藤云安全

接口测试工具简介!

Liam

测试 自动化测试 测试工具 测试自动化 测试管理工具

清晰明了!人人都能懂的Python自动发送邮件实战教程

Python全栈库

Python 编程 程序员 面试 全栈开发

大咖说*图书分享-Node布道师狼叔|三卷书详解Node.js

大咖说

前端 后端 代码

DTMO直播预告|Taier1.1新功能详解&控制台介绍

袋鼠云数栈

大数据

netty系列之:HashedWheelTimer一种定时器的高效实现

程序那些事

Java Netty 程序那些事 5月月更

明明已部署EDR,服务器为什么还是被入侵了?

青藤云安全

安全攻防 网络安全 主机安全

直播预告丨Hello HarmonyOS进阶课程第三课——游戏开发实践

HarmonyOS开发者

游戏开发 HarmonyOS

国内首个开源物联网边缘工业协议网关软件,Neuron v2.0产品解读

EMQ映云科技

开源 物联网 IoT 5月月更 neuron

Hoo研究院 | 什么是流动性池?(下)流动性池的运作

区块链前沿News

defi 流动性 Hoo

Dubbo3 落地实践及 Mesh 解决方案

阿里巴巴中间件

阿里云 开源 云原生 dubbo 中间件

邀您填写调研问卷 | 2022中国 AIOps 现状调查全面启动!

博睿数据

AIOPS 博睿数据

《安全大讲堂》 第十四期|不破不立:软件供应链的威胁与方案

腾讯安全云鼎实验室

供应链 安全大讲堂

vuejs中的普通方法/计算属性computed与监听属性watch四者的比较

itclanCoder

JavaScript Vue 前端开发

三、云原生安全关键要素

穿过生命散发芬芳

云原生安全 5月月更

一文彻悟容器网络通信

阿里巴巴中间件

阿里云 容器 云原生 中间件

时间轮算法

领创集团Advance Intelligence Group

算法 时间轮算法

【LeetCode】后继者Java题解

Albert

LeetCode 5月月更

Spark离线开发框架设计与实现

百度开发者中心

小白福利!教你用低代码实现一个简单的HarmonyOS页面跳转功能

HarmonyOS开发者

HarmonyOS 低代码开发

vuejs中的默认插槽-具名插槽-作用域插槽三者的比较

itclanCoder

JavaScript Vue 前端开发

JAVA OOM异常可观测最佳实践

观测云

可观测性 可观测

漏洞扫描器并非100%靠谱,那么容器镜像安全又当如何保证?

青藤云安全

网络安全 安全管理 漏洞修复

vuejs中的mixin混入-局部混入/全局混入

itclanCoder

Vue 前端开发

Cocos 常用功能介绍

空城机

Cocos 5月月更

巨头们火力全开:AI应用边界再扩张 | 大模型一周大事_AI&大模型_InfoQ研究中心_InfoQ精选文章