写点什么
大模型多云部署怎么玩?阿里创作平台 MuseAI 集团内外落地指南
大模型多云部署怎么玩?阿里创作平台 MuseAI 集团内外落地指南

本文以阿里真实使用场景出发,分享 MuseAI 多云部署架构实践。

科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗
科大讯飞发布首个基于全国产算力的深度推理大模型 X1,率先落地教育、医疗

科大讯飞与华为合作攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等难题。

微服务常见限流方案及TSF限流原理
微服务常见限流方案及 TSF 限流原理

在微服务高并发的一些场景下,微服务之间的调用量不断增加,大流量因素很可能会引起服务雪崩,微服务的稳定性对业务系统的影响也比较大。一般微服务容错组件都提供了限流的方式来保护我们的系统,本文主要介绍微服务限流的几种主流方案与适应的场景。

RTE 与 AI 共舞:Voice Agent 点燃生态新引擎
RTE 与 AI 共舞:Voice Agent 点燃生态新引擎

本篇文章围绕 RTE 与 AI 生态融合下的用户新体验,Voice Agent 的新生态展开描述,并在结尾提出五大问题以供读者思考。

音视频场景破局,视频云技术开启新浪潮
音视频场景破局,视频云技术开启新浪潮

AI 改变的不仅是音视频的创作方式,而在重新定义人们的交互与消费模式。近年来,随着大模型的引入,音视频消费场景正迎来新的机遇。

详解veImageX助力卓特视觉智能、高效生成设计素材
详解 veImageX 助力卓特视觉智能、高效生成设计素材

设计素材行业为设计师和创意工作者提供丰富的视觉和创意资源。数字媒体和互联网的迅猛发展,促使这一行业市场规模不断扩大,用户对设计素材的个性化和定制化需求与日俱增。

开源首秀就放大招!MiniMax重磅更新两款大模型,业内首次大规模实现线性注意力机制
开源首秀就放大招!MiniMax 重磅更新两款大模型,业内首次大规模实现线性注意力机制

最近一段时间,中国大模型频频“刷屏”。

谷歌推出全新的 AI 扩展现实平台 Android XR
谷歌推出全新的 AI 扩展现实平台 Android XR

谷歌推出全新 AI 扩展现实平台 Android XR,它基于 Android 系统,整合 Gemini,利用诸多关键组件。应用程序可实现虚拟与现实共存,谷歌还发布了 SDK 方便开发,有 Jetpack XR 等关键部分,且有自己的 Play 商店。目前仅预览版,三星 2025 年将发首款设备,感兴趣可申请访问。

ByConity BSP 解锁数据仓库新未来
ByConity BSP 解锁数据仓库新未来

在现代数据分析场景中,实时数仓与离线数仓各有侧重:实时数仓注重低延迟的数据入库与即时分析能力,而离线数仓则强调复杂任务的稳定执行及高效的内存管理。为满足用户多样化的数据需求,ByConity 作为一款开源云原生数据仓库,提供了全新的 BSP 模式,大幅提

拜登AI芯片新规把自家公司也坑进去了!英伟达怒斥“乱搞”,OpenAI以超越中国为由索要机密数据
拜登 AI 芯片新规把自家公司也坑进去了!英伟达怒斥“乱搞”,OpenAI 以超越中国为由索要机密数据

“这份文件纯属秘密起草,并未经过适当的立法审查。”

RTE 和 AI 融合生态洞察报告 2024RTE 和 AI 融合生态洞察报告 2024
RTE 和 AI 融合生态洞察报告 2024

本报告专注于探索如何利用实时互动技术与 AI 相结合来提升用户体验,以及社区是如何帮助 Voice Agent 生态建设和发展的。

为异构推理做好准备:次世代 RTP-LLM 推理引擎设计分享
为异构推理做好准备:次世代 RTP-LLM 推理引擎设计分享

由于初版 rtp-LLM 是基于 nvidia 的开源库开发,在设计上和 cuda 硬件强耦合,无法摆脱对 nvidia gpu 的依赖,因而不能支持 cuda 以外的硬件设备,这样的框架显然难以支持未来更加丰富的硬件生态。而在硬件问题之外,随着业务复杂度的增长,越来越多的缺陷也被暴露出来。因此,我们本着以硬件接口为第一公民的思想,重构了 rtp-LLM 的模型推理逻辑。本文将从以下几个方面,结合源代码中的模块介绍 rtp-LLM 在计算部分的的设计思想。

2024年中国大模型行业应用优秀案例白皮书2024年中国大模型行业应用优秀案例白皮书
2024 年中国大模型行业应用优秀案例白皮书

为帮助厂商及用户了解大模型在各行业的应用情况、厂商表现以及优秀的行业实践标杆,沙利文对中国各行业大模型应用案例进行了深度分析。

2024技术人年度总结丨智能化重构未来交互
2024 技术人年度总结丨智能化重构未来交互

本文基于 InfoQ 与 Dell 联合推出的「技术人年度总结」进行整理、提炼,旨在探讨智能化的应用现状、技术演进以及未来可能。

比帮你写代码更爽的是:让Agent来打工|对话 AI 原生《云智实验室》
比帮你写代码更爽的是:让 Agent 来打工|对话 AI 原生《云智实验室》

大模型演进至今,大家一直在等待一个杀手级应用,Agent 的出现正在让这一构想成为可能。

比帮你写代码更爽的是:让Agent来打工
比帮你写代码更爽的是:让 Agent 来打工

大模型演进至今,大家一直在等待一个杀手级应用,Agent 的出现正在让这一构想成为可能。Agent 能将大模型的强大能力与实际业务场景结合,实现更加智能化和个性化的应用。百度智能云千帆 AppBuilder 作为基于大模型的企业级 AI 原生应用开发工作台,全面覆盖从创意到部署的高效 AI 应用开发需求,精准解决大模型技术向实际应用转化的“最后一公里”难题。

焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能
焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能

新年伊始,焱融科技再次在存储性能领域取得突破。的网络带宽聚合。倍。30%。时代的全面到来。迎来了飞速发展的黄金时期,不断刷新着能力边界。

这群00后“杀疯”了!没靠资本、大学刚毕业狂赚7千万,TikTok助攻AI爆款应用出世
这群 00 后“杀疯”了!没靠资本、大学刚毕业狂赚 7 千万,TikTok 助攻 AI 爆款应用出世

有一群最小不过 17 岁的 00 后却另辟蹊径,自力更生创立出一批价值数百万美元的 AI 移动应用程序,其中不乏月用户在 10 万以上、年收入在 100 万至 500 万美元之间的应用。

Meta 提高了 Threads 的 iOS 性能
Meta 提高了 Threads 的 iOS 性能

Meta 为提升 Threads 的 iOS 性能,工程师通过定义 FIRE、TTNC、cPSR 等指标,测量启动速度、发布难易度等情况。如减小二进制文件大小、创建 SLATE 日志系统、引入 “草稿” 功能等,并采用 Swift 完全并发提升稳定性,有效减少用户缺陷报告,增强应用性能。

极客说|Azure AI Agent Service 结合 AutoGen/Semantic Kernel 构建多智能体解决⽅案
极客说|Azure AI Agent Service 结合 AutoGen/Semantic Kernel 构建多智能体解决⽅案

Agent。等),更强的企业安全机制以及数据存储⽅式。的智能体;Agents。呢?进⾏编排。注意 Preview 阶段,所以我们需要在特定区域和模型中使⽤。

Amazon Aurora DSQL:具有多活高可用性的分布式 SQL 数据库
Amazon Aurora DSQL:具有多活高可用性的分布式 SQL 数据库

在亚马逊云科技 re:Invent 大会上,Aurora DSQL 公开预览版发布。它是与 PostgreSQL 兼容的无服务器分布式 SQL 数据库,有高扩展性和可用性。其多活模式、乐观并发控制等特性突出,但也存在如无临时表等局限,目前仅在美国三个地区提供公共预览。

北航&ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG
北航 &ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG

将 RAG 过程划分为查询重写、高级检索、后处理、问答生成四个部分,以提升系统的灵活性与可扩展性~

仅用 8 张显卡和一万块钱,清华团队用7B模型打败GPT-4o数学推理
仅用 8 张显卡和一万块钱,清华团队用 7B 模型打败 GPT-4o 数学推理

基于探索的强化学习有望带来新的 Scaling Law。

机器人技术永远不会出现“ChatGPT时刻”
机器人技术永远不会出现“ChatGPT 时刻”

预测:到 2025 年底,人型机器人将实现商用。

英伟达CUDA的护城河到底有多深?
英伟达 CUDA 的护城河到底有多深?

答案实际上取决于你想要实现的目标。

瞄准146亿元“大蛋糕”,金山云全面升级智算服务体系
瞄准 146 亿元“大蛋糕”,金山云全面升级智算服务体系

随着大模型落地应用,人工智能发展进入 2.0 时代。在此阶段,智算云服务加速演进,成为新一代人工智能发展的核心驱动力,展现出无限潜能。