写点什么

多模态隐喻

收录了 多模态隐喻 频道下的 24 篇内容

5G时代下:多模态理解做不到位注定要掉队
5G 时代下:多模态理解做不到位注定要掉队

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

海外热议!百度双模型免费上线,实测可帮没看“3.15”的打工人避雷
海外热议!百度双模型免费上线,实测可帮没看“3.15”的打工人避雷

随着 AI 应用进一步在国内落地,百度在大模型牌桌也占据着独特的生态位置

文心X1/4.5 Turbo深度测评:真干活 AI,又强又全!
文心 X1/4.5 Turbo 深度测评:真干活 AI,又强又全!

百度一个月左右连发四款大模型,这是卷王登场啊!

多模态方法无法实现AGI
多模态方法无法实现 AGI

我们应该追求将具身性和与环境的互动放在第一位的智能方法,并将以模态为中心的处理过程视为涌现现象。

文心 4.5Turbo 将发布!体验百度文心 4.5 与 X1 后,大模型评测:预测新模型能力更强、价格迎新低做开发者延伸的"手和脑"

近年来,大模型技术的快速发展让AI应用变得更加多样化和实用化。作为长期关注大模型技术落地的开发者,我在最近测试了百度最新发布的文心4.5和X1大模型。从实际应用中确实感受到了国产模型近一步的进化,尤其是在多模态理解和复杂任务处理上,这两款模型的表

AI
大模型
未来智能发布 AI 耳机新品 iFLYBUDS Pro 3 与Air 2,解码 AI 硬件的三重价值跃迁
未来智能发布 AI 耳机新品 iFLYBUDS Pro 3 与 Air 2,解码 AI 硬件的三重价值跃迁

5月13日,在中国爱乐乐团音乐家们联袂呈现的《匈牙利舞曲》中,未来智能最新推出的两款AI会议耳机iFLYBUDS Pro 3与iFLYBUDS Air 2正式亮相。

传统数据仓库正在被 Agentic AI 吞噬?Agentic Data Stack 初探
传统数据仓库正在被 Agentic AI 吞噬?Agentic Data Stack 初探

Snowflake 换 CEO,不只是人事变动,而是数据架构的时代信号:数仓黄金时代正在谢幕,Agentic Data Stack 正在登场。

多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型
多模态语义检索 | 基于 MetaSpore 快速部署 HuggingFace 预训练模型

首先,附上 Github 链接LakeSoul:https://github.com/meta-soul/MetaSpore,可搜索公众号元灵数智,在底部菜单了解我们 - 用户交流获取官方技术交流群二维码,进群与业内大佬进行技术交流。

机器学习
深度学习
开源
AI
多模态
敏感问题不回避!大模型的“应答尽答智答”之法
敏感问题不回避!大模型的“应答尽答智答”之法

面对这些敏感问题时,大模型是沉默回避损害交互体验?是错误引导触发法律风险?还是陷入AI幻觉编造危险教程?这不是假设,而是每个大模型厂商及部署大模型的企业必经的“风险拷问”。

2023 计算机领域顶会 (A 类) 以及 ACL 2023 自然语言处理(NLP)研究子方向领域汇总

2023年的计算语言学协会年会(ACL 2023)共包含26个领域,代表着当前前计算语言学和自然语言处理研究的不同方面。每个领域都有一组相关联的关键字来描述其潜在的子领域, 这些子领域并非排他性的,它们只描述了最受关注的子领域,并希望能够对该领域包含的相

人工智能
自然语言处理
2月日更
计算语言学协
「天工大模型 3.0」将于 4 月 17 日发布 同步开源 4000 亿参数 MoE 超级模型

2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。

Learn to Reason _ The way of Baichuan-M1-ClinicReasoning
Learn to Reason _ The way of Baichuan-M1-ClinicReasoning

本文从介绍合情推理开始,首先回顾了强化学习视角下的大语言模型训练的各类损失函数,然后以 Deepseek R1 为例,梳理了大语言模型推理技术的发展,接着分享了百川智能研究小组在训练大语言模型进行临床推理方面的实践,最后就「如何继续提升模型能力的可能方向」以及「大语言模型与人类在智能上的差异表现」做了思考和展望。

快手商业化风控内容审核场景下的大模型早期探索与应用
快手商业化风控内容审核场景下的大模型早期探索与应用

导读:文章焦快手商业化风控内容审核场景,系统剖析大模型如何破解传统风控痛点,构建覆盖全链路的风险治理新范式。

大模型
从思考,到行动:由 Manus 爆火谈 AI Agent

觉醒的AI,开始像人类一样行动

AI
AI 阅读 APP 的主要功能

AI阅读APP通过整合人工智能技术,旨在提升用户的阅读效率、理解深度和个性化体验。它不仅仅是一个电子书阅读器,更是一个智能化的阅读助手。以下是AI阅读APP的主要功能。

软件外包公司
APP外包公司
AI阅读
手撕大模型 | MQA 和 GQA 原理解析
手撕大模型 | MQA 和 GQA 原理解析

随着大模型功能的不断强化,其容量也在增加,当前的 KVCache 技术已经不能满足发展需要了,所以,各种针对于 KVCache 优化的技术应时而生。

自动驾驶;
算法工具链
地平线征程6
百度电商MultiAgent视频生成系统
百度电商 MultiAgent 视频生成系统

随着人工智能技术的迅猛发展,如何在视频内容创作领域通过大模型自动化合成视频,来满足用户日益增长的内容需求?

视频创作
AIGC
全球 AI 音乐会,第一次听见中国声音

全球AI音乐盛宴中,中国首个音乐AIGC SOTA 的独特旋律

AI
云栖大会上,感受 AI 汽车的"乐与路"

如果说大模型的上半场是以互联网大数据预训练为代表的数字AI;而下半场,是以机器人、世界模型等为代表的物理AI。汽车可能正好处于两者之间的分水岭上。

多模态隐喻专题_资料-InfoQ中文网