写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 模态逻辑 频道下的 50 篇内容

用多模态交互颠覆传统早教,重新定义孩子的“智能早教新时代”
最近在博客圈里进行的一次讨论提出了这样的问题,我们是否应该使用业务规则来动态地引导业务过程的执行。

优酷视频搜索团队设计并研发了多级多模态搜索引擎(MMS),可以提供分布式大规模多层级多模态索引能力,低延时跨模态级联检索能力,多层级检索、融合、排序能力。

随着 AI 应用进一步在国内落地,百度在大模型牌桌也占据着独特的生态位置
随着深度学习和大语言模型的发展,AI 推理正从“感知智能”迈向“认知智能”。推理能力,作为人类智能的核心特征之一,是通用人工智能(AGI)实现的关键。本篇文章将深入探讨当前AI推理的理论框架、技术突破,并以代码案例展示推理模型的实现雏形。

微博用户可以以文字、图片、视频等多媒体形式,且有自己的特点,微博博文内容形式多样,包含文字、图像和视频等媒体,且文本较短,大部分不超过140字,文本表述简洁,简称、不规范用语以及网络流行用语被广泛使用。

低价趋势 2026 年将延续,核心原因是市场远未饱和。
对于学生党而言,软件必须满足两个条件:一是绝对免费(无隐形订阅),二是能解释代码逻辑辅助学习。我们评估了各款软件的“代码解释能力”和“可视化生成能力”,旨在找到不仅能帮你写作业,更能教你写代码的免费良心工具。

支持 30+ 多种语言~

“这一次20倍的加速,基本上把这个问题解决了。

AI 大模型的加速飞跃,正在重塑整个数据产业的底层逻辑。当文本、图像、音频、视频等非结构化数据以指数级增长,多模态数据库作为连接数据与智能的关键桥梁,正成为企业数智化转型的核心基础设施。

本次演讲将深入探讨多模态模型的快速进化推动AI应用场景扩充、AI课程和AI陪练领域的一些应用等相关内容

本文中,来自优酷算法中心负责人王晓博将为我们解析,优酷是如何利用多模态技术,最大限度地挖掘视频信息,创造更大的价值。剪片子又快又好、还能制作鬼畜视频的AI视频剪辑师到底是如何做到的呢?让我们来一探究竟。

从多模态思维链技术出发,解析 Keye-VL 多模态大模型的核心技术,并分享 Keye-VL 在快手短视频社区的落地应用。

多模态产品的演进将是技术价值从封闭走向开放、商业逻辑从效率提升转向生态共建的过程。

如何通过多模态生成提升游戏行业的美术、设计和开发效率。

百度一个月左右连发四款大模型,这是卷王登场啊!

AI眼镜将向泛智能终端演进,成为PC、手机之后另一个可能突破十亿用户的消费产品。

近年来,GPT 系列模型的演进,客观上验证了 Scaling Law 的有效性。模型参数量决定模型能力的上限。