写点什么
创作场景
- 记录自己日常工作的实践、心得
- 发表对生活和职场的感悟
- 针对感兴趣的事件发表随笔或者杂谈
- 从 0 到 1 详细介绍你掌握的一门语言、一个技术,或者一个兴趣、爱好
- 或者,就直接把你的个人博客、公众号直接搬到这里
登录/注册
收录了 模态命题 频道下的 50 篇内容

后移动互联网时代资讯爆炸,用户每天都在被迫接收着海量信息。如何帮助用户找到最合口味的好内容,实现千人千面精准推荐,通过精细化运营抢夺用户时长,是互联网公司当下最重要的命题之一。

本次分享将以语言模型为切入点,系统介绍多模态场景下生成与理解技术的演进脉络

聚焦多模态模型的最新技术进展与实践,分享应用场景与创新价值,探讨其在场景落地中的机遇与挑战。

本次分享结合实际建设过程中遇到的数据同步、检索性能、数据演进和系统复杂度问题

本次分享介绍的系统,以手机屏幕时序视频流为输入,构建了一个具备持续感知、个性化记忆与主动执行能力的多模态伴随 Agent。

用户每天产生大量碎片化内容——截图、语音、视频、文档、多图……如何让 AI 理解这些异构多模态数据,并自动整理成有价值的"记忆"?

深入探讨 Agent 从原型到量产的工程挑战、数据与记忆的基础设施底座、安全可信的落地保障,以及大模型推理优化、智算架构升级等关键命题。

端侧模型睁开观察、理解真实流动世界的“眼睛”

腾讯混元在面向AI社交场景所做的技术选型、模型升级和落地实践经验。

AI 落地的终极考验,不是算法的狂欢,而是价值的沉淀。

本次演讲将聚焦 ABot 体系中世界模型这一核心基础设施层

11月8日,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。

科大讯飞高级副总裁胡国平在1024开发者节上介绍,如何在AI的技术层面进行源头技术突破和多技术融合,以此来推动实现系统性创新。

如何让 AI 深入业务场景、托管关键系统、推动组织与流程重塑,正成为技术与管理者共同面临的新课题。

本演讲将聚焦 AI 的深层“下沉”,探讨如何通过 OpenClaw 架构的本地化演进

本报告将对世界模型的未来发展趋势进行展望,并探讨其发展过程中面临的开放性挑战与潜在的社会影响

端侧“天选”模型出现了?

过去的 2025 年,对于检索增强生成(RAG)技术而言,是经历深刻反思、激烈辩论与实质性演进的一年。

人和设备的交互方式需要被重新定义。

“速度优势”正推动 vLLM 加速成为大模型推理领域的事实标准。