2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

微博多模态 AI 应用实践分享|QCon 北京

  • 2025-03-17
    北京
  • 本文字数:1364 字

    阅读完需:约 4 分钟

微博多模态 AI 应用实践分享|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京盛大召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


微博增值业务研发中心总经理吴侃已确认出席本次大会,并在「多模态大模型及应用」专题论坛分享《以微驭博:从多模态感知到数智化转型》。在当前数智化转型的浪潮中,企业普遍面临着成本与收益难以平衡的困境,传统模式也难以兼顾规模化和个性化需求。而多模态 AI 技术凭借对多源数据的综合处理能力,为提升业务效率带来了新的可能,大模型能力的提升更是降低了 AI 应用门槛。吴侃此次演讲将结合微博及其他行业的实际应用案例,深入探讨如何借助多模态 AI 技术为传统业务注入创新活力,提升企业数据的综合利用价值,同时还会分析如何平衡大模型技术优势与实际应用中的成本和风险,确保企业获得可持续的投资回报。


吴侃在行业内经验丰富,曾任职于硅谷,随后深度参与了微博从创立至今长达十六年的发展历程。他一直专注于技术落地、商业模式以及创新应用的实践,还参与了国家十四五项目和国家自然科学基金项目,在相关领域积累了深厚的见解。本次会议中,他的详细演讲内容如下:


演讲提纲

1. 多模态大模型技术的发展脉络与趋势

  • 从单模态的感知到跨模态的综合理解,反映了 AI 技术在认知层面的深刻变革

  • AI 正逐步实现从简单信号识别、规则到深层语义理解、意图感知和决策的本质飞跃

  • 多模态的边云结合的计算协同协作优化 

2. 多模态 AI 赋能企业数智化转型的路径与实践

  • 多模态内容理解在微博的部分应用:整合文本、图像、视频和音频等多模态数据,实现舆情监测与内容智能管理

  • 分类整理微博多模态素材,构建个人知识库以提升信息管理使用效率

  • 图像与视频分析理解图像内容与事件的“坑” 

3. 融合多模态生成式 UI 与 SaaS+AI 创新交付模式

  • 从传统的图形用户界面(GUI)与对话式界面(CUI)逐渐转向融合交互界面的发展趋势

  • 通过融合生成式 UI 快速实现与现有业务系统之间的整合,显著提升用户操作体验与业务效率

  • 建立在多个智能体实时协作与通信的基础之上的数据共享、任务分配和协作机制

您认为,这样的技术在实践过程中有哪些痛点?

  • 数智化转型时面临技术与实际业务需求脱节的问题,对于实际业务的 knowhow 不够深入,导致方案无法落地

  • 商业角度考虑大模型落地往往是投入大,收益甚微,“大炮打蚊子”

  • 商业项目和企业落地要求确定性,而大模型“幻觉”造成方案达不到预期指标


演讲亮点

  • 全新视角看待多模态大模型技术落地如何寻找场景,平衡精度与成本

  • Agent 协同融合,数据共享机制拓展应用生态


听众收益

  • 理解企业如何以多模态大模型为抓手,在规模化落地过程中有效权衡模型准确性与幻觉风险之间的实践经验与心得

  • 了解新时代交互界面的最新实践,帮助企业高效、低门槛地实现业务系统的智能化升级与融合

  • 获得企业数字化转型过程中结合自身业务特点科学规划多模态多 Agent AI 落地路径的方法论和实操经验,有效避免数据治理、成本控制等方面的常见“坑”


此外,本次大会还精心策划了AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有 100 多位资深专家现场分享前沿技术洞察和一线实践经验。现在报名可享 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-17 17:525042

评论

发布
暂无评论

GitHub上120K Stars国内第一的Java多线程PDF到底有什么魅力?

Java 编程 架构 面试 程序人生

JavaScript 的 undefined和null 的区别与判断

wudaxue

腾讯高工终于把操作系统、TCP/IP、线程与进程、CPU全部讲明白了

Java 架构 面试 操作系统 计算机

网络攻防学习笔记 Day149

穿过生命散发芬芳

9月日更 网络管理

音视频同步!RTCP 协议解析及代码实现

声网

音视频 协议 Wireshark 流媒体

阿里耗时三月整理的亿级流量百万并发手册,在上传在GitHub上意外获星90K+

Java 架构 面试 程序人生 编程语言

阿里大佬熬了三月,总结出了这套分布式架构手册,在Github上疯传!

Java 架构 面试 程序人生 编程语言

2022前端react高频面试题汇总

buchila11

React

vivo全球商城-营销价格监控方案的探索

vivo互联网技术

后端 服务器 监控系统 营销数字化 亿级架构设计

靠着狂刷这份面试题跟答案!我从 15K 变成了 30K!

Java 编程 程序员

我仅用了3个月就成功破茧成蝶!从简历被拒到收割8个大厂offer的辛酸历程!

编程 Java、 计算机

字节内部不传之秘:1298页算法刷题笔记(附源码可直接运行)

Java 程序员 面试

@InjectMocks 使用

且听且吟

面对低碳转型 央行的两条思路和五大措施

CECBC

推荐一款 Python 微服务框架 - Nameko

星安果

Python 微服务 Nameko

内卷把同事逼成了“扫地僧”,把 Github 上所有面试题都整理了一遍~足足 24W 字!

Java 程序员 面试

Alibaba内部最新Java架构核心宝典 (全彩版小册开源)

Java 架构 面试 程序人生 编程语言

内部群炸了!字节同事写了一篇Leetc刷题心得,高管看见之后,直接给他涨了20K

算法 算法题

浅谈加密基础设施

I

基础设施 信息安全 加密 密码学 加密基础设施

课程升级 | 极速构建知识体系,即学即用 Serverless

阿里巴巴云原生

阿里云 Serverless 云原生 活动 课程

如何加速云原生数据应用?这个开源项目备受关注

阿里巴巴云原生

阿里云 开源 云原生 Fluid

剖析反序列化原理基本操作

网络安全学海

黑客 网络安全 信息安全 渗透测试 漏洞分析

Prometheus 2.29.0 新特性

耳东@Erdong

release Prometheus 9月日更

突发猛进!数字人民币落地推广会召开

CECBC

Log4j2同步打印日志导致线程阻塞问题剖析

快看工程技术中心

Java 线程 log4j java反射 异常处理

使用 Chrome 调试 Vue3 的 TypeScript 源码

编程三昧

源码 Vue Vue 3 9月日更

java 虚拟机 GC :G1学习笔记

风翱

GC 9月日更

多媒体技术之图像频率的概念

轻口味

android 音视频 9月日更

高扩展的系统通常会有什么特性

卢卡多多

系统、 9月日更

以技术驱动云上创新增长,阿里云计算峰会上海完美收官

互联网 存储 云服务 科技 计算

阿里P8连肝三月,终于整理出的完美Java面试宝典,上传到Git上目前star数达到30K+

Java 架构 面试 程序人生 编程语言

微博多模态 AI 应用实践分享|QCon 北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章