AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:439544

评论

发布
暂无评论
发现更多内容

线段树模板与练习

timerring

线段树

CMS系统是什么?

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

架构实战营 - 模块五作业(微博评论)

🐢先生

架构实战营

手把手带你上手ChatGPT

老周聊架构

3月月更 ChatGPT

交易履约之产品中心实践

京东科技开发者

交易 京东云 京东技术 京东科技 产品中心

聊一聊系统重构

系统设计的端到端原则

俞凡

架构

常用对话框基本使用

芯动大师

dialog timepicker progress

如何实现云数据治理中的数据安全?

京东科技开发者

数据库 云计算 京东云 京东技术

作为移动开发你不能不了解的编译流程

京东科技开发者

编译器 移动开发 京东云 京东技术

gt-checksum 1.2.1发布,新增表结构校验及修复等超实用特性

GreatSQL

MySQL greatsql社区 gt-check

稳定高效数据库管理:Valentina Studio Pro激活版

真大的脸盆

数据库 Mac 数据库管理工具 Mac 软件 管理数据库

软件测试/测试开发丨MockServer 服务框架设计

测试人

软件测试 自动化测试 测试开发

运维训练营第19周作业

好吃不贵

什么是容器编排及编排的优点

黎博

容器编排 Kubernetes Serverless

如何实现云数据治理中的数据安全?

京东科技开发者

云计算 大数据 数据治理 企业号 3 月 PK 榜 计算资源

简历上的项目,需要这样描述才有亮点!

小傅哥

Java 面试 项目 简历 校招

实现常驻任务除了避免昙花线程,还需要避免重返线程池

newbe36524

C#

Three.js 进阶之旅:物理效果-3D乒乓球小游戏 🏓

dragonir

CSS JavaScript 前端 React three.js

Tars-Java网络编程源码分析

vivo互联网技术

网络编程 nio TARS

中台的悖论

agnostic

中台

在京东如何做好前端系统的可观测性

京东科技开发者

前端 京东云 京东技术

PyTorch深度学习实战 | 神经网络的优化难题

TiAmo

PyTorch 随机梯度下降 动态调整

利用 ChangeStream 实现 Amazon DocumentDB 表级别容灾复制

亚马逊云科技 (Amazon Web Services)

基于 Kafka 和 Elasticsearch 构建实时站内搜索功能的实践

京东科技开发者

MySQL ES 京东云 京东物流 京东技术

美团:某动态线程池框架是官方开源的么?

马丁玩编程

线程池 美团线程池

追踪 Kubernetes 中的数据包

张晓辉

Kubernetes 网络

AR市场为何频频“呼唤”苹果?

Alter

AR

人工智能与软件工程

紫晖

人工智能 机器学习 软件工程 工程

一文吃透扫码登录原理

程序员大彬

Java java面试 扫码

AAA级认证!索信达综合信用水平获高度认可

索信达控股

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章