写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:439916

评论

发布
暂无评论
发现更多内容

「Go工具箱」gorilla/sessions包的使用及原理分析

Go学堂

golang 深度思考 个人成长 Web 11月月更

React源码解读之React Fiber

flyzz177

React

2023年 DevOps 七大趋势

SEAL安全

极客时间运维进阶训练营第五周作业

独钓寒江

C++学习---类型萃取---is_pointer && is_lvalue_reference/is_rvalue_reference

桑榆

C++ STL 11月月更

【React技术】JSX在企业级项目的运用and一个元素渲染demo

恒山其若陋兮

前端 11月月更

我们为什么喜欢看疯狂科学家开飞艇?

脑极体

CDH5部署三部曲之三:问题总结

程序员欣宸

大数据 hadoop CDH 11月月更

JXcore 打包在企业级项目里的合理运用和模块系统以及网络的配置详解【node.js】

恒山其若陋兮

前端 11月月更

关于部署策略的遐思

在天涯的海角

Python基础库-json库

度假的小鱼

11月月更 Python操作json json语法规则

Python操作XML文件

度假的小鱼

11月月更 Python操作xml xml与html区别

EasyRcovery2023绿色免费版U盘数据恢复软件

茶色酒

EasyRcovery2023

React源码分析2-深入理解fiber

goClient1992

React

一文熟悉 Go 函数

陈明勇

Go golang 闭包 函数 11月月更

盘点入职时,那些常见但不合规的操作

石云升

职场 入职 11月月更

DDD与EDA-核心逻辑提炼方法论

胖子笑西风

Java 架构 DDD 事件驱动 EDA

三分钟了解client-go

穿过生命散发芬芳

Client-go 11月月更

Python 操作BeautifulSoup4(爬取网页信息)

度假的小鱼

正则 11月月更 Python BeautifulSoup4

Gradle入门了解

派大星

Gradle

CrossOver2023免费版虚拟机软件安装包下载

茶色酒

CrossOver2023

规则引擎Drools在贷后催收业务中的应用

vivo互联网技术

drools 规则引擎

【web 开发基础】PHP的匿名函数和闭包 (40)

迷彩

闭包 closure web开发基础 匿名函数 11月月更

React源码分析1-jsx转换及React.createElement

goClient1992

React

React源码解读之更新的创建

flyzz177

React

React源码解读之任务调度

flyzz177

React

信息论与编码:随参信道特性

timerring

11月月更 信息论 移动通信

python任务调度利器-APScheduler

AIWeker

Python 任务调度 11月月更

性能测试知识科普(七):监控能给你带来什么

老张

性能测试 监控指标

React源码分析3-render阶段(穿插scheduler和reconciler)

goClient1992

React

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章