2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:4310123

评论

发布
暂无评论
发现更多内容

爱奇艺本地实时Cache方案

爱奇艺技术产品团队

分布式 高并发 cache

filecoin今日价格行情?fil币能涨到1万一枚吗?

区块链 分布式存储 fil币价格预测? filecoin挖矿 filecoin价格行情

Python代码阅读(第23篇):将变量名称转换为短横线连接式命名风格

Felix

Python 编程 Code Programing 阅读代码

Java + opencv 实现性别识别

张音乐

Java OpenCV 9月日更 性别识别

谈 C++17 里的 Singleton 模式

hedzr

c++ 算法 设计模式 Singleton

LeetCode刷题704-简单-二分查找

ベ布小禅

9月日更

高可用 | Xenon 实现 MySQL 高可用架构 常用操作篇

RadonDB

MySQL 数据库 RadonDB

人能靠自驱来学习吗?

石云升

学习 9月日更

Android ABI

Changing Lin

9月日更

【得物技术】直播服务监控告警归因实践

得物技术

稳定性 服务 直播 告警 问题排查

OpenSSL国密爆出8.1分高危漏洞CVE-2021-3711

腾讯安全云鼎实验室

漏洞分析 openssl

一文读懂 OceanBase 数据库的启动恢复代码解析

OceanBase 数据库

数据库 分布式事务 oceanbase OceanBase 开源

网络攻防学习笔记 Day125

穿过生命散发芬芳

9月日更 互联网安全

BaikalDB在大规模数据场景的挑战和实践

百度开发者中心

最佳实践 方法论 存储系统

fil矿机组装教程是什么?fil矿机算力单位有哪些?fil矿机冗余是什么?

fil矿机组装教程是什么 fil矿机算力单位有哪些 fil矿机冗余是什么

“吾道一以贯之”:华为Petal One的新格局

脑极体

开源应用中心|这款漂亮的国产开源论坛系统,放着不用太可惜!

开源软件

什么是低代码?低代码开发对企业有哪些特殊作用和优势?

优秀

低代码开发

09. 深度学习携手大数据引领第三AI热潮--何为深度学习?

Databri_AI

人工智能

一周信创舆情观察(8.23~8.29)

统小信uos

Erda 系列 Meetup「成都站」携手SOFAStack 和你聊聊云原生基础设施建设那点事儿

尔达Erda

开发者 云原生 活动 技术人

直播回顾 | 做一个有格局的工程师

鉴释

创业 工程师 CEO

PhxSQL设计与实现

OpenIM

打一把游戏看一场病:当VR成为“数字新药”

脑极体

投资filecoin的最佳选择是?Filecoin挖矿的是如何月入上万的?

区块链 分布式存储 IPFS filecoin挖矿 投资filecoin

【网络安全】漏洞复现有多少种方式?

网络安全学海

php 网络安全 信息安全 WEB安全 安全漏洞

如何使用 Redis 实现后台房间的数据管理?

ZEGO即构

redis 架构 音视频

中移“校企行”专项行动即将开赛,你准备好了吗?

创业邦

学习笔记20210903(python测试类,贝叶斯定理)

姬翔

9月日更

🚄【Redis干货领域】从底层彻底吃透RDB原理(基础篇)

码界西柚

redis RDB 快照 rdb分析 9月日更

未来10年,C++5个非常有前景的就业方向

hanaper

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章