2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:4310105

评论

发布
暂无评论
发现更多内容

告别 996!飞算 JavaAI 如何用 AI 技术让开发者准时下班?

飞算JavaAI开发助手

面试官:说说你项目中JWT的执行流程?

不在线第一只蜗牛

Java 面试 服务器

Data+LLM:AI 在智能制造数字化转型中的应用

Altair RapidMiner

机器学习 AI 数字化转型 知识图谱 智能制造

招商管理系统(源码+文档+部署+讲解)

深圳亥时科技

BSI为金斯瑞集团颁发ISO/IEC 27001信息安全管理体系认证证书

财见

海信激光电视连续六年稳居全球第一

财见

“全球金牌敏捷课程” · 3月29-30日CSM认证课程 · Jim老师引导讨论AI & Agility话题

ShineScrum

Scrum CSM CSM认证

AI+智能财务 | 智能资金预测,智能驱动决策升级!

用友智能财务

企业 财会 经营

太好了,IDE支持满血版DeepSeek了,我们有救了!

阿里云云效

阿里云 云原生 AI程序员 AI程序员体验官

面试被问“你的缺点是什么?”该怎么答?

王磊

“2025青岛国际人工智能展览会”智能科技·引领未来

AIOTE智博会

人工智能展

微信搜索“暗藏玄机”?DeepSeek-R1灰度测试背后有何深意?

测吧(北京)科技有限公司

测试

交易所开发:构建安全、高效、可靠的数字资产交易平台

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

mysql实时同步到es

秃头小帅oi

太好了,IDE支持满血版DeepSeek了,我们有救了!

阿里巴巴云原生

阿里云 云原生 通义灵码 AI程序员 AI程序员体验官

人工智能丨Dify开源平台安装指南

测试人

4.98 亿月活背后的国产数据库:咪咕视讯携手 TiDB 攻克内容分发核心系统挑战

PingCAP

数据库 分布式 TiDB

飞算 JavaAI 代码生成实战:如何用 AI 技术减少 70% 重复编码

飞算JavaAI开发助手

【新年版】JimuReport 积木报表 v1.9.4发布,免费报表、打印设计和视化设计

JEECG低代码

报表 可视化数据 BI 报表 大屏设计 报表工具

刷题玩梗?LeetCode上的神回复治好了你的精神内耗

卷福同学

面试 LeetCode 神回复

Java反射机制

不在线第一只蜗牛

Java

“NGINX邮件组历史”论坛上线了!

通明湖

nginx 云原生 njet

从 DeepSeek 趋势看 AI 开发工具:飞算 JavaAI 如何解决开发者核心痛点?

飞算JavaAI开发助手

区块链技术:构建区块链生态的核心要素

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

二级域名如何解析?一个一级域名可以解析多少个二级域名?

防火墙后吃泡面

区块链技术前沿:DApp、DeFi与IDO开发的深度探索

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

领导者!天翼云登顶中国AI云终端市场!

天翼云开发者社区

AI 云终端 DeepSeek

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章