从铁杵到绣花针：大模型可控生成的探索与思考

今年以来，AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。

那么，如何突破这一限制，让大模型的产出不仅更加智能，还能更为精准地满足实际业务与用户需求？

在即将于本周五开幕的AICon全球人工智能开发与应用大会上，一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针：大模型可控生成的探索与思考》，将为大家揭开这道难题的面纱。

骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人，负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践，并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP，搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前，他在中国科学院计算技术研究所从事 NLP 研究工作，并获得了中国科学院工学博士学位。

所谓“可控生成”，是指在大模型生成文本、图像或其他内容时，模型可以精准理解并执行用户给定的约束条件与规则。这意味着，当用户希望模型产生一篇具有特定论点结构的文章，或一张满足特定场景设定的商品展示图片时，模型不仅要完成“生成”这一基本任务，更要严格遵守条件，不能随意发挥或走题。

然而，当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出，但当用户的约束条件变得复杂，或者需要精确执行特定逻辑步骤时，模型的生成往往仍显“任性”：要么信息偏差，要么无法准确匹配用户设定的参数与限制，这在真实业务环境中必然引发后续问题。例如，在跨境电商中，为卖家自动生成商品详情页或广告描述时，如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成，就可能出现内容不合规、调性不匹配等问题，大大降低 AI 赋能的实际价值。

在本次演讲中，骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战，对部分现象成因的分析，并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉，从今年开始，阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。

本次演讲不仅面向 AI 技术研究人员，更期待与有实际业务场景的从业者对话。

创作场景

从铁杵到绣花针：大模型可控生成的探索与思考