2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

从铁杵到绣花针:大模型可控生成的探索与思考

  • 2024-12-12
    北京
  • 本文字数:886 字

    阅读完需:约 3 分钟

从铁杵到绣花针:大模型可控生成的探索与思考

今年以来,AI 领域发生了多起因模型生成内容涉及种族偏见、虚假信息而引发的争议事件。这些事件凸显了大模型在生成结果上存在的可控性难题。


那么,如何突破这一限制,让大模型的产出不仅更加智能,还能更为精准地满足实际业务与用户需求?


在即将于本周五开幕的AICon全球人工智能开发与应用大会上,一场来自阿里国际大模型算法负责人骆卫华博士的主题演讲《从铁杵到绣花针:大模型可控生成的探索与思考》,将为大家揭开这道难题的面纱。


骆卫华博士目前担任阿里巴巴海外数字商业集团 AI 算法负责人,负责探索 AI 前沿技术与阿里国际业务相结合的最佳实践,并在此基础上研发 AI 创新技术。此前他在阿里巴巴达摩院负责机器翻译和多语言 NLP,搭建了服务于整个阿里国际业务的多语言翻译技术平台。加入阿里之前,他在中国科学院计算技术研究所从事 NLP 研究工作,并获得了中国科学院工学博士学位。


所谓“可控生成”,是指在大模型生成文本、图像或其他内容时,模型可以精准理解并执行用户给定的约束条件与规则。这意味着,当用户希望模型产生一篇具有特定论点结构的文章,或一张满足特定场景设定的商品展示图片时,模型不仅要完成“生成”这一基本任务,更要严格遵守条件,不能随意发挥或走题。


然而,当前主流的大语言模型和多模态模型在这一点上仍存在明显难题。许多模型虽能在大多数场景下给出相对合理的输出,但当用户的约束条件变得复杂,或者需要精确执行特定逻辑步骤时,模型的生成往往仍显“任性”:要么信息偏差,要么无法准确匹配用户设定的参数与限制,这在真实业务环境中必然引发后续问题。例如,在跨境电商中,为卖家自动生成商品详情页或广告描述时,如果模型不能精确地根据不同区域、文化的审美和政策要求进行生成,就可能出现内容不合规、调性不匹配等问题,大大降低 AI 赋能的实际价值。


在本次演讲中,骆卫华博士将介绍主流大模型在文本或图像生成时面临的可控性挑战,对部分现象成因的分析,并介绍阿里国际 AI 团队在优化可控生成方向上所作的创新探索工作。据悉,从今年开始,阿里国际开始在所有产品、所有区域商家端均上线了 AI 工具。


本次演讲不仅面向 AI 技术研究人员,更期待与有实际业务场景的从业者对话。



2024-12-12 10:4310213

评论

发布
暂无评论
发现更多内容

进击的Java(二)

ES_her0

11月日更

2021阿里大牛最新发布:Java高频面试题和核心技术(已涨薪6K)

Java 程序员 后端

2021最新出炉BAT架构实战文档:多线程与高并发+分布式+微服务

Java 程序员 后端

为什么区块链和加密资产对于实现元宇宙很重要?

CECBC

解决:interface conversion: interface {} is float64, not int

liuzhen007

11月日更

Redis 6.0 新特性篇:多线程网络模型全面解密

码哥字节

redis 多线程 IO多路复用 11月日更

21世纪什么最贵?“人才”看阿里大佬用一本书带你读懂TCP-IP协议

Java 程序员 后端

【MySQL技术专题】「索引技术系列」体验前所未有的技术探险,看穿索引的本质和技术体系(上篇)

码界西柚

MySQL 索引原理 11月日更

2021,你还在写“赤裸裸”的API吗?

Java 程序员 后端

2021最新分享“天猫”面经:10万字大厂面试总结

Java 程序员 后端

22款终端生产力工具,效率飞起!

Java 程序员 后端

数字原生,创新生长|企业如何打造数字创新的“飞天梦”?

阿里巴巴云原生

阿里云 产品 云原生 双十一

OpenVINO基于Tensorflow的模型训练及优化部署

IT蜗壳-Tango

11月日更

2021最新分享成功入职阿里巴巴(口碑部门)面经

Java 程序员 后端

2021社招阿里、腾讯、蚂蚁金服「4面」Java面试高频题分享

Java 程序员 后端

2021美团高级工程师亲自汇总九大面试专题(附1000字解析)

Java 程序员 后端

架构训练营第 3 期模块三作业

吴霏

「架构实战营」

2021年备战金三银四:死磕“源码”篇(Java程序员必看

Java 程序员 后端

2021总结全网最新、最全、最实用Java岗面试真题!已收录GitHub

Java 程序员 后端

2021金三银四,献给程序员从入门到放弃的 Java 架构师面试题

Java 程序员 后端

2021阿里巴巴钻石级级“Docker全线笔记”新鲜出炉

Java 程序员 后端

2021-07-25 Java基础

Java 程序员 后端

区块链之符号理论:抽象化和身份管理的必要条件

CECBC

2021春招Java后端开发面试总结:25个技术专题(最全面试攻略)

Java 程序员 后端

System.Text.Json 中的字符编码

喵叔

11月日更

2021字节总监最新发布:JVM +GC优质手册!面试专属

Java 程序员 后端

分片技术:如何解决区块链的性能问题?

CECBC

2021最新分享字节四面成功拿Offer!

Java 程序员 后端

2021最新分享成功入职腾讯(后台开发岗)面经

Java 程序员 后端

2021,你还在写“赤裸裸”的API吗?(1)

Java 程序员 后端

22道Java Spring Boot高频面试题

Java 程序员 后端

从铁杵到绣花针:大模型可控生成的探索与思考_阿里巴巴_AICon 全球人工智能开发与应用大会_InfoQ精选文章