AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

国内科技企业和机构发力 AI 研发,50 余篇论文入选顶会 ICML2024

  • 2024-06-07
    北京
  • 本文字数:1344 字

    阅读完需:约 4 分钟

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024

近日,国际机器学习大会披露了 2024 国际机器学习大会(ICML2024)收录的论文。本届会议共有 9473 篇有效论文投稿,创历史新高,组委会最终录用了 2609 篇,接收率为 27.5%。


国际机器学习大会是全球机器学习领域的权威会议,迄今举办了 41 次会议。组委会成员来自卡内基梅伦大学、剑桥大学、谷歌、苹果等世界名校及全球知名科技企业。今年的国际机器学习大会将于 7 月 21 日~27 日在奥地利维也纳举办。


据了解,蚂蚁集团此次有 11 篇论文入选,覆盖图机器学习、网络/信息安全、人工智能、计算机视觉等多个人工智能和机器学习领域的前沿主题。论文试图改进和优化的技术问题,则聚焦在提高 AI 的经济性和可靠性上。


提高 AI 的经济性,主要看是否能把大模型做“小”,是否能持续工程提效,以及是否能持续度量和优化绿色指标,这决定大模型应用能否能成为主流。


《基于关键点的渐进式思维链蒸馏方法在大语言模型(LLMs)中的应用》正是一个把大模型做“小”的研究。该文提出了一种名为 KPOD 的新蒸馏方法,这是一种机器学习技术,能将大而复杂的模型(教师模型)所学到的知识迁移到一个小而简单的模型(学生模型)中,以大大减少模型的规模和计算成本,同时尽可能保留原始模型的性能。研究团队以 GPT-3.5-Turbo 作为教师模型,以 LLaMA-7B 和 Flan-T5 系列模型作为学生模型进行思维链蒸馏,结果表明,相较现有模型蒸馏技术,KPOD 能将推理准确率提升 5%。


《关注边界:基于重构决策边界的核心集选取》提出了一种新的核心集构建方法,首次在 ImageNet-1K 数据集上实现了使用 50%的数据训练,但是精度损失不超过 1%。


还有几篇论文就如何提高 AI 在计算、训练、推理等过程中的效率,提出了新的技术解决方案。


《Ditto: 量化感知的 Transformer 模型安全推理》一文针对大模型密态推理场景展开了研究,以更高的效率实现密态数据类型的切换,进而带来更优的密态推理性能。实验结果表明,Ditto 可以在不显著降低模型可用性的情况下实现推理效率的提升,性能相较最新工作提升约 2~4 倍。


《多源噪声标签下的自感知去噪方法》一文,从理论上分析了神经网络在面对多源噪声标记时具备的对样本级噪声和源级标注质量的感知能力,进一步提出了一种名为自感知去噪的多源噪声标签学习方法,利用神经网络的自我认知能力在训练期间进行去噪;并构建了一个选择性蒸馏模块以优化计算效率。


《通过随机微分方程统一贝叶斯流网络与扩散模型》一文提出了一种新采样方法 BFN-Solver,相比原始 BFN 采样器实现了 5-20 倍的速度提升。


提高 AI 的可信性,则是要让 AI 更准确专业、真实严谨、可控透明及安全可靠,终极目标是解决控制和“对齐”比人类聪明的模型。这对于 AI 在金融、医疗等严谨行业的落地应用尤为必要与重要。


《基于强化学习的检索增强大语言模型可信对齐》一文针对检索增强的大语言模型仍然会遭受幻觉困扰的问题,提出一种基于强化学习的算法“可信对齐”, 从理论上和实验上证明了大型语言模型可以通过这种方法对齐到可信状态,并将对齐的应用场景从满足人类偏好扩展到创建可信的 Agent 等场合。结果表明,基于“可信对齐”的检索增强大语言模型,无需人工标注,即可在 natural question 问答任务上带来平均 55%的 EM 提升和 53%的记忆率降低。


公开信息显示,此次被会议收录论文的还有清华大学、复旦大学、上海交通大学、中国人民大学、腾讯、联想等国内知名高校及企业。

2024-06-07 16:218424
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 364 篇内容, 共 288.9 次阅读, 收获喜欢 299 次。

关注

评论

发布
暂无评论
发现更多内容

大多数人不知道的Java知识 - Java内省机制

陈皮的JavaLib

Java 内省 java反射

OKR之一

张老蔫

28天写作

已拿到蚂蚁金服Offer!阿里内部二十三万字Java面试题总结

Java架构之路

Java 程序员 架构 面试 编程语言

hive的DQL查询语法详细剖析

大数据技术指南

大数据 hive 3月日更

百度Feed稳定性架构实践

百度Geek说

解决方案 IDC feed

智慧公安重点人员系统开发,情报研判管控平台的搭建

13828808769

【Mysql实战】问题分析利器之binlog

程序员架构进阶

MySQL 数据库 Binlog 28天写作 3月日更

第九周学习总结于心得

产品经理训练营

智慧公安重点人员系统开发,情报研判管控平台的搭建

13828808769

行业资讯

MapReduce的运行机制详解

五分钟学大数据

大数据 mapreduce 3月日更

推荐35款可以快速提升工作效率的软件

科技猫

软件 经验分享 实用工具 办公 工具分享

进阶面试皆宜!阿里强推Java程序员进阶笔记,差距不止一点点

Java架构之路

Java 程序员 架构 面试 编程语言

区块链数字版权-重新定义版权保护

13530558032

『设计模式』80年代的人们竟然领悟了设计模式-- 发布者/订阅者模式 (包括发布者/订阅者模式和观察者模式的区别)

风骨散人

Java 设计模式 发布订阅模式

完美解决Win10“无法登陆到你的账户”问题,无法登录账户的全方面解决方案!

风骨散人

win10 系统

Netty 核心源码解读 —— 开篇

松然聊技术

Netty

【里程碑】Linkis 1.0.0-RC1 版本发布

WeDataSphere

大数据 开源 WeDataSphere Linkis 计算中间件

牛哇!看完阿里独家面试手册金三银四稳了,GitHub一天标星66K(Java岗)

Java架构之路

Java 程序员 架构 面试 编程语言

『设计模式』以为是个王者,后来班主任来了!设计模式--二五仔的观察者模式

风骨散人

设计模式 观察者模式

GitHub已爆火!2021金三银四Java面试突击手册,已助力多人拿到offer

Java 编程 程序员 架构 面试

iOS面试进阶&程序员养成文件(附下载地址)

ios 程序员 面试 iOS逆向

源中瑞智慧平安社区-为社区居民保驾护航

13530558032

vivo 应用商店中的断点续传技术剖析

vivo互联网技术

nsq源码阅读之nsqd总体流程

werbenhu

nsq Go 语言

区块链BaaS应用平台的搭建,BaaS平台的应用场景

13828808769

#区块链#

2021最新分享快手/百度/蚂蚁/字节面经总结

比伯

Java 程序员 架构 面试 程序人生

JDBC--批量插入

打工人!

Java MySQL JDBC MySQL性能优化

MySQL 索引原理 图文讲解

陈皮的JavaLib

MySQL 数据库 索引

区块链电子合同--助推智慧政务

13530558032

Netty 核心源码解读 —— ServerBootstrap 篇

松然聊技术

Netty

Rust从0到1-基础概念-变量

rust 变量

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024_AI&大模型_鲁冬雪_InfoQ精选文章