时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

国内科技企业和机构发力 AI 研发,50 余篇论文入选顶会 ICML2024

  • 2024-06-07
    北京
  • 本文字数:1344 字

    阅读完需:约 4 分钟

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024

近日,国际机器学习大会披露了 2024 国际机器学习大会(ICML2024)收录的论文。本届会议共有 9473 篇有效论文投稿,创历史新高,组委会最终录用了 2609 篇,接收率为 27.5%。


国际机器学习大会是全球机器学习领域的权威会议,迄今举办了 41 次会议。组委会成员来自卡内基梅伦大学、剑桥大学、谷歌、苹果等世界名校及全球知名科技企业。今年的国际机器学习大会将于 7 月 21 日~27 日在奥地利维也纳举办。


据了解,蚂蚁集团此次有 11 篇论文入选,覆盖图机器学习、网络/信息安全、人工智能、计算机视觉等多个人工智能和机器学习领域的前沿主题。论文试图改进和优化的技术问题,则聚焦在提高 AI 的经济性和可靠性上。


提高 AI 的经济性,主要看是否能把大模型做“小”,是否能持续工程提效,以及是否能持续度量和优化绿色指标,这决定大模型应用能否能成为主流。


《基于关键点的渐进式思维链蒸馏方法在大语言模型(LLMs)中的应用》正是一个把大模型做“小”的研究。该文提出了一种名为 KPOD 的新蒸馏方法,这是一种机器学习技术,能将大而复杂的模型(教师模型)所学到的知识迁移到一个小而简单的模型(学生模型)中,以大大减少模型的规模和计算成本,同时尽可能保留原始模型的性能。研究团队以 GPT-3.5-Turbo 作为教师模型,以 LLaMA-7B 和 Flan-T5 系列模型作为学生模型进行思维链蒸馏,结果表明,相较现有模型蒸馏技术,KPOD 能将推理准确率提升 5%。


《关注边界:基于重构决策边界的核心集选取》提出了一种新的核心集构建方法,首次在 ImageNet-1K 数据集上实现了使用 50%的数据训练,但是精度损失不超过 1%。


还有几篇论文就如何提高 AI 在计算、训练、推理等过程中的效率,提出了新的技术解决方案。


《Ditto: 量化感知的 Transformer 模型安全推理》一文针对大模型密态推理场景展开了研究,以更高的效率实现密态数据类型的切换,进而带来更优的密态推理性能。实验结果表明,Ditto 可以在不显著降低模型可用性的情况下实现推理效率的提升,性能相较最新工作提升约 2~4 倍。


《多源噪声标签下的自感知去噪方法》一文,从理论上分析了神经网络在面对多源噪声标记时具备的对样本级噪声和源级标注质量的感知能力,进一步提出了一种名为自感知去噪的多源噪声标签学习方法,利用神经网络的自我认知能力在训练期间进行去噪;并构建了一个选择性蒸馏模块以优化计算效率。


《通过随机微分方程统一贝叶斯流网络与扩散模型》一文提出了一种新采样方法 BFN-Solver,相比原始 BFN 采样器实现了 5-20 倍的速度提升。


提高 AI 的可信性,则是要让 AI 更准确专业、真实严谨、可控透明及安全可靠,终极目标是解决控制和“对齐”比人类聪明的模型。这对于 AI 在金融、医疗等严谨行业的落地应用尤为必要与重要。


《基于强化学习的检索增强大语言模型可信对齐》一文针对检索增强的大语言模型仍然会遭受幻觉困扰的问题,提出一种基于强化学习的算法“可信对齐”, 从理论上和实验上证明了大型语言模型可以通过这种方法对齐到可信状态,并将对齐的应用场景从满足人类偏好扩展到创建可信的 Agent 等场合。结果表明,基于“可信对齐”的检索增强大语言模型,无需人工标注,即可在 natural question 问答任务上带来平均 55%的 EM 提升和 53%的记忆率降低。


公开信息显示,此次被会议收录论文的还有清华大学、复旦大学、上海交通大学、中国人民大学、腾讯、联想等国内知名高校及企业。

2024-06-07 16:218612
用户头像
鲁冬雪 GMI Cloud Head of China Marketing

发布了 370 篇内容, 共 321.5 次阅读, 收获喜欢 304 次。

关注

评论

发布
暂无评论
发现更多内容

大胆试错、持续推进,拓展 GenAI 在客户服务领域的新场景

亚马逊云科技 (Amazon Web Services)

WebGIS 开发框架及性能

北京木奇移动技术有限公司

软件外包公司 webGIS开发 webGIS软件外包

WebGIS 开发框架的调试工具

北京木奇移动技术有限公司

软件外包公司 webGIS开发 GIS开发

Easysearch 迁移数据之 Reindex From Remote

极限实验室

easysearch

强强联合,智见未来:麦杰科技将携手视源股份亮相数字中国,以“集团级生产管理平台”赋能数实融合

麦杰研究院

Python 实战!手把手教你调用淘宝商品列表 API 接口

tbapi

淘宝商品详情接口 淘宝数据采集 淘宝API 天猫商品数据采集 淘宝商品详情API

行业热点丨可持续建筑新纪元:GFRP如何重塑混凝土的未来

Altair RapidMiner

仿真 hyperworks GFRP 建筑仿真软件 可持续建筑

信息混乱、协作低效?一文教你打造团队的单一事实来源

跟YY哥学Jira

知识管理 Confluence 知识管理软件 企业知识库 单一事实来源

等保二级测评国家标准详解

黑龙江陆陆信息测评部

Python 实战 | 1688 商品详情 API 接口调用全流程解析

tbapi

1688商品详情接口 1688API 1688数据采集 1688商品详情采集

从被动救火到主动预防,StarRocks 监控与告警全攻略

StarRocks

数据库 数据处理 StarRocks 数据查询 物化视图

GPUStack v0.6超重磅更新:vLLM多机分布式、昇腾MindIE、模型兼容性检测、模型故障自动恢复,上百项增强打造最好用的模型推理平台

GPUStack

人工智能 大模型 模型推理 生成式AI GPU集群

YashanDB 知识库|轻松打通多库数据,YashanDB DBLink 使用指南!

数据库砖家

数据库

【Workshop 第一期 - 北京站】搜索服务统一治理(跨引擎多个集群监控管理、流量管控、服务编排)

极限实验室

Gateway Cloud Workshop easysearch

TVM虚拟机应用实例

上海茶芯科技

编程语言 软件开发 虚拟机

夸克新入口:重构AI“视界观”,望见阿里AI新版图

脑极体

AI

过去一年的工作总结

yuanyxh

JavaScript 总结 前端

三级等保的法定审核周期与形式

黑龙江陆陆信息测评部

过来人给1-3 年技术新人的几点小小的建议,帮助你提升职场竞争力

Y11

找工作 招聘 简历 实习 校招

Coze工作流+DeepSeek模型,躺着管理100个账号的终极秘籍

测试人

人工智能

一文看懂iVX:技术架构、功能特性、性能优化手段

代码制造者

强强联合,智见未来:麦杰科技将携手视源股份亮相数字中国,以“集团级生产管理平台”赋能数实融合

麦杰科技

AI与机器人外科手术:如何用智能化技术提升手术精度与安全性?

天津汇柏科技有限公司

人工智能 机器人 AI 人工智能

人工智能与智能教育:AI如何帮助实现个性化学习与在线教育的未来?

天津汇柏科技有限公司

人工智能 AI 人工智能

解决方案评测|告别复杂配置!基于阿里云云原生应用开发平台CAP快速部署Bolt.diy

Geek_b7ce72

国产法律AI亮相香港!爱问法AI参加香港国际创科展InnoEX

极客天地

GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验

GPUStack

人工智能 大模型 模型推理 生成式AI GPU集群

TVM虚拟机

上海茶芯科技

编程语言 虚拟机

快速理解 MCP(模型上下文协议)核心价值

柯杰

MCP

WebGIS 开发的性能优化

北京木奇移动技术有限公司

软件外包公司 webGIS开发 webGIS软件外包

Arthas redefine(加载外部的.class文件,redefine到JVM里 )

刘大猫

人工智能 监控 Arthas 大模型 redefine

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024_AI&大模型_鲁冬雪_InfoQ精选文章