写点什么

国内科技企业和机构发力 AI 研发,50 余篇论文入选顶会 ICML2024

  • 2024-06-07
    北京
  • 本文字数:1344 字

    阅读完需:约 4 分钟

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024

近日,国际机器学习大会披露了 2024 国际机器学习大会(ICML2024)收录的论文。本届会议共有 9473 篇有效论文投稿,创历史新高,组委会最终录用了 2609 篇,接收率为 27.5%。


国际机器学习大会是全球机器学习领域的权威会议,迄今举办了 41 次会议。组委会成员来自卡内基梅伦大学、剑桥大学、谷歌、苹果等世界名校及全球知名科技企业。今年的国际机器学习大会将于 7 月 21 日~27 日在奥地利维也纳举办。


据了解,蚂蚁集团此次有 11 篇论文入选,覆盖图机器学习、网络/信息安全、人工智能、计算机视觉等多个人工智能和机器学习领域的前沿主题。论文试图改进和优化的技术问题,则聚焦在提高 AI 的经济性和可靠性上。


提高 AI 的经济性,主要看是否能把大模型做“小”,是否能持续工程提效,以及是否能持续度量和优化绿色指标,这决定大模型应用能否能成为主流。


《基于关键点的渐进式思维链蒸馏方法在大语言模型(LLMs)中的应用》正是一个把大模型做“小”的研究。该文提出了一种名为 KPOD 的新蒸馏方法,这是一种机器学习技术,能将大而复杂的模型(教师模型)所学到的知识迁移到一个小而简单的模型(学生模型)中,以大大减少模型的规模和计算成本,同时尽可能保留原始模型的性能。研究团队以 GPT-3.5-Turbo 作为教师模型,以 LLaMA-7B 和 Flan-T5 系列模型作为学生模型进行思维链蒸馏,结果表明,相较现有模型蒸馏技术,KPOD 能将推理准确率提升 5%。


《关注边界:基于重构决策边界的核心集选取》提出了一种新的核心集构建方法,首次在 ImageNet-1K 数据集上实现了使用 50%的数据训练,但是精度损失不超过 1%。


还有几篇论文就如何提高 AI 在计算、训练、推理等过程中的效率,提出了新的技术解决方案。


《Ditto: 量化感知的 Transformer 模型安全推理》一文针对大模型密态推理场景展开了研究,以更高的效率实现密态数据类型的切换,进而带来更优的密态推理性能。实验结果表明,Ditto 可以在不显著降低模型可用性的情况下实现推理效率的提升,性能相较最新工作提升约 2~4 倍。


《多源噪声标签下的自感知去噪方法》一文,从理论上分析了神经网络在面对多源噪声标记时具备的对样本级噪声和源级标注质量的感知能力,进一步提出了一种名为自感知去噪的多源噪声标签学习方法,利用神经网络的自我认知能力在训练期间进行去噪;并构建了一个选择性蒸馏模块以优化计算效率。


《通过随机微分方程统一贝叶斯流网络与扩散模型》一文提出了一种新采样方法 BFN-Solver,相比原始 BFN 采样器实现了 5-20 倍的速度提升。


提高 AI 的可信性,则是要让 AI 更准确专业、真实严谨、可控透明及安全可靠,终极目标是解决控制和“对齐”比人类聪明的模型。这对于 AI 在金融、医疗等严谨行业的落地应用尤为必要与重要。


《基于强化学习的检索增强大语言模型可信对齐》一文针对检索增强的大语言模型仍然会遭受幻觉困扰的问题,提出一种基于强化学习的算法“可信对齐”, 从理论上和实验上证明了大型语言模型可以通过这种方法对齐到可信状态,并将对齐的应用场景从满足人类偏好扩展到创建可信的 Agent 等场合。结果表明,基于“可信对齐”的检索增强大语言模型,无需人工标注,即可在 natural question 问答任务上带来平均 55%的 EM 提升和 53%的记忆率降低。


公开信息显示,此次被会议收录论文的还有清华大学、复旦大学、上海交通大学、中国人民大学、腾讯、联想等国内知名高校及企业。

2024-06-07 16:218717
用户头像
鲁冬雪 GMI Cloud Head of China Marketing

发布了 381 篇内容, 共 334.7 次阅读, 收获喜欢 305 次。

关注

评论

发布
暂无评论
发现更多内容

直播预告 | 如何运用Scrum打造一个高绩效的团队

ShineScrum

敏捷 高效 团队成长 敏捷活动 敏捷之旅

国科云全面解析DNS解析不生效的原因和解决方法

防火墙后吃泡面

区块链U 卡 App 的开发

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

储能技术怎么选?— 电化学、飞轮、氢能适配绿电直连场景深度对比

西格电力

高性能存储 #高性能存储 智慧储能电站 储能 绿电直连

存储成本降半、处理效率倍增:火山引擎多模态数据湖如何支撑Agent规模化落地

字节跳动数据平台

MyEMS:开源时代下的智能能源管理新选择

开源能源管理系统

开源 能源管理系统

真实迁移案例:从 Azkaban 到 DolphinScheduler 的选型与实践

白鲸开源

大数据 开源 大数据任务调度 Apache DolphinScheduler Azkaban

移动应用APP开发搭建自动化测试框架经验分享

禅道项目管理

程序员 自动化测试 移动端测试

accept err=24:Too many open files 问题解决

webrtc developer

开源破局!MyEMS 如何让企业能源管理告别 “高价闭源”,轻松踩中双碳节奏?

开源能源管理系统

开源 能源管理系统

京东拍立淘API开发指南:从零开始构建图像搜索应用

Datafox(数据狐)

京东API 京东图片搜索接口 京东拍立淘API 京东图片数据采集 京东图片识别接口

AI 英语学习 App 的开发

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

哪些产品设计软件值得推荐?3个主流设计工具盘点

职场工具箱

产品经理 产品设计 设计师 figma ui设计

【案例分享】灯塔低代码平台助力高校数字化转型

中烟创新

区块链 DApp 开发流程

北京木奇移动技术有限公司

dapp开发 区块链开发 软件外包公司

BendSQL v0.30.3 Web UI 功能介绍

Databend

储能如何精准“嵌入”绿电直连?破解容量、策略与经济性三重挑战

西格电力

光伏发电 #高性能存储 新能源产业 风电 绿电直连

AI实盘交易实验:大模型金融应用潜力与落地挑战深度剖析

EasyLink_ai

人工智能 金融科技 非结构化数据 OCR 大模型

洞察先机:如何从全球媒体监测数据中捕捉下一个市场趋势?

沃观Wovision

舆情监测 出海媒体监测 媒体监测 全球媒体监测

在AI技术唾手可得的时代,挖掘新需求成为制胜关键——某知名AI应用构建平台需求洞察

qife122

开源项目 需求分析 AI应用开发

极氪与火山引擎深化合作,Data Agent赋能车辆数据管理效率

字节跳动数据平台

AI英语学习APP的核心功能

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

火热报名中!2025 龙蜥操作系统大会亮点速递

阿里巴巴云原生

阿里云 云原生

大数据-144 Apache Kudu:实时写 + OLAP 的架构、性能与集成

武子康

大数据 spark 分布式 kudu Apache Kudu

大模型推理服务架构

陈一之

大模型 应用架构

低代码流程发起全攻略:4 种方式 + 数据规则,审批流程快速落地

引迈信息

出海舆情监测服务商终极选择:2025年TOP 5综合实力对比

沃观Wovision

舆情监测 海外舆情监测 出海舆情 舆情服务

怎样为你的 RAG 应用选择合适的嵌入模型?

Baihai IDP

AI LLM 检索增强生成 嵌入模型 RAG 系统

火山引擎发布Data Agent新能力,推动用户洞察进入“智能3.0时代”​

字节跳动数据平台

信息安全建设文档,信息安全评估方案

金陵老街

信息安全

AI 英语学习 App 的开发流程

北京木奇移动技术有限公司

AI教育 软件外包公司 AI英语

国内科技企业和机构发力AI研发,50余篇论文入选顶会ICML2024_AI&大模型_鲁冬雪_InfoQ精选文章