写点什么

大模型智算与开发落地实践:释放 AI 潜力的关键技术与行业应用

  • 2024-12-02
    北京
  • 本文字数:1929 字

    阅读完需:约 6 分钟

大模型智算与开发落地实践:释放AI潜力的关键技术与行业应用

大模型服务已经成为推动各行各业创新的核心力量。为了充分释放大模型的潜力,智算基础设施的建设与大模型的研发成为了关键环节。大模型智算与开发并非仅仅局限于算法的优化与创新,如何构建高效的 AI 基础设施,如何优化训练与推理架构,如何在多个行业中实现大模型的成功落地,这些都是当前技术发展的核心问题。


12 月 13 日~14 日,2024 年度最后一场「AICon全球人工智能开发与应用大会」将在北京盛大开幕!大会特别策划了《大模型智算与开发落地实践》专题,聚焦于大模型服务背后的智算基础设施与基础大模型研发中的前沿技术与实践。

更多精彩议题可以点击链接查看大会日程:https://aicon.infoq.cn/202412/beijing/schedule


本专题的出品人为阿里云智能政企事业部大模型智算负责人 王浩 博士,负责政企 AI 大模型智算产品研发。曾任阿里巴巴达摩院人工智能实验室天猫精灵智能语音助手产品算法负责人。之前曾是 360 搜索首席科学家以及中国科学院教授,成果大多发表在人工智能国际顶级会议和期刊:KDD、NeurIPS、SIGIR、AAAI、IJCAI、WWW、ICDE、ACM MM、ECCV、ICCV、TOIS、TKDE、TPAMI、TIP 等。


精彩分享一

智谱 GLM 技术团队专注于面向通用人工智能(AGI)的基础模型研发,早在 2022 年就训练并开源了媲美 GPT-3 性能的中英双语预训练模型 GLM-130B,后续发布的 ChatGLM 开源模型系列在 Hugging Face 社区上获得了超过一千万的下载量;2024 年 8 月,GLM 团队发布的旗舰模型 GLM-4-Plus 在 9 月的 SuperBench 大模型评测中位列世界前三。


智谱这些模型展现出来的卓越性能离不开海量互联网数据和算力训练。与此同时,大语言模型的兴起给训练基础设施带来全新的挑战,包括对算力、大规模数据处理量、复杂的系统管理等需求。针对自身的特定需求,智谱从零开始构建了一套大模型原生的训练基础设施。针对大规模训练稳定性、多算力集群数据流转、平台易用性等进行了一些优化,大会上,智谱 AI GLM 模型预训练与基础设施负责人曾奥涵将通过《智谱大模型训练基础设施落地实践》演讲,分享智谱在大模型原生基础设施建设中的经验与实践。


精彩分享二

模型量化通过降低权重精度减少计算量与内存占用,加速推理过程并降低能耗,对于提升大模型在资源受限设备上的部署效率至关重要以往 PTQ 量化方法忽略不同层权重对量化精度的敏感性,且在超低比特量化下(2-3 位)精度损失严重。


为了应对这一挑战,阿里巴巴行业大模型智算技术负责人张跃伟,将在本次演讲中分享《大模型超低比特无损量化技术实践》,介绍 AMLQ(Adaptive Mixed precision and Low-rank Quantization error reconstruction)量化方法,探讨大模型在推理实践中的挑战以及如何通过创新的量化技术提升大模型在资源受限设备上的部署效率。


精彩分享三

在资源有限的情况下,如何提高模型训练效率,尤其是数据的质量控制,成为了一个重要的课题。许多轻量化模型如 Phi 系列,通过严谨的质量控制,在较少数据和较低算力(FLOPs)支持下,达到了显著的效果提升。当前开源数据集的趋势集中在增多 Tokens 和更精细化的质量筛选,以获得更小、效果更佳的数据集。此外,去重策略需要根据具体业务需求定制,更高比例的去重未必能带来更优结果,且数据质量这一概念难以仅依赖人类偏好定义。


来自百川智能的算法专家张宇鹏,将在本次演讲中分享《百川智能预训练数据策略的探索与实践》他将详细阐述如何通过优化数据质量控制策略,提升模型在有限资源下的表现;介绍基于模型自我学习能力和人类标注结合的数据筛选策略,解决数据去重和质量控制问题,并分享如何通过知识类别的分类采样和小模型拟合 Scaling Law,降低实验成本并提升数据利用效率。


精彩分享四

随着 ChatGPT 的出现,大模型获得了前所未有的热度,但关于大模型研究主要聚焦在高资源语种上(如英文、中文),对中低资源语种的支持相对较差。如何在中低资源语上进行大模型业务落地,是一个非常有价值且值得探索的问题。


华为翻译中心高级工程师商恒超带来演讲《盘古多语言大模型研究与业务落地探索》,他将介绍华为翻译中心以翻译技术为出发点,提升大模型在低资源语种的表现,并且以阿语和泰语为例,详细介绍模型的适配、翻译技术的应用、以及业务场景的落地等内容。


彩蛋

在本场专题期间,我们还将举行一场圆桌讨论,主题为「Scaling Law 的边界及 AI 芯片领域的新竞争格局」。本次圆桌将探讨以下核心问题:

  • 大模型预训练阶段的 Scaling law 还可持续吗?算力的突破能否带来新的 Scaling law?

  • 形如 OpenAI o1 的推出会对未来算力的格局发生什么变化?

  • 新一代推理芯片(Groq、Celebras)是否会挑战 NVIDIA 的 GPU 地位?


PS,AICon 大会门票即将售罄,若团购可全年最低价入手,还有最后为数不多的优惠名额,有兴趣的朋友真得抓紧了:https://aicon.infoq.cn/202412/beijing/

2024-12-02 18:016611

评论

发布
暂无评论
发现更多内容

DolphinScheduler 社区月报(5-6 月):修复优化齐发力,贡献者高光时刻回顾!

白鲸开源

大数据 开源 Apache DolphinScheduler 贡献者 Apache基金会

SeaTunnel 社区月报(5-6 月):全新功能上线、Bug 大扫除、Merge 之星是谁?

白鲸开源

大数据 Clickhouse 数据集成 Apache SeaTunnel 版本发布

对话 Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验

声网

DolphinScheduler 社区喜讯:两项学生项目入选“开源之夏 2025”!

白鲸开源

大数据 开源 数据集成 Seatunnel 开源之夏

真正的生产力来了!Docker迁移部署两步搞定!

不在线第一只蜗牛

Java Docker 容器

“念念不忘,必有回响” 与 “着力即差”

酱紫的小白兔

Academic Pages - 学术个人网站模板

qife122

Jekyll 学术网站

在 AWS 上重构数据中台,这家出海企业选择了数栈

袋鼠云数栈

大数据 数据中台 运维 数据治理 大数据产品

数栈 × AWS EMR On EC2 适配实践:打造出海企业可落地的云上数据中台解决方案

袋鼠云数栈

大数据 数据治理 AWS 数据运营 数栈

用 AI 解锁技术调研的新姿势

京东科技开发者

DolphinScheduler 6 个高频 SQL 操作技巧

白鲸开源

sql 大数据 开源 Apache DolphinScheduler 任务调度

国产数据库StarRocks在数栈轻量化数据开发的全流程实践

袋鼠云数栈

大数据 运维 数据治理 数据管理 数栈

高并发系统的艺术:如何在流量洪峰中游刃有余

京东科技开发者

系统整容纪:用知识来“武装“自己~认识MySQL的锁与事务

京东科技开发者

Meta 成立超级智能实验室,多名顶尖语音科学家加入;TEN VAD 开源 ONNX 模型,GitHub 破 700 星丨日报

声网

【7 月 5 日北京】还有 4 天见面,为你整理大会现场还需要知道的事!

Apache IoTDB

【HarmonyOS】鸿蒙使用仓颉编程入门

GeorgeGcs

啥时候上RAG?啥时候上微调?丨实战笔记

阿星AI工作室

AI 产品经理 rag 微调

基于StarRocks的指标平台查询加速方案

袋鼠云数栈

数据库 运维 数据管理 指标管理 指标管理平台

什么是低代码?低代码的技术发展、技术领域及对比纯代码的优劣势

优秀

低代码 低代码平台 低代码技术

DistillQwen-ThoughtY:通过变长思维链蒸馏,全面提升模型推理能力!

阿里云大数据AI技术

人工智能 数据分析 数据处理 模型应用 #大数据

一行代码性能翻倍?Rust开发者不可不知的“内存黑科技”!

Yeauty

rust malloc Wasm memory jemalloc

零代码打造专业级工业数字孪生

袋鼠云数栈

数字孪生 数据应用 数字孪生城市 易知微 3D场景

SeaTunnel 社区 2 项目中选“开源之夏 2025”,探索高阶数据集成能力!

白鲸开源

数据库 大数据 开源 Apache SeaTunnel 开源之夏

白鲸开源双项目齐中选,助力“开源之夏 2025”再结硕果!

白鲸开源

开源 DataOps 开源之夏 白鲸开源

华为OceanProtect跻身Gartner®备份与数据保护平台魔力象限"挑战者"

财见

我对 AI 写作的一些思考:Writing in the Age of LLMs

Baihai IDP

人工智能 AI Baihai IDP AI 写作

2025第三届中国SRE大会成功举办

雅菲奥朗

MySQL数据一键同步至ClickHouse数据库

RestCloud

MySQL 数据库 数据同步 ETL Click house

HarmonyOS安全与隐私分论坛举行,全面展示星盾安全2.0生态创新实践

最新动态

财会创新智启未来,2025年ACCA华南区年度峰会成功举办

财见

大模型智算与开发落地实践:释放AI潜力的关键技术与行业应用_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章