【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

QCon 广州站盛大开幕,AIGC 浪潮势不可挡,探索大模型的挑战与机遇

QCon

  • 2023-05-26
    北京
  • 本文字数:2752 字

    阅读完需:约 9 分钟

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇

QCon 全球软件开发大会是由极客邦科技旗下 InfoQ 中国主办的综合性技术盛会,每年在伦敦、北京、纽约、圣保罗、上海、旧金山召开。自 2007 年 3 月份开始举办以来,已经有超万名有多年从业经验的技术人员参加过 QCon 大会。QCon 内容源于实践并面向社区,演讲嘉宾依据热点话题,面向 5 年以上工作经验的技术团队负责人、架构师、工程总监、开发人员分享技术创新和实践。


今天,由极客邦科技旗下 InfoQ 中国主办的QCon全球软件开发大会(广州站)顺利开幕。作为这场综合性技术盛会的一部分,我们非常荣幸地邀请到了众多优秀的演讲嘉宾,他们将带来丰富多彩的主题演讲和分享。


大会在 09:00-09:10 开场,由极客邦科技副总裁兼 TGO 鲲鹏会总经理杨攀致辞。杨攀以"AGI 与 AIGC 浪潮下的我们"为主题,为我们拉开了 QCon 广州的开幕式。杨攀提到,“人间一日,AGI 一年”,人类科技的转折点已到来,我们技术岗位的每一位同行者,都应该思考如何利用 AGI 提升效率。他坦言,技术人应该了解理论基础、前沿技术、开发实战以及产业落地方面,以更好地跟上时代的发展。



紧接着,09:10-09:15 期间,极客邦科技的会议主编邓艳琴(Clara)介绍了"QCon 内容策划思路与参会指南",为与会者提供全面的指导。她谈到,曾经还有参会者质疑大模型是否会改变开发范式,但现在这一点已成为现实。在此次会议的专题设置上,AIGC 占了整个分享不小的篇幅。InfoQ 组委会也设置了大模型特色晚场以及大模型体验区,供参会者互动交流,期待大家满载而归。



接下来,在 09:15-09:45 的时间段,商汤集团的联合创始人兼大装置事业群总裁杨帆分享了"大模型浪潮下,商汤的布局与思考",探讨商汤在这个潮流中的发展和思考。杨帆从大模型的核心技术变化入手,分享了商汤日日新大模型的实践探索。

 

杨帆提到大模型的参数量一直在变多,Transformer 的出现使得模型变大的成本大大降低,相对于聊天机器人来说,AI for science 是他认为对人类改变最大的地方。大模型时代走到最后一定是巨头的游戏,更多人的发展空间是在其上层的产业应用。AIGC 浪潮已不可逆转,在这个时刻,非常有可能产生重大的机会。

 

大模型的生产链条包括基模型预训练、精调以及大模型推理服务。他认为,AI 看起来改变了世界,核心的原理是暴力美学——量变引起质变,算力、算法、以及数据的最佳实践,但是背后有一点是存在很多待优化的事情。例如,算力方面,GPU 卡连接过多时,其训练任务稳定性,随着国模快速递减;模型结构方面,需要更优秀的模型结构,精度/效率的权衡和更先进的微调方案设计;最后,数据来源、质量以及多样性覆盖度的挑战。这里存在着许多创业以及工作的机会。

 


随后,在 09:45-10:30 的时间段,京东集团的副总裁包勇军先生介绍了"京东数智化关键技术及应用实践",包勇军提到后疫情时代零售产业面临的挑战有扩内需促消费、多元化消费场景、跨境电商 DTC 兴起、新兴消费品牌崛起。

 

京东围绕成本、效率、体验三个方向,构建了大模型、多模态、端智能隐私计算、运筹优化等数智化创新技术体系,通过技术的创新应用,驱动营销、交易、供应链能力升级。京东自研支持万亿级参数超大模型,可支持在线模型异构计算,毫秒级推理以及离在线一体分钟级在线学习;多模态预训练技术支持全品类、全信息源商品内容理解;端智能技术支持电商模型高时效性应用;隐私计算技术在数据安全与合规的基础上,支持业务模式创新;运筹优化技术支持零售供应链高效流转保障。

 

在京东数智化应用实践方面。营销数智化提升营销效能,升级购物体验;全渠道交易数智化打开零售发展天花板,支撑多业务场景;供应链数智化持续优化供应链成本、效率与体验。



紧接着,10:30-11:00 的时间段,人瑞人才科技集团的 CEO 张建国先生将探讨"数字技术人才的井型模型",分享数字时代人才培养和发展的关键模型。张先生提到《财富》500 强中超过半数的公司应用胜任力模型。在一项基于全球 426 家著名公司的调查中,有 80%的公司在人力资源管理实践中应用胜任力模型。他逐一介绍了 T 型人才、π型人才、以及数字化时代的“井”型人才。张总分享到,数字技术人才能力建设必须符合企业数字化的组织能力需求,技术专业能力只是重要的一部分,但更多体现在创新能力、问题解决能力、团队协作等能力结构的变化。



而 11:00-11:30 这个时间段,小红书的技术副总裁凯奇带来了"AI 时代的降本增效"的演讲,探讨人工智能时代如何实现降低成本、提高效率。凯奇认为 AI 对降本增效有巨大帮助。“AI 技术可以更好的帮我们做成本优化,因为 AI 技术本质上是一个非常高效的优化器(在给定优化目标之后);AI 技术可以更好的帮我们做成本洞察,对成本和效能相关数据做预测和异常发现。”


凯奇谈到,小红书在数据、训练、推理、以及向量检索方面做了许多优化动作。具体来说包括


  • 使用列存格式 (Parquet) 和数据湖技术存储和管理训练数据;

  • 引入异步流水线将计算和通讯尽量互相覆盖,引入大 batch 及半精度通信提升通讯效率,针对异步可能存在的效果影响做了一定的算法修正;

  • 将 worker 分拆为 CPU worker 和 GPU worker 分别负责不同计算和通讯任务,通过动态路由进行灵活配比,两者利用率同时得到大幅提升,同等成本下训练速度提升 20%

  • 对模型进行结构化重构,将多次的 CPU-GPU 传输,变为单次 memcopy 的同质化实现

  • 通过特征抽取 C++ 化、广播优化、大 batch 合并进一步提升了非图内计算的效率

  • 针对小红书实际场景中 QPS 高但单 QPS 计算量小的特点,基于多流和多批处理设计并开发了一套向量检索异构 GPU 并行框架和高效的距离计算及 GPU TopK 排序内核,同等吞吐约束下,成本相较 CPU 架构 优化 35%

 

另外,小红书在 AI for 降本增效实践方面,主要体现在成本动因预估、智能算力分配、 视频带宽优化、 智能视频缓存、Github Copilot、Data Copilot 等。



最后,在 11:30-12:00 的时间段,麦当劳中国的数字化副总裁汤海涛介绍了"麦当劳中国的数字化变革",汤总从互联网对企业数字化的影响入手,分享了从 C 端切入,讲述了在产研上麦当劳的实践。汤总分享了许多麦当劳在统一的交互设计、瀑布和敏捷的探索结合、自研 DevOps 平台 Ninja、公有云和私有云的配合以及系统之间的 API 生态等方面的内容,为正在转型的企业提供了新的视角。



到这里,上午的所有分享就结束了。通过 QCon 大会,听众可以与顶尖的技术专家和领导者互动交流,了解最新的技术趋势和最佳实践。同时,大会也提供了一个共享经验和知识的平台,促进了技术社区的发展和合作。


当然,一场大会的顺利举办,离不开所有共创伙伴的大力支持,在此,对大家表示最诚挚的感谢。



让我们一起期待 QCon 全球软件开发大会为我们带来的精彩内容和难忘经历!


谢谢大家!

活动推荐


2023 年 9 月 3 - 5 日,在北京·富力万丽酒店, QCon 全球软件开发大会(北京站)已开启,现已开启售票,提前订票,可享受 7 折早鸟价,购票参会可以直接电话 / 微信联系票务经理 18514549229。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-05-26 15:304896

评论

发布
暂无评论
发现更多内容

云安全的第一站:CSPM

HummerCloud

云安全 cspm

人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)

汀丶人工智能

人工智能 自然语言处理 深度学习 计算机视觉 6 月 优质更文活动

TiDB v7.1.0 版本 Resource Control体验

TiDB 社区干货传送门

新版本/特性解读 7.x 实践

tiflash引擎的使用小总结

TiDB 社区干货传送门

OLAP 场景实践

【TiDB v7.1.0 荣誉体验官招募】索尼 PS5 、索尼无线降噪耳机、倍轻松颈部按摩器等你拿!

TiDB 社区干货传送门

河北等保测评公司有哪些?总共有几家?

行云管家

等级保护 等保测评 河北

Wallys/DR9574/4*4 2.4G/support for some GPIOs .

Cindy-wallys

ipq9574

搭建TiDB负载均衡环境-HAproxy+KeepAlived实践

TiDB 社区干货传送门

实践案例 管理与运维 数据库架构设计 7.x 实践

搭建TiDB负载均衡环境-LVS+KeepAlived实践

TiDB 社区干货传送门

管理与运维 7.x 实践

TiDB 7.1 资源管控特性试用

TiDB 社区干货传送门

新版本/特性解读 7.x 实践

IT自动化运维工具优势与劣势分析-行云管家

行云管家

IT运维 行云管家 自动化运维

CST电磁仿真软件对火箭发射场雷击仿真与电子设备结构设计

思茂信息

cst cst仿真软件 abaqus abaqus软件 abaqus有限元仿真

小程序容器技术:数字门户的创新引擎

FinClip

TiDB Contributor 资料汇总

TiDB 社区干货传送门

Spring循环依赖案例分析:三级缓存结构+循环依赖解决方案

互联网架构师小马

探索开源创新理论|2023开放原子全球开源峰会开源创新理论与实践分论坛成功召开

开放原子开源基金会

开源 开放原子全球开源峰会 开放原子 开源创新理论

软件测试/测试开发丨用户端App自动化测试学习笔记分享

测试人

Python 程序员 软件测试 自动化测试

Wallys/board with SFP module /ipq8072/ipq6010/ipq4019 / support openwrt

Cindy-wallys

IPQ4019 IPQ6010 IPQ8072 ipq4029

【6.09-6.16】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

Java8 Stream 的总体设计和使用

4ye

Java' 6 月 优质更文活动

一篇文章帮你解读所有 TiDB 工具&常见问题解决大全

TiDB 社区干货传送门

记一次 Rust 内存泄漏排查之旅 | 经验总结篇

Greptime 格睿科技

rust 时序数据库 内存泄漏 云原生数据库 heap profiling

2023大型企业全面预算管理趋势

用友BIP

全面预算 财务共享

全球异型LED显示屏的市场发展

Dylan

技术 设计 领域 LED显示屏 市场

智造零距离:工程师走访华秋深圳 PCB 工厂,观摩高可靠板制造流程

华秋电子

人工智能飞速发展,数智人力共享技术东风

用友BIP

人力资源 数智人力

Java8 Stream 的核心秘密

4ye

Java' 6 月 优质更文活动

深度学习实践篇[17]:模型压缩技术、模型蒸馏算法:Patient-KD、DistilBERT、DynaBERT、TinyBERT

汀丶人工智能

人工智能 深度学习 知识蒸馏 模型压缩 6 月 优质更文活动

【有奖体验】AI 都这么厉害了,可以看图生成文字描述!

Serverless Devs

TiDB v7.1.0版本 相关(部署、在线扩容、数据迁移)测试

TiDB 社区干货传送门

版本测评 新版本/特性发布 扩/缩容 数据库连接 7.x 实践

一起薅 DevChat 公测的羊毛:国内无需注册就能用上免费的 ChatGPT(gpt-4)

胡说云原生

ChatGPT GPT-4 DevChat

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇_QCon_InfoQ精选文章