【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

QCon 广州站盛大开幕,AIGC 浪潮势不可挡,探索大模型的挑战与机遇

QCon

  • 2023-05-26
    北京
  • 本文字数:2752 字

    阅读完需:约 9 分钟

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇

QCon 全球软件开发大会是由极客邦科技旗下 InfoQ 中国主办的综合性技术盛会,每年在伦敦、北京、纽约、圣保罗、上海、旧金山召开。自 2007 年 3 月份开始举办以来,已经有超万名有多年从业经验的技术人员参加过 QCon 大会。QCon 内容源于实践并面向社区,演讲嘉宾依据热点话题,面向 5 年以上工作经验的技术团队负责人、架构师、工程总监、开发人员分享技术创新和实践。


今天,由极客邦科技旗下 InfoQ 中国主办的QCon全球软件开发大会(广州站)顺利开幕。作为这场综合性技术盛会的一部分,我们非常荣幸地邀请到了众多优秀的演讲嘉宾,他们将带来丰富多彩的主题演讲和分享。


大会在 09:00-09:10 开场,由极客邦科技副总裁兼 TGO 鲲鹏会总经理杨攀致辞。杨攀以"AGI 与 AIGC 浪潮下的我们"为主题,为我们拉开了 QCon 广州的开幕式。杨攀提到,“人间一日,AGI 一年”,人类科技的转折点已到来,我们技术岗位的每一位同行者,都应该思考如何利用 AGI 提升效率。他坦言,技术人应该了解理论基础、前沿技术、开发实战以及产业落地方面,以更好地跟上时代的发展。



紧接着,09:10-09:15 期间,极客邦科技的会议主编邓艳琴(Clara)介绍了"QCon 内容策划思路与参会指南",为与会者提供全面的指导。她谈到,曾经还有参会者质疑大模型是否会改变开发范式,但现在这一点已成为现实。在此次会议的专题设置上,AIGC 占了整个分享不小的篇幅。InfoQ 组委会也设置了大模型特色晚场以及大模型体验区,供参会者互动交流,期待大家满载而归。



接下来,在 09:15-09:45 的时间段,商汤集团的联合创始人兼大装置事业群总裁杨帆分享了"大模型浪潮下,商汤的布局与思考",探讨商汤在这个潮流中的发展和思考。杨帆从大模型的核心技术变化入手,分享了商汤日日新大模型的实践探索。

 

杨帆提到大模型的参数量一直在变多,Transformer 的出现使得模型变大的成本大大降低,相对于聊天机器人来说,AI for science 是他认为对人类改变最大的地方。大模型时代走到最后一定是巨头的游戏,更多人的发展空间是在其上层的产业应用。AIGC 浪潮已不可逆转,在这个时刻,非常有可能产生重大的机会。

 

大模型的生产链条包括基模型预训练、精调以及大模型推理服务。他认为,AI 看起来改变了世界,核心的原理是暴力美学——量变引起质变,算力、算法、以及数据的最佳实践,但是背后有一点是存在很多待优化的事情。例如,算力方面,GPU 卡连接过多时,其训练任务稳定性,随着国模快速递减;模型结构方面,需要更优秀的模型结构,精度/效率的权衡和更先进的微调方案设计;最后,数据来源、质量以及多样性覆盖度的挑战。这里存在着许多创业以及工作的机会。

 


随后,在 09:45-10:30 的时间段,京东集团的副总裁包勇军先生介绍了"京东数智化关键技术及应用实践",包勇军提到后疫情时代零售产业面临的挑战有扩内需促消费、多元化消费场景、跨境电商 DTC 兴起、新兴消费品牌崛起。

 

京东围绕成本、效率、体验三个方向,构建了大模型、多模态、端智能隐私计算、运筹优化等数智化创新技术体系,通过技术的创新应用,驱动营销、交易、供应链能力升级。京东自研支持万亿级参数超大模型,可支持在线模型异构计算,毫秒级推理以及离在线一体分钟级在线学习;多模态预训练技术支持全品类、全信息源商品内容理解;端智能技术支持电商模型高时效性应用;隐私计算技术在数据安全与合规的基础上,支持业务模式创新;运筹优化技术支持零售供应链高效流转保障。

 

在京东数智化应用实践方面。营销数智化提升营销效能,升级购物体验;全渠道交易数智化打开零售发展天花板,支撑多业务场景;供应链数智化持续优化供应链成本、效率与体验。



紧接着,10:30-11:00 的时间段,人瑞人才科技集团的 CEO 张建国先生将探讨"数字技术人才的井型模型",分享数字时代人才培养和发展的关键模型。张先生提到《财富》500 强中超过半数的公司应用胜任力模型。在一项基于全球 426 家著名公司的调查中,有 80%的公司在人力资源管理实践中应用胜任力模型。他逐一介绍了 T 型人才、π型人才、以及数字化时代的“井”型人才。张总分享到,数字技术人才能力建设必须符合企业数字化的组织能力需求,技术专业能力只是重要的一部分,但更多体现在创新能力、问题解决能力、团队协作等能力结构的变化。



而 11:00-11:30 这个时间段,小红书的技术副总裁凯奇带来了"AI 时代的降本增效"的演讲,探讨人工智能时代如何实现降低成本、提高效率。凯奇认为 AI 对降本增效有巨大帮助。“AI 技术可以更好的帮我们做成本优化,因为 AI 技术本质上是一个非常高效的优化器(在给定优化目标之后);AI 技术可以更好的帮我们做成本洞察,对成本和效能相关数据做预测和异常发现。”


凯奇谈到,小红书在数据、训练、推理、以及向量检索方面做了许多优化动作。具体来说包括


  • 使用列存格式 (Parquet) 和数据湖技术存储和管理训练数据;

  • 引入异步流水线将计算和通讯尽量互相覆盖,引入大 batch 及半精度通信提升通讯效率,针对异步可能存在的效果影响做了一定的算法修正;

  • 将 worker 分拆为 CPU worker 和 GPU worker 分别负责不同计算和通讯任务,通过动态路由进行灵活配比,两者利用率同时得到大幅提升,同等成本下训练速度提升 20%

  • 对模型进行结构化重构,将多次的 CPU-GPU 传输,变为单次 memcopy 的同质化实现

  • 通过特征抽取 C++ 化、广播优化、大 batch 合并进一步提升了非图内计算的效率

  • 针对小红书实际场景中 QPS 高但单 QPS 计算量小的特点,基于多流和多批处理设计并开发了一套向量检索异构 GPU 并行框架和高效的距离计算及 GPU TopK 排序内核,同等吞吐约束下,成本相较 CPU 架构 优化 35%

 

另外,小红书在 AI for 降本增效实践方面,主要体现在成本动因预估、智能算力分配、 视频带宽优化、 智能视频缓存、Github Copilot、Data Copilot 等。



最后,在 11:30-12:00 的时间段,麦当劳中国的数字化副总裁汤海涛介绍了"麦当劳中国的数字化变革",汤总从互联网对企业数字化的影响入手,分享了从 C 端切入,讲述了在产研上麦当劳的实践。汤总分享了许多麦当劳在统一的交互设计、瀑布和敏捷的探索结合、自研 DevOps 平台 Ninja、公有云和私有云的配合以及系统之间的 API 生态等方面的内容,为正在转型的企业提供了新的视角。



到这里,上午的所有分享就结束了。通过 QCon 大会,听众可以与顶尖的技术专家和领导者互动交流,了解最新的技术趋势和最佳实践。同时,大会也提供了一个共享经验和知识的平台,促进了技术社区的发展和合作。


当然,一场大会的顺利举办,离不开所有共创伙伴的大力支持,在此,对大家表示最诚挚的感谢。



让我们一起期待 QCon 全球软件开发大会为我们带来的精彩内容和难忘经历!


谢谢大家!

活动推荐


2023 年 9 月 3 - 5 日,在北京·富力万丽酒店, QCon 全球软件开发大会(北京站)已开启,现已开启售票,提前订票,可享受 7 折早鸟价,购票参会可以直接电话 / 微信联系票务经理 18514549229。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-05-26 15:304863

评论

发布
暂无评论
发现更多内容

【Spring 学习笔记(四)】Spring Bean 集合注入和自动装配

倔强的牛角

spring Java EE 6月月更

700行无用 纯 CSS 祝考生 金榜高粽《1_bit 的无用 CSS 代码 》

1_bit

CSS html 前端

SDN系统方法 | 4. 裸金属交换机

俞凡

架构 网络 sdn SDN系统方法

Node详细讲解

恒山其若陋兮

6月月更

秒懂网络拓扑中的下一跳地址

wljslmz

网络协议 网络工程师 网络技术 6月月更

MementoPattern-备忘录模式

梁歪歪 ♚

设计模式

Flink on yarn 远程调试源码

JasonLee实时计算

flink

java构造器(构造方法、构造函数)

写代码两年半

面试 javase 构造函数 6月月更

Python环境搭建

智趣匠

Python编程 6月月更 Python环境

支付系统安全设计思维导图

靠谱的程序员

支付安全

外包学生管理系统

极客土豆

初识SDN网络

穿过生命散发芬芳

SDN网络 6月月更

区块链mass哈希競猜dapp游戏开发源代码(多游戏)

开发微hkkf5566

LabVIEW控制Arduino采集多路模拟量、数字量(进阶篇—1)

不脱发的程序猿

单片机 LabVIEW VISA Arduino Uno 采集多路模拟量、数字量

函数

Jason199

js 函数 6月月更

Leecode上的代码到Pycharm运行解决方法

武师叔

Python pycharm Leet Code 6月月更

Java中的13个原子操作类

急需上岸的小谢

6月月更

企业网站建设方法

源字节1号

软件开发

StatePattern-状态模式

梁歪歪 ♚

设计模式

以购物清单为例讲述 Redux 的状态如何在 Flutter 多个组件间共享

岛上码农

flutter 安卓开发 ios 开发 跨平台应用 6月月更

数据库每日一题---第3天:大的国家

知心宝贝

数据库 算法 前端 后端 6月月更

【腾讯云代码分析】五月上新+新功能前瞻

腾源会

Jetpack Composes 之TextField详解

坚果

6月月更

vue指令-1

小恺

6月月更

Sentinel与OpenFeign 服务熔断那些事

牧小农

sentinel openfeign

抖音大举进军电商领域:这步棋应该如何下

石头IT视角

学生管理系统架构文档

爱晒太阳的大白

模块3作业(外包学生管理系统架构文档)

Geek_701557

读书笔记 之《软件架构设计: 大型网站技术架构与业务架构融合之道》

蔡农曰

读书笔记 架构 后端 后端开发 后端开发书籍

使用 TensorFlow 和 Express.js 实现AI图像识别

devpoint

tensorflow Express 6月月更

等你加入|建木开源社区团队成员招募

Jianmu

开源社区 自动化运维 社区运营 志愿者招募

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇_QCon_InfoQ精选文章