【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

深度培训|手把手教你在开源基础上构建私有大模型和知识库

  • 2023-06-20
    北京
  • 本文字数:1506 字

    阅读完需:约 5 分钟

深度培训|手把手教你在开源基础上构建私有大模型和知识库

经过和大量的企业同行交流,收集大家的需求点,我们发现很多企业都对于利用开源的模型构建私有的模型,并利用大型语言模型构建私有知识应用,将企业的私有知识进行有效的萃取及使用很感兴趣。


于是在今年的 7 月和 8 月,我们在北京和上海分别策划了线下深度培训,邀请业界资深专家陈旸博士,和范煜来分享如何动手构建大模型并使用大模型开发应用。


此外,在 7 月深圳站 ArchSummit 会后,也将召开一场深度培训,特别邀请了去哪儿网王植萌、京东金融康阳分别从领域驱动设计和系统高可用性方面,深度解读这些技术从设计到落地的细节。


培训主题一:基于大模型的私有知识应用开发

陈旸 博士:阿里云 MVP,数字化转型专家。清华大学计算机博士,阿里云 MVP,腾讯云 TVP,百度 AI 比赛教练,百度 PPDE,数字化转型专家,著有《数据分析实战》《SQL 必知必会》《AIGC 行动营》



本工作坊旨在帮助您掌握利用大型语言模型构建私有知识应用,将企业的私有知识进行有效的萃取及利用。共同探索大模型的潜力,并掌握如何开发个性化、安全性强的企业内部私有知识应用。


培训的提纲包括搭建私有化大模型、LangChain 开发、企业私有知识问答系统,除此之外,还会有动手实操部分,使用 LangChain 搭建本地知识智能客服,包括企业私有知识问答系统、数据解析与切分、向量数据库使用、LangChain+ChatGLM、WebUI 搭建。


培训主题二:基于开源大模型,如何一步一步自己搭建一个自己的私有模型

范煜老师是中国商业联合会数据分析专业委员专家,主要培训方向为大数据及 AI 领域的全场景培训。



本课程从技术和实战角度介绍了类 ChatGPT 私有模型开发过程,涉及现有的预训练模型的增量训练、指令微调、中文支持、推理模型部署、数据集格式等,一步一步指导你搭建一个自己的私有模型。


在培训的过程中,首先是搭建你自己的私有大模型,训练你自己的私有大模型,同时还会在服务器开发环境安装 LLM 权重文件,SFT 训练,模型推理服务部署。


这样的培训,可以解决企业场景应用问题,例如构建企业内部知识智能客服、开发私有知识问答系统等。将所学应用于实际工作场景中,提升工作效率和解决业务挑战。


培训主题三:基于因果一致性的低代码交易平台

康杨老师是京东科技金融科技群 / 架构师,目前整体负责京东支付 PaaS 化改造工作。



在全球供应链整合和云原生、数字化转型的背景下,金融系统也在经历一场重大的历史变革,业务爆发式增⻓,包括用户数量、业务维度、系统复杂度、系统质量要求等多维问题同时出现下,如何利用更先进的企业架构等技术进行企业的数字化转型,实现业务复杂度与技术复杂度的分离,以更好支撑业务的发展,并挖掘技术 & 数据的价值,更好的赋能客户。


通过本次分享,将通过第一性原理揭示分布式系统的时空本质,以及金融级核心系统的业务本质和建模方法,介绍支持百亿交易的账务系统所面临的挑战和应对之道。


培训主题四:领域驱动设计动手实操

王植萌是去哪儿网高级技术总监,2013 年 5 月 8 日加入去哪儿网,目前是去哪儿网技术委员会主席,基础研发团队负责人。主要的研究方向包括:业务架构、DDD 落地实践、技术驱动业务、技术团队管理。



这次培训,会结合之前 DDD 在去哪儿网落地的成功经验,基于 DDD 思想,从业务诉求,到问题域拆解,再到问题域到解决域过渡,并进行的实际落地过程,重点介绍领域架构设计过程及落地经验。


课程重点讲 DDD 落地实践过程:1. 战略设计过程;2. 战术设计过程;3.COLA 四层架构应用;4. 领域版本化建设。学员们在学到 DDD 全面落地后,知道如何使用领域版本化的方法承接公司战略。


扫码或戳此查看培训日程。如果你对某个培训主题感兴趣,或对于培训地点,培训形式有任何疑问,可以直接与票务经理联系:18514549229(微信同手机号)



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-06-20 18:376090

评论

发布
暂无评论
发现更多内容

探索 Pixelmator Pro 3新功能——AI智能模板

Rose

Pixelmator Pro Mac修图软件

软件测试 | 针对看起来很小的代码错误执行后续测试

测吧(北京)科技有限公司

测试

量化合约对冲交易app系统开发源代码

开发微hkkf5566

详解神经网络中反向传播和梯度下降

华为云开发者联盟

人工智能 神经网络 华为云 华为云开发者联盟 企业号 3 月 PK 榜

openEuler用户软件仓(EUR)介绍

openEuler

Linux 操作系统 虚拟机 openEuler 软件包

干货演讲!龙蜥自动化运维平台SysOM 2.0调度、内存相关诊断功能介绍 | 第 70-71 期

OpenAnolis小助手

内存 系统运维 sig 龙蜥大讲堂 SysOM

基于人形检测的划区域客流统计

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 3 月 PK 榜 人形检测

软件测试 | 什么是Logstach

测吧(北京)科技有限公司

测试

软件测试 | 质量控制

测吧(北京)科技有限公司

测试

软件测试 | 使用冒烟测试检验版本

测吧(北京)科技有限公司

测试

BI工具数据看板哪个好,瓴羊Quick BI整不错!

流量猫猫头

告别数据开发中的人工审核!火山引擎DataLeap落地“自动校验开发规范”能力

字节跳动数据平台

大数据 数据治理 数据研发 企业号 3 月 PK 榜

软件测试 | 不要把手工测试与自动化测试等同起来

测吧(北京)科技有限公司

测试

Wasm 原生时代已经来到

SOFAStack

开源 互联网 Wasm

搞定预设,让你的 ChatGPT 不受限制 | 社区征文

极客飞兔

人工智能 聊天机器人 openai ChatGPT

跨端技术或许是提升软件运维效率的利器

FinFish

小程序化 小程序技术 高效运维 软件运维

软件测试 | Elasticsearch+Kibana

测吧(北京)科技有限公司

测试

文档资料多?官方文档怎么找?openEuler文档地图帮你搞定

openEuler

Linux 操作系统 文档 openEuler

技术专家云集,OpenHarmony技术峰会分论坛聚焦内核及视窗创新

Geek_2d6073

科技大势怎么看 2023怎么干?

加入高科技仿生人

人工智能 低代码 科技 数字孪生 6G

Sovit3D平台快速构建智慧渔业三维可视化养殖管理系统

2D3D前端可视化开发

智慧渔业 智慧渔场 智慧水产养殖 数字渔业 渔业数字孪生

Flink Table Store 0.3 构建流式数仓最佳实践

Apache Flink

大数据 flink 实时计算

软件测试 | 测试方法的基于活动的测试手段

测吧(北京)科技有限公司

测试

Nydus 在约苗平台的容器镜像加速实践

SOFAStack

开源 互联网 开发

车企数据分类分级的实践指南出炉!“数据安全推进计划”发布,奇点云参编

奇点云

数据安全 奇点云 数据分类分级 车企

适用于 Apple Silicon (M1芯片)的 Photoshop常见问题及解决方案

魔仙苹果mac堡

PhotoShop PS常见问题

M1电脑运行Windows10弹出“内部版本已过期”的解决方法

Rose

pd虚拟机 M1电脑 Windows内部版本已经过期

ChatGPT 仅仅是一款工具而已 | 社区征文

小鑫同学

ChatGPT

全景剖析阿里云容器网络数据链路(六):ASM Istio

阿里巴巴中间件

阿里云 容器 云原生

从原生迈向混合,小而美团队如何搞定APP高效定制

华为云开发者联盟

App 华为云 定制开发 华为云开发者联盟 企业号 3 月 PK 榜

Nacos+ThreadPoolExecutor构建动态线程池

小小怪下士

Java 程序员 线程池

深度培训|手把手教你在开源基础上构建私有大模型和知识库_业务架构_侯洁_InfoQ精选文章