【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

深度培训|手把手教你在开源基础上构建私有大模型和知识库

  • 2023-06-20
    北京
  • 本文字数:1506 字

    阅读完需:约 5 分钟

深度培训|手把手教你在开源基础上构建私有大模型和知识库

经过和大量的企业同行交流,收集大家的需求点,我们发现很多企业都对于利用开源的模型构建私有的模型,并利用大型语言模型构建私有知识应用,将企业的私有知识进行有效的萃取及使用很感兴趣。


于是在今年的 7 月和 8 月,我们在北京和上海分别策划了线下深度培训,邀请业界资深专家陈旸博士,和范煜来分享如何动手构建大模型并使用大模型开发应用。


此外,在 7 月深圳站 ArchSummit 会后,也将召开一场深度培训,特别邀请了去哪儿网王植萌、京东金融康阳分别从领域驱动设计和系统高可用性方面,深度解读这些技术从设计到落地的细节。


培训主题一:基于大模型的私有知识应用开发

陈旸 博士:阿里云 MVP,数字化转型专家。清华大学计算机博士,阿里云 MVP,腾讯云 TVP,百度 AI 比赛教练,百度 PPDE,数字化转型专家,著有《数据分析实战》《SQL 必知必会》《AIGC 行动营》



本工作坊旨在帮助您掌握利用大型语言模型构建私有知识应用,将企业的私有知识进行有效的萃取及利用。共同探索大模型的潜力,并掌握如何开发个性化、安全性强的企业内部私有知识应用。


培训的提纲包括搭建私有化大模型、LangChain 开发、企业私有知识问答系统,除此之外,还会有动手实操部分,使用 LangChain 搭建本地知识智能客服,包括企业私有知识问答系统、数据解析与切分、向量数据库使用、LangChain+ChatGLM、WebUI 搭建。


培训主题二:基于开源大模型,如何一步一步自己搭建一个自己的私有模型

范煜老师是中国商业联合会数据分析专业委员专家,主要培训方向为大数据及 AI 领域的全场景培训。



本课程从技术和实战角度介绍了类 ChatGPT 私有模型开发过程,涉及现有的预训练模型的增量训练、指令微调、中文支持、推理模型部署、数据集格式等,一步一步指导你搭建一个自己的私有模型。


在培训的过程中,首先是搭建你自己的私有大模型,训练你自己的私有大模型,同时还会在服务器开发环境安装 LLM 权重文件,SFT 训练,模型推理服务部署。


这样的培训,可以解决企业场景应用问题,例如构建企业内部知识智能客服、开发私有知识问答系统等。将所学应用于实际工作场景中,提升工作效率和解决业务挑战。


培训主题三:基于因果一致性的低代码交易平台

康杨老师是京东科技金融科技群 / 架构师,目前整体负责京东支付 PaaS 化改造工作。



在全球供应链整合和云原生、数字化转型的背景下,金融系统也在经历一场重大的历史变革,业务爆发式增⻓,包括用户数量、业务维度、系统复杂度、系统质量要求等多维问题同时出现下,如何利用更先进的企业架构等技术进行企业的数字化转型,实现业务复杂度与技术复杂度的分离,以更好支撑业务的发展,并挖掘技术 & 数据的价值,更好的赋能客户。


通过本次分享,将通过第一性原理揭示分布式系统的时空本质,以及金融级核心系统的业务本质和建模方法,介绍支持百亿交易的账务系统所面临的挑战和应对之道。


培训主题四:领域驱动设计动手实操

王植萌是去哪儿网高级技术总监,2013 年 5 月 8 日加入去哪儿网,目前是去哪儿网技术委员会主席,基础研发团队负责人。主要的研究方向包括:业务架构、DDD 落地实践、技术驱动业务、技术团队管理。



这次培训,会结合之前 DDD 在去哪儿网落地的成功经验,基于 DDD 思想,从业务诉求,到问题域拆解,再到问题域到解决域过渡,并进行的实际落地过程,重点介绍领域架构设计过程及落地经验。


课程重点讲 DDD 落地实践过程:1. 战略设计过程;2. 战术设计过程;3.COLA 四层架构应用;4. 领域版本化建设。学员们在学到 DDD 全面落地后,知道如何使用领域版本化的方法承接公司战略。


扫码或戳此查看培训日程。如果你对某个培训主题感兴趣,或对于培训地点,培训形式有任何疑问,可以直接与票务经理联系:18514549229(微信同手机号)



公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-06-20 18:376070

评论

发布
暂无评论
发现更多内容

Day346&347&348&349

爱好编程进阶

程序员 后端开发

“银行家算法”大揭秘!在前端表格中利用自定义公式实现“四舍六入五成双”

葡萄城技术团队

银行家算法 纯前端表格技术

「码」力集结!他们用作品为FinClip黑客松打造出一道靓丽的风景线

Speedoooo

小程序 hackathon 黑客马拉松 黑客松 小程序容器

ansible 模块:add_host

ghostwritten

ansible

idea启动tomcat报错,org

爱好编程进阶

Java 程序员 后端开发

HIVE3 深度剖析 (上篇)

明哥的IT随笔

大数据 hie

基于 FFI 的 PyFlink 下一代 Python 运行时介绍

Apache Flink

大数据 flink 编程 流计算 实时计算

CountDownLatch、CyclicBarrier和Semaphore区别及底层原理

爱好编程进阶

Java 程序员 后端开发

Day177

爱好编程进阶

Java 程序员 后端开发

Eclipse中查看源代码

爱好编程进阶

Java 程序员 后端开发

hive踩过的小坑

爱好编程进阶

Java 程序员 后端开发

无形资产管理系统解决方案

低代码小观

资产管理 CRM 财务审核系统 CRM系统 企业管理软件

容器化 | 构建 RadonDB MySQL 集群监控平台

RadonDB

MySQL 数据库 容器化 RadonDB KubeSphere

AIRIOT物联网低代码平台如何配置MQTT驱动?

AIRIOT

物联网 低代码平台 驱动配置

Go1.18泛型浅谈

CodeWithBuff

golang 泛型 新特性 Go 语言

还在写SQL做SAP二开?通过RFC调用NetWeaver,让HANA数据库操作更可靠

葡萄城技术团队

ERP 全套信息化系统 二开

拿起手中的键盘做公益侠客,让你的第一个低代码应用为公益发光发热!

InfoQ写作社区官方

低代码 公益 大学生 热门活动 码上公益

Apache DolphinScheduler 2.X保姆级源码解析,中国移动工程师揭秘服务调度启动全流程

Apache DolphinScheduler

Apache 大数据 开源 DolphinScheduler workflow

IntelliJ IDEA开发最佳配置

爱好编程进阶

Java 程序员 后端开发

ansible 模块:script

ghostwritten

ansible

美哭了,一款开发者必备的接口管理工具!

Liam

Postman 开发工具 API API接口管理 接口管理工具

Hugging Face创始人亲述:一个GitHub史上增长最快的AI项目

OneFlow

人工智能 深度学习 nlp 开源社区

Day274

爱好编程进阶

Java 程序员 后端开发

docker下kibana搭建

爱好编程进阶

Java 程序员 后端开发

ansible 模块:set_fact

ghostwritten

ansible

萌新看过来,你还学不懂VScode插件吗?

葡萄城技术团队

报表

ansible template jinja2 渲染

ghostwritten

ansible

ansible 模块:blockinfile

ghostwritten

ansible

IO流详细解答,博主亲自手敲代码,快速上手

爱好编程进阶

Java 程序员 后端开发

当.Net撞上BI可视化,这3种“套路”你必须知道

葡萄城技术团队

看板 数据大屏 BI数据分析

企业文档爆炸,如何管?

小炮

企业文档管理工具

深度培训|手把手教你在开源基础上构建私有大模型和知识库_业务架构_侯洁_InfoQ精选文章