写点什么

“驯服”可控大模型,白海发布一站式大模型微调平台 IDP LM

  • 2023-06-29
    北京
  • 本文字数:1491 字

    阅读完需:约 5 分钟

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM

ChatGPT 的破圈之旅,拉开了大模型“诸神之战”的序幕,据不完全统计,2020 年至 2023 年间,中国已发布了 79 个参数在 10 亿规模以上的大模型。而仅仅 2023 年前 5 个月,中国以 19 个大模型开发数量位居榜首,国内典型大模型包括:阿里的 M6,百度的文心大模型,华为的盘古,科大讯飞的星火,商汤的日日新,智谱科技的 ChatGLM 等,共同打造完整的中国大模型生态链路。


然而,在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型。


而对于不同行业、场景和客户来说,大模型要落到垂直细分行业中,才能发挥其应有价值,可控的大模型才是有意义的。为了增强大模型在特定领域或任务上的表现,通常需要对基础大模型进行针对性的高质量微调。然而,如何实现高效和可控的微调是当前行业大模型构建面临的普遍挑战。


白海 IDP(Intelligent Development Platform) LM 致力于帮助客户克服这一挑战,通过提供一站式的大模型微调工具,来“驯服”大模型,实现用低门槛、高效和可控的方式来构建垂直行业专属大模型,具体目标包括为客户提供:

  • 干净、准确的微调训练数据

  • 严格的反馈回流数据审核

  • 全面、综合的模型评估

  • 高效高性能的微调和推理服务


IDP LM 工具化了大模型微调技术(RLHF)的全流程,不仅技术人员,业务人员也可以轻松进行模型微调。同时,IDP LM 提供预训练的领域模型,极大地降低了大模型微调应用的门槛和冷启动成本。除低门槛、低成本外,我们一直坚信,对于大模型在具体行业或场景的应用落地,“可控”是必须的。


在去年 Stable Diffusion 的微调工具构建时,我们就明确了白海的生成式 AI/大模型加速平台的 SQL 目标:即安全可控(Safe)+ 合格(Qualified) + 低成本/低门槛 (Low cost ) 。


“AI 画作《太空歌剧院》为例,这幅画在美术比赛上拔得头筹惊艳四座,但背后生成了 900 多个版本,耗费 80 多个小时,才得到最终的作品。该画基于扩散模型生成,作为潜在变量模型,扩散模型赋予了 AIGC 开放性的创造力,但可控性仍不尽如人意,无法限制在一个具体的预期里,这对商业化会带来很多问题。” 创始人卢亿雷曾表示,”不仅对于 AI 绘画模型如此,大语言模型的行业应用更是面临可控性的挑战。在实际的行业应用中,如金融、医疗等,问答的不可控会带来严峻的后果。“


因此,IDP LM 除了在将大模型微调流程训练工具化外,在数据的处理、数据标注、数据审核和模型评估方面也提供了易用的工具和经验证的高效方法。

  • 在数据清洗和数据增强方面,自动支持数据清洗、同义词替换、随机插入、随机删除、句子重组等。

  • 数据标注方面,我们提供适用于大模型场景的标注工具,如答案质量打分,答案补充,便捷高效的支持数据的标注和数据的训练应用。

  • IDP LM 同时提供自动化的反馈数据回流与应用,这一过程中,对反馈数据的质量审核至关重要。IDP LM 为审核员提供了专门的看板,并基于系统算法提供审核建议和指导,保证反馈回流数据的质量、有效、无害。


大模型的有效评估也是影响模型效果的重要环节。IDP LM 支持自动评估和人工评估,从准确度、安全性、稳定性、领域的专业适用性等角度,对模型效果进行严格把关。IDP LM 目前已在交互式数字人、AI 问诊等领域服务企业客户。我们将继续在重点行业深耕,为客户提供更加简单、易用、完善的大模型构建工具和解决方案支持。


我们始终以“让 AI 更简单、更快速、更高效“的使命为指引,IDP LM 的推出是践行这一使命的重要一步。我们诚挚邀请行业客户和产业链的伙伴和白海 IDP LM 一同,推动大模型在各行业的应用价值创造,驯服可控大模型的为垂直行业及场景所用。

2023-06-29 16:564935
用户头像

发布了 113 篇内容, 共 76.4 次阅读, 收获喜欢 206 次。

关注

评论

发布
暂无评论
发现更多内容

进程崩溃/应用卡死,故障频频怎么办?|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

一文读懂 Apache Pulsar

了凡跨境洞察

云原生 Apache Pulsar 消息系统 数据流 Apache Pulsar 社区

面试官:你是怎样理解Fiber的

全栈潇晨

React react fiber

react源码解析6.legacy模式和concurrent模式

buchila11

React

从0到1教你如何使用 p5.js 绘制简单的动画

海拥(haiyong.site)

大前端 动画 28天写作 签约计划第二季 12月日更

前端开发:npm run serve和npm run dev的区别

三掌柜

28天写作 21天挑战 12月日更

react源码解析3.react源码架构

buchila11

React react fiber

让工具成为双手的延伸

Zilliz

数据库 书籍推荐 程序 书籍

Flutter 自定义 ACEFoldTextView 折叠文本

阿策小和尚

28天写作 0 基础学习 Flutter 内容合集 签约计划第二季 12月日更

安全办公 |企业级IM即时通讯私有云解决方案

BeeWorks

Linux运维,Linux系统学习

侠盗安全

Linux linux运维 运维工程师 云计算架构师

这套神奇的个人信息管理系统,带我一步步进入互联网大厂

博文视点Broadview

双 11 大促会场开发提效解析:前端智能化落地实践

凹凸实验室

机器学习 大前端 智能代码

从 0-15 套存储集群,YRCloudFile 助力 AI 训练效率“超线性增长”

焱融科技

人工智能 云计算 分布式 高性能 文件存储

如期而至-用户购买时间预测(下)

索信达控股

模型 购买预测 购买行为 精准营销

高并发多方案秒杀架构

MetaThoughts

Redis(一):单线程为何还能这么快?

IT巅峰技术

redis 分布式 架构师 分布式缓存 Java Redis

CANN5.0黑科技解密 | 高并发图片视频处理,为出行保驾,为生活添彩!

华为云开发者联盟

高并发 图像预处理 CANN 昇腾 异构计算

DataPipeline与TiDB推出异构数据实时同步解决方案,共筑安全可信基础设施

DataPipeline数见科技

数据库 大数据 中间件 数据融合 数据管理

Android C++系列:Linux网络(三)协议格式

轻口味

c++ android 28天写作 12月日更

【LeetCode】最短补全词Java题解

Albert

算法 LeetCode 12月日更

科创人·StreamNative翟佳:开源模式价值为王,基础软件的未来在国内社区

科创人

大厂面试算法题之数组

程序员学长

数据结构 算法 大厂面试

前端性能优化 24 条建议

编程江湖

大前端

SAP Spartacus Session affinity

汪子熙

后端 28天写作 12月日更 Spartacus 会话

Go语言学习查缺补漏ing Day7

恒生LIGHT云社区

golang Go 语言 编程语言‘

全链路数据血缘在满帮的实践

华为云开发者联盟

sql 图数据库 图计算 全链路数据血缘 数据血缘

为啥你写的代码老有大串的if/else?

华为云开发者联盟

代码 if for循环 else

Java 程序员必须掌握的 10 款开源工具

编程江湖

java编程 java开发工具

数据库事务的三个元问题

Zilliz

数据库 数据库设计

Java开发之环境搭建基础教程

@零度

Java 开发环境搭建

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM_生成式 AI_InfoQ编辑部_InfoQ精选文章