写点什么

“驯服”可控大模型,白海发布一站式大模型微调平台 IDP LM

  • 2023-06-29
    北京
  • 本文字数:1491 字

    阅读完需:约 5 分钟

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM

ChatGPT 的破圈之旅,拉开了大模型“诸神之战”的序幕,据不完全统计,2020 年至 2023 年间,中国已发布了 79 个参数在 10 亿规模以上的大模型。而仅仅 2023 年前 5 个月,中国以 19 个大模型开发数量位居榜首,国内典型大模型包括:阿里的 M6,百度的文心大模型,华为的盘古,科大讯飞的星火,商汤的日日新,智谱科技的 ChatGLM 等,共同打造完整的中国大模型生态链路。


然而,在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型。


而对于不同行业、场景和客户来说,大模型要落到垂直细分行业中,才能发挥其应有价值,可控的大模型才是有意义的。为了增强大模型在特定领域或任务上的表现,通常需要对基础大模型进行针对性的高质量微调。然而,如何实现高效和可控的微调是当前行业大模型构建面临的普遍挑战。


白海 IDP(Intelligent Development Platform) LM 致力于帮助客户克服这一挑战,通过提供一站式的大模型微调工具,来“驯服”大模型,实现用低门槛、高效和可控的方式来构建垂直行业专属大模型,具体目标包括为客户提供:

  • 干净、准确的微调训练数据

  • 严格的反馈回流数据审核

  • 全面、综合的模型评估

  • 高效高性能的微调和推理服务


IDP LM 工具化了大模型微调技术(RLHF)的全流程,不仅技术人员,业务人员也可以轻松进行模型微调。同时,IDP LM 提供预训练的领域模型,极大地降低了大模型微调应用的门槛和冷启动成本。除低门槛、低成本外,我们一直坚信,对于大模型在具体行业或场景的应用落地,“可控”是必须的。


在去年 Stable Diffusion 的微调工具构建时,我们就明确了白海的生成式 AI/大模型加速平台的 SQL 目标:即安全可控(Safe)+ 合格(Qualified) + 低成本/低门槛 (Low cost ) 。


“AI 画作《太空歌剧院》为例,这幅画在美术比赛上拔得头筹惊艳四座,但背后生成了 900 多个版本,耗费 80 多个小时,才得到最终的作品。该画基于扩散模型生成,作为潜在变量模型,扩散模型赋予了 AIGC 开放性的创造力,但可控性仍不尽如人意,无法限制在一个具体的预期里,这对商业化会带来很多问题。” 创始人卢亿雷曾表示,”不仅对于 AI 绘画模型如此,大语言模型的行业应用更是面临可控性的挑战。在实际的行业应用中,如金融、医疗等,问答的不可控会带来严峻的后果。“


因此,IDP LM 除了在将大模型微调流程训练工具化外,在数据的处理、数据标注、数据审核和模型评估方面也提供了易用的工具和经验证的高效方法。

  • 在数据清洗和数据增强方面,自动支持数据清洗、同义词替换、随机插入、随机删除、句子重组等。

  • 数据标注方面,我们提供适用于大模型场景的标注工具,如答案质量打分,答案补充,便捷高效的支持数据的标注和数据的训练应用。

  • IDP LM 同时提供自动化的反馈数据回流与应用,这一过程中,对反馈数据的质量审核至关重要。IDP LM 为审核员提供了专门的看板,并基于系统算法提供审核建议和指导,保证反馈回流数据的质量、有效、无害。


大模型的有效评估也是影响模型效果的重要环节。IDP LM 支持自动评估和人工评估,从准确度、安全性、稳定性、领域的专业适用性等角度,对模型效果进行严格把关。IDP LM 目前已在交互式数字人、AI 问诊等领域服务企业客户。我们将继续在重点行业深耕,为客户提供更加简单、易用、完善的大模型构建工具和解决方案支持。


我们始终以“让 AI 更简单、更快速、更高效“的使命为指引,IDP LM 的推出是践行这一使命的重要一步。我们诚挚邀请行业客户和产业链的伙伴和白海 IDP LM 一同,推动大模型在各行业的应用价值创造,驯服可控大模型的为垂直行业及场景所用。

2023-06-29 16:565039
用户头像

发布了 113 篇内容, 共 78.1 次阅读, 收获喜欢 206 次。

关注

评论

发布
暂无评论
发现更多内容

财务或类财务系统数值精度设计

路边水果摊

数字 财务 精度 数值

小师妹学IO系列文章集合-附PDF下载

程序那些事

Java io nio 程序那些事

音视频时代你还不会NDK开发?看完必懂

欢喜学安卓

android 程序员 面试 移动开发

开源 Rainbond 5.3.2 版本发布,易用的云原生应用管理平台

Barnett

云计算 开源 基础软件 小版本升级

我的职场规划

escray

学习 极客时间 朱赟的技术管理课 7月日更

一例智能网卡(mellanox)的网卡故障分析

安第斯智能云

后端

风险投资

stars

手写计数排序算法

实力程序员

程序员 C语言 排序算法 造轮子

手写桶排序算法

实力程序员

程序员 C语言 排序算法

短视频获客软件系统开发公司

今天,2021可信云大会即将开幕!

云计算 云原生 可信云

Python OpenCV Canny 边缘检测知识补充

梦想橡皮擦

Python 7月日更

带你认识MindSpore量子机器学习库MindQuantum

华为云开发者联盟

mindspore 量子机器 MindQuantum 量子机器学习库

GitHub 如何创建 Access Token

HoneyMoose

抖音获客系统开发

获客I3O6O643Z97

抖音 头条抖音 抖音霸屏

英特尔加速制程工艺和封装技术创新

E科讯

论文解读丨Zero-Shot场景下的信息结构化提取

华为云开发者联盟

测试 图网络 信息结构化 图卷积网络 zero-shot

Vue进阶(九十八):Vue.set() 和 this.$set()

No Silver Bullet

Vue 7月日更 $set 动态赋值

短视频智能询盘获客系统开发

AI开发者十问:10分钟了解AI开发的基本过程

华为云开发者联盟

AI 框架 modelarts hilens

音视频时代你还不会NDK开发?详细的Android学习指南

欢喜学安卓

android 程序员 面试 移动开发

一个Android程序员的腾讯面试心得,进阶学习资料!

欢喜学安卓

android 面试 移动开发 程序猿

外包学生管理系统的架构设计

面向对象的猫

SpringBoot启动加载监听器以及监听应用启动阶段事件

捡对象的cy

springboot

给新手学习MySQL的建议

Simon

MySQL

Vue进阶(九十七):对象动态添加属性和值

No Silver Bullet

Vue 7月日更 $set 动态赋值

图解红黑树

Ayue、

数据结构

私域流量系统开发,APP源码搭建

获客I3O6O643Z97

私域流量 抖音霸屏

国际视频质量评估算法竞赛:火山引擎成功夺冠

CWE发布2021年最危险的25种软件缺陷

华为云开发者联盟

安全 隐私保护 安全漏洞 cwe 软件缺陷

经典译文 | 项目经理必读的基本工作法则

LigaAI

项目管理 项目经理

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM_生成式 AI_InfoQ编辑部_InfoQ精选文章