2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

“驯服”可控大模型,白海发布一站式大模型微调平台 IDP LM

  • 2023-06-29
    北京
  • 本文字数:1491 字

    阅读完需:约 5 分钟

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM

ChatGPT 的破圈之旅,拉开了大模型“诸神之战”的序幕,据不完全统计,2020 年至 2023 年间,中国已发布了 79 个参数在 10 亿规模以上的大模型。而仅仅 2023 年前 5 个月,中国以 19 个大模型开发数量位居榜首,国内典型大模型包括:阿里的 M6,百度的文心大模型,华为的盘古,科大讯飞的星火,商汤的日日新,智谱科技的 ChatGLM 等,共同打造完整的中国大模型生态链路。


然而,在大模型如火如荼的背后,幻觉(hallucination)倾向就越发的明显,它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战,来面对一个不可控、不可预测和不可靠的大模型。


而对于不同行业、场景和客户来说,大模型要落到垂直细分行业中,才能发挥其应有价值,可控的大模型才是有意义的。为了增强大模型在特定领域或任务上的表现,通常需要对基础大模型进行针对性的高质量微调。然而,如何实现高效和可控的微调是当前行业大模型构建面临的普遍挑战。


白海 IDP(Intelligent Development Platform) LM 致力于帮助客户克服这一挑战,通过提供一站式的大模型微调工具,来“驯服”大模型,实现用低门槛、高效和可控的方式来构建垂直行业专属大模型,具体目标包括为客户提供:

  • 干净、准确的微调训练数据

  • 严格的反馈回流数据审核

  • 全面、综合的模型评估

  • 高效高性能的微调和推理服务


IDP LM 工具化了大模型微调技术(RLHF)的全流程,不仅技术人员,业务人员也可以轻松进行模型微调。同时,IDP LM 提供预训练的领域模型,极大地降低了大模型微调应用的门槛和冷启动成本。除低门槛、低成本外,我们一直坚信,对于大模型在具体行业或场景的应用落地,“可控”是必须的。


在去年 Stable Diffusion 的微调工具构建时,我们就明确了白海的生成式 AI/大模型加速平台的 SQL 目标:即安全可控(Safe)+ 合格(Qualified) + 低成本/低门槛 (Low cost ) 。


“AI 画作《太空歌剧院》为例,这幅画在美术比赛上拔得头筹惊艳四座,但背后生成了 900 多个版本,耗费 80 多个小时,才得到最终的作品。该画基于扩散模型生成,作为潜在变量模型,扩散模型赋予了 AIGC 开放性的创造力,但可控性仍不尽如人意,无法限制在一个具体的预期里,这对商业化会带来很多问题。” 创始人卢亿雷曾表示,”不仅对于 AI 绘画模型如此,大语言模型的行业应用更是面临可控性的挑战。在实际的行业应用中,如金融、医疗等,问答的不可控会带来严峻的后果。“


因此,IDP LM 除了在将大模型微调流程训练工具化外,在数据的处理、数据标注、数据审核和模型评估方面也提供了易用的工具和经验证的高效方法。

  • 在数据清洗和数据增强方面,自动支持数据清洗、同义词替换、随机插入、随机删除、句子重组等。

  • 数据标注方面,我们提供适用于大模型场景的标注工具,如答案质量打分,答案补充,便捷高效的支持数据的标注和数据的训练应用。

  • IDP LM 同时提供自动化的反馈数据回流与应用,这一过程中,对反馈数据的质量审核至关重要。IDP LM 为审核员提供了专门的看板,并基于系统算法提供审核建议和指导,保证反馈回流数据的质量、有效、无害。


大模型的有效评估也是影响模型效果的重要环节。IDP LM 支持自动评估和人工评估,从准确度、安全性、稳定性、领域的专业适用性等角度,对模型效果进行严格把关。IDP LM 目前已在交互式数字人、AI 问诊等领域服务企业客户。我们将继续在重点行业深耕,为客户提供更加简单、易用、完善的大模型构建工具和解决方案支持。


我们始终以“让 AI 更简单、更快速、更高效“的使命为指引,IDP LM 的推出是践行这一使命的重要一步。我们诚挚邀请行业客户和产业链的伙伴和白海 IDP LM 一同,推动大模型在各行业的应用价值创造,驯服可控大模型的为垂直行业及场景所用。

2023-06-29 16:564905
用户头像

发布了 113 篇内容, 共 75.9 次阅读, 收获喜欢 206 次。

关注

评论

发布
暂无评论
发现更多内容

关于减碳你是否有很多问号?施家碳中和咨询服务来了!

ToB行业头条

共建龙蜥社区,支撑商业建设

OpenAnolis小助手

Linux 开源 开发者

4种高速安全混合云解决方案,助力您的云迁移之旅!

亚马逊云科技 (Amazon Web Services)

计算

利用 Amazon Batch 来为容器化负载调用海量云端算力

亚马逊云科技 (Amazon Web Services)

计算

详解数据湖:概念、特征与架构

五分钟学大数据

数据湖 1月月更

做网络安全竟然不了解ATT&CK?这篇文章的介绍详细到令人尖叫

博文视点Broadview

🍃【Spring专题】「技术原理」为大家介绍一下Spring中的Ant路径匹配工具组件AntPathMatcher

码界西柚

spring 1月月更 SpringFramework AntPathMatcher

增效降本开源节流,2022年技术趋势前瞻(异步编程/容器技术)

刘悦的技术博客

容器 性能 异步IO 异步削峰 成本优化

隐喻回顾会

Bruce Talk

敏捷 Agile 回顾会 Coach/Facilitate

Go Error 嵌套到底是怎么实现的?

AlwaysBeta

Go 源码 源码阅读 Go 语言 源码学习

MASA Framework - EventBus设计

MASA技术团队

C# .net 微软 框架 Framework

【伙伴故事】一盏智能灯,点亮家庭和工业照明的新未来

华为云开发者联盟

物联网 华为云 AIOT PLC 智能照明

MobTech观察 | CSDN:企业数字化转型如何提升段位?杨冠军畅谈企业数字化前世今生

MobTech袤博科技

数据分析 数字化转型 数据治理 企业 数据可视化

武汉智慧城市建设新名片 一城一云打造数字经济新引擎

InfoQ_967a83c6d0d7

针对jQuery的优化方法有哪些

编程江湖

jquery

中小型企业过等保困难有哪些?如何解决?

行云管家

网络安全 企业 过等保

4种Spring Boot 实现通用 Auth 认证方式

华为云开发者联盟

拦截器 spring-boot Auth 传统AOP 参数解析器

Hoo虎符研究院 | 币圈后浪——Osmosis一种高级AMM协议

区块链前沿News

Hoo 虎符交易所 虎符研究院

面试官: Flink双流JOIN了解吗? 简单说说其实现原理

华为云开发者联盟

sql flink join 双流join 数据库SQL

使用Amazon CDK部署基于Amazon Fargate的高可用、易扩展的Airflow集群

亚马逊云科技 (Amazon Web Services)

计算

全面容器化之后,来电科技如何实现微服务治理?

阿里巴巴云原生

阿里云 微服务 云原生 实践

【等保小知识】等级保护工作是指等保测评吗?意思一样吗?

行云管家

网络安全 等保 等保测评

开源操作系统年度技术会议演讲PPT下载来啦!

鉴释

开源 操作系统

快过年了,用五种不同的JS特效带你看烟花

海拥(haiyong.site)

大前端 js 28天写作 前端特效 1月月更

理清逻辑,确保云原生时代应用开发的全生命周期安全

华为云开发者联盟

网络安全 安全 应用开发 安全防守

喜讯!Apache APISIX Committer 张晋涛当选「中国开源先锋 33 人」

API7.ai 技术团队

云原生 微服务网关 APISIX 网关

零数科技入选毕马威中国“2021领先金融科技50企业”

科技热闻

知识中台,驱动产业智能化升级

百度大脑

人工智能

通过 Amazon CloudWatch 配合 Amazon ElastiCache for Redis 遵循监控最佳实践

亚马逊云科技 (Amazon Web Services)

计算

移动数字化平台如何让企业生态协同更高效?

BeeWorks

大数据开发之Hadoop高频面试题

@零度

大数据 hadoop

“驯服”可控大模型,白海发布一站式大模型微调平台IDP LM_生成式 AI_InfoQ编辑部_InfoQ精选文章