“驯服”可控大模型，白海发布一站式大模型微调平台IDP LM

ChatGPT 的破圈之旅，拉开了大模型“诸神之战”的序幕，据不完全统计，2020 年至 2023 年间，中国已发布了 79 个参数在 10 亿规模以上的大模型。而仅仅 2023 年前 5 个月，中国以 19 个大模型开发数量位居榜首，国内典型大模型包括：阿里的 M6，百度的文心大模型，华为的盘古，科大讯飞的星火，商汤的日日新，智谱科技的 ChatGLM 等，共同打造完整的中国大模型生态链路。

然而，在大模型如火如荼的背后，幻觉（hallucination）倾向就越发的明显，它正在越发的生产着 “完全没有出处的非真实内容”。这样对于商业化而言是一个巨大的挑战，来面对一个不可控、不可预测和不可靠的大模型。

而对于不同行业、场景和客户来说，大模型要落到垂直细分行业中，才能发挥其应有价值，可控的大模型才是有意义的。为了增强大模型在特定领域或任务上的表现，通常需要对基础大模型进行针对性的高质量微调。然而，如何实现高效和可控的微调是当前行业大模型构建面临的普遍挑战。

白海 IDP(Intelligent Development Platform) LM 致力于帮助客户克服这一挑战，通过提供一站式的大模型微调工具，来“驯服”大模型，实现用低门槛、高效和可控的方式来构建垂直行业专属大模型，具体目标包括为客户提供：

干净、准确的微调训练数据
严格的反馈回流数据审核
全面、综合的模型评估
高效高性能的微调和推理服务

IDP LM 工具化了大模型微调技术（RLHF）的全流程，不仅技术人员，业务人员也可以轻松进行模型微调。同时，IDP LM 提供预训练的领域模型，极大地降低了大模型微调应用的门槛和冷启动成本。除低门槛、低成本外，我们一直坚信，对于大模型在具体行业或场景的应用落地，“可控”是必须的。

在去年 Stable Diffusion 的微调工具构建时，我们就明确了白海的生成式 AI/大模型加速平台的 SQL 目标：即安全可控(Safe)+ 合格（Qualified) + 低成本/低门槛 (Low cost ) 。

“AI 画作《太空歌剧院》为例，这幅画在美术比赛上拔得头筹惊艳四座，但背后生成了 900 多个版本，耗费 80 多个小时，才得到最终的作品。该画基于扩散模型生成，作为潜在变量模型，扩散模型赋予了 AIGC 开放性的创造力，但可控性仍不尽如人意，无法限制在一个具体的预期里，这对商业化会带来很多问题。” 创始人卢亿雷曾表示，”不仅对于 AI 绘画模型如此，大语言模型的行业应用更是面临可控性的挑战。在实际的行业应用中，如金融、医疗等，问答的不可控会带来严峻的后果。“

因此，IDP LM 除了在将大模型微调流程训练工具化外，在数据的处理、数据标注、数据审核和模型评估方面也提供了易用的工具和经验证的高效方法。

在数据清洗和数据增强方面，自动支持数据清洗、同义词替换、随机插入、随机删除、句子重组等。
数据标注方面，我们提供适用于大模型场景的标注工具，如答案质量打分，答案补充，便捷高效的支持数据的标注和数据的训练应用。
IDP LM 同时提供自动化的反馈数据回流与应用，这一过程中，对反馈数据的质量审核至关重要。IDP LM 为审核员提供了专门的看板，并基于系统算法提供审核建议和指导，保证反馈回流数据的质量、有效、无害。

大模型的有效评估也是影响模型效果的重要环节。IDP LM 支持自动评估和人工评估，从准确度、安全性、稳定性、领域的专业适用性等角度，对模型效果进行严格把关。IDP LM 目前已在交互式数字人、AI 问诊等领域服务企业客户。我们将继续在重点行业深耕，为客户提供更加简单、易用、完善的大模型构建工具和解决方案支持。

我们始终以“让 AI 更简单、更快速、更高效“的使命为指引，IDP LM 的推出是践行这一使命的重要一步。我们诚挚邀请行业客户和产业链的伙伴和白海 IDP LM 一同，推动大模型在各行业的应用价值创造，驯服可控大模型的为垂直行业及场景所用。

创作场景

“驯服”可控大模型，白海发布一站式大模型微调平台 IDP LM