写点什么

Databricks Agent Bricks 使用 TAO 和 ALHF 方法自动化企业 AI 开发

作者:Vinod Goje

  • 2025-07-30
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:911.40K时长:05:11
Databricks Agent Bricks使用TAO和ALHF方法自动化企业AI开发

Databricks推出了Agent Bricks,这是一种新产品,它改变了企业开发特定领域智能体的方式。该平台通过允许团队专注于定义智能体的目的,并提供通过自然语言反馈的战略指导来提高质量,从而解决了智能体开发的复杂性问题。“Agent Bricks 处理剩下的工作,自动生成评估套件并自动优化质量,”该公司表示。自动化工作流程包括生成特定任务的评估和 LLM 裁判以进行质量评估,创建类似于客户数据的合成数据以补充智能体学习,以及搜索优化技术以完善智能体性能。


来源:Databricks Agent Bricks

 

Agent Bricks通过一个四步自动化工作流程进行操作,当用户通过选择他们的目标、用自然语言定义他们希望智能体完成的高级描述,并连接他们的数据源来声明他们的任务时,工作流程开始。然后平台启动自动评估,其中 Agent Bricks 自动创建特定于任务的评估基准,可能涉及合成生成新数据或构建自定义 LLM 裁判。

 

系统继续进行自动优化,Agent Bricks 智能地搜索和组合各种优化技术,如提示工程、模型微调、奖励模型或测试自适应优化(TAO)以实现高质量。最后阶段涉及成本和质量,因为 Agent Bricks 确保智能体不仅高效而且具有成本效益,允许用户选择成本优化或质量优化模型。“在许多情况下,与其他 DIY 方法相比,最终解决方案的质量更高,成本更低。”公司表示。

 

Agent Bricks 结合了智能体学习的最新研究,Databricks强调了一个关键创新,称为从人类反馈中学习的智能体(ALHF)。公司识别出一个质量挑战,即从反馈中引导智能体行为被证明是困难的,因为反馈通常以简单的点赞与否的信号出现,这使得不清楚智能体系统中的哪些组件需要调整。当前的方法将所有指令打包成一个庞大的 LLM 提示,Databricks 将其描述为脆弱且无法推广到更复杂的智能体系统。ALHF 通过两种方法解决这个问题:从自然语言指导中接收丰富的上下文,并使用算法智能地将这些指导转化为技术优化,如完善检索算法、增强提示、过滤向量数据库或修改代理式模式

 

Databricks 还引入了测试时自适应优化(TAO),这是一种新的模型调整方法,只需要未标记的使用数据,让企业使用现有数据提高 AI 的质量和成本。该方法利用测试时计算和强化学习来教模型仅根据过去的输入示例更好地执行任务,用可调调优的计算预算而不是人工标记工作进行扩展。“即使没有标记数据,TAO 也能实现比传统微调更好的模型质量,它可以将像 Llama 这样的廉价开源模型的质量提升到像 GPT-4o 和 o3-mini 这样的昂贵专有模型的质量范围内。”公司表示

 

Databricks 的Mosaic AI智能体评估帮助开发人员评估代理式 AI 应用的质量、成本和延迟,包括RAG应用和链。该工具识别质量问题,并确定这些问题的根本原因,涵盖MLOps生命周期的开发、预发和生产阶段,所有评估指标和数据都记录在MLflow运行中。智能体评估在开发和生产环境之间保持一致,使团队能够快速迭代、评估、部署和监控代理式应用。环境之间的主要区别在于地面真实标签的可用性,这允许智能体评估在开发期间计算额外的质量指标。

 

Agent Bricks 通过四种主要智能体类型解决关键行业的多个客户用例。信息提取智能体将电子邮件、PDF 和报告等文档转换为结构化字段,如名称、日期和产品详细信息,允许零售组织从供应商 PDF 中提取产品详细信息,无论文档复杂性如何。知识助理智能体提供基于企业数据的快速、准确的答案,使制造技术人员能够从 SOP 和维护手册中获得即时、可引用的答案。多智能体监督者使构建系统能够协调 Genie 空间、其他 LLM 智能体和工具(如 MCP)中的智能体,允许金融服务组织协调多个智能体进行意图检测、文档检索和合规检查。自定义LLM智能体为特定行业任务转换文本,帮助营销团队生成符合组织品牌指南的内容。

 

Databricks 的首席技术官兼加州大学伯克利分校计算机科学教授Matei Zaharia强调了开发工作的协作性质。

 

这是我们工程和 Databricks Mosaic 研究团队之间的一项联合努力,基于我们开发的新调优方法,如 TAO 和 ALHF。我认为这种声明式开发是人工智能的未来

Zaharia说道。

 

该平台代表了一种转变,允许领域专家直接为系统改进做出贡献,而不需要在人工智能基础设施方面拥有深厚的技术专长,可能会改变企业处理智能体开发工作流的方式。

 

有兴趣了解更多关于 Agent Bricks 实现和多智能体系统开发的读者,可以通过Databricks的Data AI峰会会议了解构建结构化和非结构化数据的多智能体系统的额外技术细节。该平台功能的视频演示提供了自动化优化工作流程和实际应用场景的可视化示例。

 

原文链接:

https://www.infoq.com/news/2025/07/databricks-agent-bricks-platform/

2025-07-30 11:093937

评论

发布
暂无评论

iOS 面试策略之经验之谈- App的测试和上架

iOSer

ios 面试 app上架 app测试

一文通关苦涩难懂的Java泛型

程序猿阿星

泛型 java基础 Java泛型

硬核出击,只为守护你的秘密!

亚马逊云科技 (Amazon Web Services)

阿里云黄博远:AI工程化是发挥算法及数据价值的效能中枢

阿里云大数据AI技术

Flutter 混合开发基础

网易云信

flutter 框架

Django 之路由篇

若尘

django Python编程 路由 5月日更

iOS 面试策略之经验之谈-架构的选择

iOSer

ios 架构

阿里P9架构师力荐:Java面试必刷的17套一线大厂真题(含答案)

Java架构追梦

Java 阿里巴巴 架构 腾讯 面试

助力秋招第二弹:Java并发编程知识梳理

北游学Java

Java 面试 秋招

Docgeni,开箱即用的 Angular 组件文档工具

PingCode研发中心

开源 研发工具

Python3 Note 浮点类型误差问题

awen

Python 浮点型 decimal

农产品区块链溯源平台建设解决方案,健全食品安全体系

源中瑞-龙先生

区块链 溯源 食品安全

将模型转为NNIE框架支持的wk模型第一步:tensorflow->caffe

华为云开发者联盟

tensorflow caffe NNIE框架 wk模型 mxnet

打造生态“朋友圈”,英特尔以生态之道培育AI创新“大气候”

E科讯

提高建模效率:自动化机器学习之贝叶斯优化综述

索信达控股

机器学习 自动化 金融科技 贝叶斯公式 产品建模

iOS面试大全从面试的准备和流程到算法和数据结构以及计算机基础知识

iOSer

ios 面试 面向协议protocol编程 iOS 知识体系

看德威学校如何通过亚马逊云科技开启青少年AI探索之旅

亚马逊云科技 (Amazon Web Services)

膜拜!多次霸榜Github的springboot 实战派文档到底有多强?

Java 程序员 架构 面试

iOS 面试策略之经验之谈-面向协议的编程

iOSer

ios swift 面试 面向协议protocol编程 面向协议编程

hive的DDL语法基本操作

大数据技术指南

hive 5月日更

SUSECON 2021首日重点新闻:SLES 15 SP3和SUSE Rancher 2.6全新发布

Rancher

直播点播窄带高清之 JND 感知编码技术

网易云信

音视频 视频编码

“零信任产业标准工作组”再度升级,持续促进国内零信任产业的协同发展

工业绿色发展可视化管理——高炉炼铁厂可视化系统

一只数据鲸鱼

数据可视化 工业物联网 智慧工厂 三维可视化 高炉炼铁

打破固有思维(十九)

Changing Lin

太为难我了,阿里面试了7轮(5年经验,拿下P7岗offer)

Java 程序员 架构 面试

不同数据库模式下DATE类型的行为解析

华为云开发者联盟

MySQL oracle GaussDB(DWS) TD DATE类型

强劲性能释放释放:联想消费新品笔记本震撼发布

E科讯

GitHub上下载量突破100000+阿里巴巴的这份开源项目如此牛逼

阿里巴巴 开源 编程 Java 25 周年

Databricks Agent Bricks使用TAO和ALHF方法自动化企业AI开发_AI&大模型_InfoQ精选文章