10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

Hugging Face 推出零代码数据集转换工具 AI Sheets

作者:Robert Krzaczyński

  • 2025-09-15
    北京
  • 本文字数:873 字

    阅读完需:约 3 分钟

大小:424.56K时长:02:24
Hugging Face推出零代码数据集转换工具AI Sheets

Hugging Face 发布开源应用AI Sheets。它提供了类似电子表格的界面,让用户可以使用 AI 模型构建、转换和补充数据集。这个工具既可以在 Hub 上使用,也可以在本地部署,用户无需编写代码即可尝试成千上万的开放模型,包括 OpenAI 的 gpt-oss。

 

该工具的界面类似于传统的电子表格,但可以通过提示生成新列,而不是手动输入公式。例如,用户可以清理文本、分类条目、补充缺失的数据细节,或者使用自然语言描述期望的输出以生成合成行。单元格可以直接编辑或验证,这些操作将指导模型的后续生成。

 

AI Sheets 提供了两个操作入口:通过自然语言描述数据结构从零生成数据集,或导入已有的 CSV、TSV、XLS 或 Parquet 格式的数据集。第一个选项适用于原型设计或合成数据生成,而导入真实数据则能实现大规模的数据转换与增强任务。Hugging Face 强调,用户可以先用小样本数据进行实验,然后再逐步扩展至大型数据管道。

 

该工具还提供了模型比较机制。用户可以创建多个输出列,每个列由不同的模型驱动,甚至可以添加一个单独的列,让另一个大型语言模型(LLM)作为裁判来评估结果。在已发布的示例中,研究人员在一个交互式迷你 Web 应用程序上比较了 Qwen3-Coder 和 gpt-oss 的输出,并自动生成了评估结果。

 

一些早期采用者指出了该工具的潜力和局限性:

 

它是 LLM 驱动的,但相当慢。我想知道为什么有人宁愿选择它而不是 OpenRefine?

 

还有人表达了对数据隐私的担忧

 

可以自己托管这个应用程序吗?听起来很有趣,但抱歉,我绝不会将我的业务数据上传到远程服务器。

 

对此,Hugging Face 机器学习工程师 Daniel Vila Suero确认,该工具支持自托管:

 

是的,你可以使用 Docker 进行自托管。看看我们如何在 Hub Spaces 上部署它。

 

数据集优化完成后,可以直接导出至 Hugging Face Hub 平台。该过程还会生成可复用的配置文件,支持使用 Hugging Face Jobs 扩展管道规模,或将其集成至下游工作流中。

 

现在,用户可以在Hugging Face Hub上免费使用 AI Sheets,无需安装,也可以通过GitHub获取代码进行本地部署。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:

https://www.infoq.com/news/2025/09/ai-sheets/

2025-09-15 15:301

评论

发布
暂无评论

第二周--设计模式

Just顾

架构师训练营第二周总结

陌生人

架构师训练营 -Week 02 学习总结

华乐彬

极客时间架构课 Week02- 作业二:学习总结

yulyulcl

第二周学习总结

iHai

极客大学架构师训练营

架构师训练营 Week 02 总结

Wancho

面向对象设计

架构师训练营第二章作业

JUN

架构师训练营第二次总结

+╮(╯▽╰)╭/>……

架构师训练营第二周总结

毛叫

极客大学架构师训练营

架构师训练营第二周总结

allen

Week2 课后作业

Geek_165f3d

依赖倒置

第二周作业(Cache接口隔离优化)

吴建中

极客大学架构师训练营

架构师训练营 -week2- 总结

Geek_5a6ca3

【架构师训练营】第二周作业

魔曦

极客大学架构师训练营

《架构训练营》week2 作业

任鑫

架构

学习总结 - W2

Kun

极客大学架构师训练营

【架构师训练营 - week2 -2】总结

早睡早起

架构师训练营第二课作业

曾祥斌

架构训练营第二周总结

Gavin

week02 学习总结

Just顾

第二周作业

架构师训练营-第二周总结

坂田吴奇隆

架构师训练营第二周心得

努力努力再努力m

极客大学架构师训练营

「编程模型」C++代码组织

顿晓

c++ 命名空间 namespace 代码组织 编程模型

架构师训练营第二周作业

努力努力再努力m

极客大学架构师训练营

架构训练营第二周作业

Gavin

【架构课笔记 - 第二周】编程方法演进与OOP

Nelson

架构

架构学习(二)作业

漫步跑小鸡

week2.学习总结

个人练习生niki👍

week2.课后作业

个人练习生niki👍

依赖倒置原则

万物互联=区块链+物联网

CECBC

AI 物联网 区块链技术 智能高效

Hugging Face推出零代码数据集转换工具AI Sheets_软件工程_InfoQ精选文章