【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

ATEC“数星”计划发布,开源亿级工业数据集

  • 2023-09-08
    北京
  • 本文字数:575 字

    阅读完需:约 2 分钟

ATEC“数星”计划发布,开源亿级工业数据集

9 月 8 日,在上海举行的 2023 inclusion·外滩大会《从机器智能到人机智能》论坛上,ATEC 前沿科技探索社区宣布启动 ATEC“数星”计划。


这是业内首个基于真实工业场景的大规模研究性数据集开放计划首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022 赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)


目前,“数星”计划的数据集可在ATEC官方平台下载。


“农村金融风险预测”中包含了涉农经营者的信贷风险信息及用户的历史多源交互数据。如何利用数字化技术识别农村经营者的经营状况和经营风险,是帮助农村经营者进行融资的基础能力之一。该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。


AntM2C 覆盖支付宝内多个业务场景,包含广告、营销、搜索和推荐真实场景中不同类型商品的 CTR 数据,整体数据规模达到 10 亿(第一阶段发布 1700 万规模的数据)。该数据集的发布填补了行业内,多场景多模态点击率预估问题的数据集空白。


清华大学计算机系副系主任、ATEC 前沿科技探索社区发起人徐恪教授指出,“数星”计划是 ATEC 社区在科技赛事、高校实训之后的又一项重要举措。数字技术的研究和发展离不开真实应用的数据土壤,亿级规模工业数据集,将成为人机智能等创新技术的关键燃料,推动机器智能等新一代数字技术的新范式发展。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-08 15:182486

评论

发布
暂无评论
发现更多内容

微服务框架-模块需求篇

superman

Windows AD 保姆级配置NTP服务器教程

BigYoung

时间 AD ntp Windows Server 2012 R2

图解23种设计模式——前方高能,前端切图仔请务必抓好方向盘

执鸢者

typescript 大前端 设计模式

Django的Models更新时,不触发Signals解决办法

BigYoung

django singals 信号机制 update 更新

Flink 中的应用部署:当前状态与新应用模式

Apache Flink

flink

源码分析 | 咋嘞?你的IDEA过期了吧!加个Jar包就破解了,为什么?

小傅哥

Java 字节码插桩 asm bytebuddy

微博基于 Flink 的机器学习实践

Apache Flink

flink

Maven的爱恨情仇

xcbeyond

Java maven

实用心理学—没用你打我!

代码制造者

职场 职场搞笑 信息技术 人工

LeetCode题解:88. 合并两个有序数组,splice合并数组+sort排序,JavaScript,详细注释

Lee Chen

大前端 LeetCode

2.3.2 JDK动态代理 -《SSM深入解析与项目实战》

谙忆

Swagger 这一个文章就够了

陈磊@Criss

从实际案例讲 Deno 的应用场景

keelii

Java typescript deno

6种快速统计代码执行时间的方法

Bruce Duan

java统计时间 currentTimeMillis nanoTime StopWatch

为什么会是Docker?

架构精进之路

Docker

NetPerf揭示容器间是高速路还是林荫小路

陈磊@Criss

重磅消息,我国数字人民币将在京津冀等具备条件地区试点

CECBC

数字货币 货币

从北京降雨的复盘中,我发现了企业SD-WAN网络的秘密

脑极体

如何正确认识区块链?

CECBC

区块链价值 区块链应用

Vue项目起步

JackWangGeek

Vue

【写作群星榜】8.1~8.14 写作平台优秀作者 & 文章排名

InfoQ写作社区官方

写作平台 排行榜 热门活动

Serverless:为我们到底带来了什么

刘宇

Serverless 云原生

Facebook开源的数据Mock:Memisis详解

陈磊@Criss

用Ant实现Java项目的自动构建和部署

陈磊@Criss

2.3.1 理解动态代理 -《SSM深入解析与项目实战》

谙忆

中本聪原始比特币论文解读:点对点的电子现金系统

韩超

比特币 区块链

芯片破壁者(十二.下):青瓦台魔咒与半导体“死亡谷”

脑极体

统一软件开发过程(RUP)的概念和方法

雯雯写代码

Junit执行单元测试用例成功,mvn test却失败的问题和解决方法

陈磊@Criss

微服务框架 - 模块功能设计篇

superman

[修复 Webpack 官方 Bug] 提取CSS时的依赖图修正

分一

大前端 webpack 编译优化 源码刨析

ATEC“数星”计划发布,开源亿级工业数据集_工业_蚂蚁集团_InfoQ精选文章