写点什么

ATEC“数星”计划发布,开源亿级工业数据集

  • 2023-09-08
    北京
  • 本文字数:575 字

    阅读完需:约 2 分钟

ATEC“数星”计划发布,开源亿级工业数据集

9 月 8 日,在上海举行的 2023 inclusion·外滩大会《从机器智能到人机智能》论坛上,ATEC 前沿科技探索社区宣布启动 ATEC“数星”计划。


这是业内首个基于真实工业场景的大规模研究性数据集开放计划首批将公开两个脱敏的、超大规模的工业数据集——ATEC2022 赛事数据集“农村金融风险预测”和蚂蚁集团多场景多模态点击率预估数据集(AntM2C)


目前,“数星”计划的数据集可在ATEC官方平台下载。


“农村金融风险预测”中包含了涉农经营者的信贷风险信息及用户的历史多源交互数据。如何利用数字化技术识别农村经营者的经营状况和经营风险,是帮助农村经营者进行融资的基础能力之一。该数据集在遵循国家法律法规及个人隐私保护的前提下,为金融科技领域、特别是农村金融科技领域的行业研究和发展提供了重要的数据支持。


AntM2C 覆盖支付宝内多个业务场景,包含广告、营销、搜索和推荐真实场景中不同类型商品的 CTR 数据,整体数据规模达到 10 亿(第一阶段发布 1700 万规模的数据)。该数据集的发布填补了行业内,多场景多模态点击率预估问题的数据集空白。


清华大学计算机系副系主任、ATEC 前沿科技探索社区发起人徐恪教授指出,“数星”计划是 ATEC 社区在科技赛事、高校实训之后的又一项重要举措。数字技术的研究和发展离不开真实应用的数据土壤,亿级规模工业数据集,将成为人机智能等创新技术的关键燃料,推动机器智能等新一代数字技术的新范式发展。

2023-09-08 15:183818

评论

发布
暂无评论
发现更多内容

推荐你一个正则表达式网站

卢卡多多

正则表达式 11月日更

基于JSP实现OA办公系统

Java 程序员 后端

图像处理网站

Java 程序员 后端

基于 ElasticSearch 实现站内全文搜索(1)

Java 程序员 后端

【死磕 Java 基础】 — 谈谈那个写时拷贝技术(copy-on-write)

chenssy

11月日更 死磕 Java 死磕 Java 基础

数据服务基础能力之元数据管理

数据分析 数据 元数据 数据管理 业务数据

喝了杯咖啡,我突然对MySQL锁、事务、MVCC-有了新的认识!

Java 程序员 后端

四、StringRedisTemplate 和RedisTemlate有什么不同

Java 程序员 后端

工作五年之后,对技术和业务的思考

程序员 技术 职场 互联网人 业务

基于 ElasticSearch 实现站内全文搜索

Java 程序员 后端

基于java+jsp的汽车租赁系统

Java 程序员 后端

基于NFS存储建立WEB群(PCS工具)

Java 程序员 后端

如何基于 React Native 快速实现一个视频通话应用

RTE开发者社区

flutter 人工智能「

听我讲完GET、POST原理,面试官给我倒了杯卡布奇诺

Java 程序员 后端

基于java SSM图书管理系统简单版设计和实现

Java 程序员 后端

基于java的连连看游戏设计

Java 程序员 后端

哭了,我居然回答不出来女同事的问题:索引为什么能提供查询性能---

Java 程序员 后端

万文讲解知乎实时数仓架构演进

大数据老哥

基于SSM的药店管理系统

Java 程序员 后端

基于Java和Bytemd用120行代码实现一个桌面版Markdown编辑器

Java 程序员 后端

日均订单量超1500,百度萝卜快跑甩掉Waymo

脑极体

基于JSP实现学校社团管理系统

Java 程序员 后端

基于SSM开发实现中药制剂网站系统

Java 程序员 后端

因为一次 Kafka 宕机,我明白了 Kafka 高可用原理!

Java 程序员 后端

基于java SSM springboot学生信息管理系统设计和实现2(1)

Java 程序员 后端

基于java SSM springboot学生信息管理系统设计和实现2

Java 程序员 后端

基于vue+SpringBoot+MyBatis的开源多商户商城系统,可二次开发

Java 程序员 后端

基于二叉树实现Map,就是这么优秀!

Java 程序员 后端

哪有什么中年危机,不过是把定目标当成了有计划

Java 程序员 后端

国庆临近,字节后端开发3+4面,终于拿到秋招第一个offer

Java 程序员 后端

基于iscsi存储的kvm动态迁移(V2V)

Java 程序员 后端

ATEC“数星”计划发布,开源亿级工业数据集_工业_蚂蚁集团_InfoQ精选文章