【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

Waymo 共享用于机器学习的自动驾驶数据集

  • 2019-09-15
  • 本文字数:1409 字

    阅读完需:约 5 分钟

Waymo共享用于机器学习的自动驾驶数据集

自动驾驶技术公司Waymo(该公司归谷歌母公司Alphabet所有)发布了一个数据集,其中包含自动驾驶汽车在 5 个多小时的驾驶过程中收集到的传感器数据。该数据集包含了激光定位器和摄像头在多个城市和郊区环境的多种驾驶条件下收集的高分辨率数据,其中还包含车辆、行人、骑行者和路标的标签。


Waymo 团队在一篇博文中宣布发布Waymo Open Dataset,并称其为“有史以来发布的最大、最丰富和最多样化的研究用自动驾驶数据集之一”。这些数据是由 Waymo 在美国凤凰城、阿兹州、柯克兰、西弗吉尼亚州、山景城、加利福尼亚州和旧金山市的车辆在不同时间、不同天气情况下收集的。该数据集有 1000 个数据段,每段 20 秒,以 10Hz 的频率收集(也就是 200000 帧),其中包括:


  • 从五个激光定位器和正面及侧面的五个摄像头同步的数据

  • 传感器标定和姿态

  • 所有激光定位器画面的 3D 边界框都有对象标签(车辆、行人、骑行者和路标)

  • 100 个数据段的摄像头数据的 2D 边界框有对象标签


Waymo 还发布了一个谷歌Colab笔记本,包含教程和一个GitHub存储库,而后者又包含用于构建模型的 TensorFlow 辅助代码。这个巨大的标记数据集可以用于检测障碍物和交通标志的模型的监督机器学习,这是任何自动驾驶汽车的关键能力。激光定位器虽然可以生成一个点云图来定位三维空间中的物体,但它无法检测颜色,因此完全看不到路标上的字母。二维摄像头图像缺乏距离信息,但来自多个摄像头的图像可以通过处理重建深度。虽然Elon Musk认为激光定位器是“不必要的”,但将激光定位器的 3D 数据与 2D 摄像头数据相结合,可以简化在图像中检测障碍物距离的过程。



Lyft 上个月公布了一个类似的数据集Lyft Level 5(以 SAE驾驶自动化的最高级别命名)。Lyft 的数据集包含 5.5 万帧,大约是 Waymo 的四分之一;与 Waymo 的数据集相比,Lyft 获取每一帧数据所使用的摄像头更多(7 个)、激光定位器则更少(3 个)。两家公司都希望他们的数据能被研究团体用来改进算法和模型。Lyft 在发布会上特别强调了学术研究,并计划利用他们的数据集赞助一场机器学习竞赛。


毫不奇怪,这两个数据集都只允许用于非商业用途。Lyft 遵循知识共享署名-非商业性共享许可。Waymo 的许可非常严格,甚至禁止“在车辆运行或协助车辆运行时”使用。Twitter上的一位用户指出,虽然 Waymo 将数据集描述为“开放的”,但许可协议“不符合开放的定义”。


虽然从某种意义上说,自动驾驶汽车已经成为现实——Waymo 的自动驾驶出租车已经在凤凰城运营了两年多——而且研究表明,在未来,机器人汽车能够拯救生命,但目前还不清楚它们是否已经“为进入黄金时代做好了准备”。Waymo 的出租车总是有一个人在方向盘后面作为安全备份,而且自动驾驶软件有时会给乘客带来痛苦的体验。科技新闻网站 The Information 调查了 7 月和 8 月 1 万多次 Waymo 旅程中乘客的评分和反馈。尽管 70%的旅程获得了完美的评分,与今年第一季度相比有所改善,但一些乘客抱怨说,自动驾驶的体验“让人不舒服,而且非常令人担忧”。其他乘客抱怨说,这些车选择了迂回的路线,导致他们迟到。


人工智能研究人员、Roomba 联合创始人Rodney Brooks表示,他预计在 2032 年之前不会出现真正的机器人出租车服务:


对无人驾驶汽车可行性的真正考验,不是在测试或演示中,而是在无人驾驶出租车、拼车服务或供终端消费者的自行驾驶汽车停车的停车场的所有者真正从中赚钱时。


原文链接:


Waymo Shares Autonomous Vehicle Dataset for Machine Learning


2019-09-15 08:001831
用户头像

发布了 680 篇内容, 共 384.1 次阅读, 收获喜欢 1495 次。

关注

评论

发布
暂无评论
发现更多内容

数据湖系列之三 | 打造高性能云原生数据湖,层级 namespace 对象存储加速大数据计算

Baidu AICLOUD

数据湖 对象存储 层级namespace

PoseiSwap IDO、IEO 结束,即将登录 BNB Chain

BlockChain先知

PoseiSwap IDO、IEO 结束,即将登录 BNB Chain

EOSdreamer111

代码随想录训练营Day01- 数组(上)

jjn0703

算法 LeetCode 力扣

如何使用CSS Grid 居中 div

南城FE

CSS 前端 布局

【开发者福利】教你3步薅到免费GPU算力!

阿里云大数据AI技术

人工智能

人脸识别技术的优缺点及实际应用

来自四九城儿

“多云“和”私有化“,企业级刚需推动 DataBricks 和 MosaicML的13亿美金 AI 交易

B Impact

PoseiSwap IDO、IEO 结束,即将登录 BNB Chain

股市老人

一文详解:大数据分析工具有哪些?

夜雨微澜

2023-06-28:你想要用小写字母组成一个目标字符串 target。 开始的时候,序列由 target.length 个 ‘?‘ 记号组成 而你有一个小写字母印章 stamp。 在每个回合,你可

福大大架构师每日一题

Go rust 算法、 福大大架构师每日一题

语音合成技术与语音合成数据:赋予声音新的可能性

来自四九城儿

微服务架构:探索微服务架构的核心概念

2756

#微服务

清微智能TX5368A与飞桨完成Ⅱ级兼容性测试,助力全行业智能化升级

飞桨PaddlePaddle

人工智能 百度 paddle

3Ds MAX 2024发布!新功能盘点!

Finovy Cloud

Health Kit 新版本功能解析,给你丰富运动体验!

HMS Core

HMS Core

介绍 9 个研发质量度量指标

LigaAI

质量指标 研发效能度量 MTTR 研发效能管理 企业号 6 月 PK 榜

Tongsuo 8.4.0-pre1 发布啦!

铜锁开源密码库

算法 信息安全 密码学 数据安全 版本发布

PoseiSwap IDO、IEO 结束,即将登录 BNB Chain

大瞿科技

C++实现工资管理中的随机教师信息生成功能

攻城狮Wayne

亚马逊云科技中国峰会探访笔记 | 周边收集达人

IT蜗壳-Tango

方言语音识别技术:赋予方言更大的声音

来自四九城儿

万字长文讲透 RocketMQ 4.X 消费逻辑

EquatorCoco

Rocket

为什么不应该给用户提示错误码

光毅

前端‘’

基于STM32设计的炉温温度检测仪

DS小龙哥

6 月 优质更文活动

编写轻量级 CSS 框架,看这篇就够了

伤感汤姆布利柏

CSS

强化学习从基础到进阶-常见问题和面试必知必答[8]:近端策略优化(proximal policy optimization,PPO)算法

汀丶人工智能

人工智能 深度学习 强化学习 6 月 优质更文活动 ppo算法

共识算法揭秘:理解分布式系统的关键

Steven

亚马逊实践 | 构建可持续发展的架构模型

亚马逊云科技 (Amazon Web Services)

DevOps

微信广告投放代理合作 微信朋友圈广告代理加盟 终身售后

互联网创业践行者

创业 个人创业 微信朋友圈广告代理 微信广告

广州|阿里云 Serverless 技术实战营邀你来玩!

Serverless Devs

云计算 Serverless 托管服务

Waymo共享用于机器学习的自动驾驶数据集_AI&大模型_Anthony Alford_InfoQ精选文章