【ArchSummit架构师峰会】如何选择模型、如何应用RAG、需要哪些组织流程配套?>>> 了解详情
写点什么

公开数据集

收录了 公开数据集 频道下的 50 篇内容

清华大学和芯翌科技联合发布全球最大的公开人脸数据集
清华大学和芯翌科技联合发布全球最大的公开人脸数据集

该数据集完全基于全球互联网公开人脸数据构建,包含数百万ID和数亿图片。

谷歌 BigQuery 增加了新的公开数据集

Stack Overflow近日宣布,通过谷歌BigQuery提供它的数据集。开发人员可以使用平常的SQL语句查询完整的Stack Overflow数据集,包括帖子、投票、标签和徽章。本文将介绍谷歌BigQuery平台上可用的数据集。

基于公开数据集,5 分钟生成个性可视化数据报告

简介:  基于内置电商、广告、出行、汽车、国内生产总值等公开数据集,通过DataWorks与MaxCompute搭建可视化数据报告。

大数据
可视化分析
GAIA:智能运维领域通用公开数据集
GAIA:智能运维领域通用公开数据集

# 技术黑板报 # 第二期为了进一步推动智能运维(AIOps)行业产学研协同发展,通过产业实践反哺学术研究,吸引学者共同探索、挖掘、解决AIOps领域问题,云智慧基于超过十年运维领域实践,推出GAIA(Generic AIOps Atlas)智能运维领域通用公开数据集。

算法
AIOPS
数据集
场景
智能运维
轻量级大规模机器学习算法库 Fregata 开源:快速,无需调参

TalkingData大规模机器学习算法库Fregata开源了。LR和Softmax算法无需调参,对于大多数问题扫描数据一遍可收敛;LR算法在10亿样本千万维度训练集上10分钟(10台服务器Spark集群,无内存加速)可完成训练。

毫末 DriveGPT 再获证明!斩获 nuSecnces 自动驾驶公开数据集 NDS 最佳成绩

近日,在全球权威的自动驾驶nuScenes竞赛的最新评测中,毫末智行斩获纯视觉3D目标检测任务(nuScenes Detection task)无外部数据榜单第一名,并将关键性指标nuScenes Detection Score(NDS)提高到68.8%。

机器人和你对话时在想什么?
机器人和你对话时在想什么?

本文介绍机器人背后的问题原理,以及如何提升其效率。

AI自动生成新闻评论:微软联合北航提出全新深层模型DeepCom
AI 自动生成新闻评论:微软联合北航提出全新深层模型 DeepCom

在两个公共数据集上的实验结果表明,该模型在自动评价标准和主观评分两方面都明显优于现有方法。

力荐50个最实用的免费机器学习数据集
力荐 50 个最实用的免费机器学习数据集

Gengo网站整理出了50个高质量机器学习开放数据集,覆盖范围非常广,并按照具体领域(如自动驾驶)进行分类,推荐给大家。

阿里巴巴 AAAI 2018 录用论文:一种有效的轻量网络训练框架

为了满足在线实时响应系统(如点击率预估)对响应时间限制的严苛要求,我们提出了一个新型框架——“火箭发射”系统:训练阶段,同时训练繁简两个复杂度有明显差异的网络,简单的网络称为轻量网络(light net),复杂的网络称为助推器网络(booster net)。两网络共享部分参数,分别学习类别标记,此外,轻量网络通过学习助推器的soft target来模仿助推器的学习过程,从而得到更好的训练效果。

腾讯云自然语言处理的技术架构与应用
腾讯云自然语言处理的技术架构与应用

9月7日,云+社区(腾讯云官方开发者社区)主办的技术沙龙——AI技术原理与实践,在上海成功举行。现场的5位腾讯云技术专家,在现场与开发者们面对面交流,并深度讲解了腾讯云云智天枢人工智能服务平台、OCR、NLP、机器学习、智能对话平台等多个技术领域背后架构设计理念与实践方法。

深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用
深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用

本文介绍如何有效地利用用户历史行为,页面同屏竞争广告信息,以及用户—广告,广告—广告关系等辅助信息来提升 CTR 预估模型效果。

如何基于深度学习实现图像的智能审核?
如何基于深度学习实现图像的智能审核?

本文来自美团点评技术文章系列。

基于深度学习的推荐系统效果遭质疑,它真的有带来实质性进展吗?
基于深度学习的推荐系统效果遭质疑,它真的有带来实质性进展吗?

作者通过这篇论文揭示了当前机器学习领域的一些潜在问题,并呼吁大家改进该领域的科学实践。

数据增强技术如何实现场景落地与业务增值?
数据增强技术如何实现场景落地与业务增值?

本文将详细介绍StartDT AI Lab是如何采用数据增强技术实现场景落地与业务增值的。

AWS Data Exchange
AWS Data Exchange

我们生活在一个数据驱动的数据密集世界!

美团智能问答技术探索与实践
美团智能问答技术探索与实践

本文主要介绍在美团业务中智能问答技术的相关落地与实践。

达摩院AliceMind上新!首个中文表格预训练模型发布,已向业界开源
达摩院 AliceMind 上新!首个中文表格预训练模型发布,已向业界开源

SDCUP,其基于“模式依存”方法,通过模型直接预测自然语言与表格结构内容的关键词映射,提升了表格问答的准确率。

全球新冠病毒COVID-19研究数据集正式开放,内含近3万篇论文和所需AI工具
全球新冠病毒 COVID-19 研究数据集正式开放,内含近 3 万篇论文和所需 AI 工具

如今,这场疫情早已开始在全球范围内传播,全球数十家实验室陆续关闭,这对冠状病毒的研究工作进展十分不利。

“深耕内容”背景下,携程如何做景酒优质内容的挖掘
“深耕内容”背景下,携程如何做景酒优质内容的挖掘

伴随信息时代的快速发展,消费者的消费观念趋于理性、客观,对产品本身的质量要求也越来越高。

公开数据集专题_资料-InfoQ中文网