计算机视觉

收录了计算机视觉频道下的 137 篇内容
  • 全部
  • 文章
  • 迷你书
数据增强技术如何实现场景落地与业务增值?
数据增强技术如何实现场景落地与业务增值?

本文将详细介绍 StartDT AI Lab 是如何采用数据增强技术实现场景落地与业务增值的。

AI复活的那些“失落艺术”
AI 复活的那些“失落艺术”

贝多芬未完成的《第十交响曲》将由人工智能续写!

如视300万套VR房源背后的技术硬实力揭秘
如视 300 万套 VR 房源背后的技术硬实力揭秘

如果说数据积累是实现“真 VR”的第一步,那么数据单目深度估算技术便是第二步,前面两步走扎实了,才有了如视 Lite 轻量化的自若。这有点儿像盖房子,要先打好地基。

难倒全球最强计算机视觉模型,ObjectNet让识别准确率从90%下降至50%
难倒全球最强计算机视觉模型,ObjectNet 让识别准确率从 90% 下降至 50%

即使是能够在 ImageNet 上获得 97%准确率的目前最先进对象检测模型,在“迎战”ObjectNet 时,准确率也会迅猛下降至 50%— 55%。

AI领域薪酬统计:机器学习平均近3万,数据相关岗位增速放缓
AI 领域薪酬统计:机器学习平均近 3 万,数据相关岗位增速放缓

2019 年招聘薪资的众数是 5000 元,中位数是 6043 元,平均招聘薪资为 8082 元。

商汤ICCV论文解读:自然场景下文字检测的几何归一化网络(GNNets)
商汤 ICCV 论文解读:自然场景下文字检测的几何归一化网络(GNNets)

本文通过对待处理图像的特征图进行几何变换,将待处理图像中几何分布差异较大的文本框归一化到一定的几何分布范围内,提高了自然场景下文本测检的效果。

谷歌为 AI 合成音视频质量引入了新的度量标准
谷歌为 AI 合成音视频质量引入了新的度量标准

谷歌人工智能的研究人员发布了两个新的度量标准来衡量由深度学习网络生成的音频和视频的质量,分别是 Fréchet Audio Distance (FAD)和 Fréchet Video Distance (FVD)。

门票8800太贵?教你“薅”这一场技术峰会的“羊毛”
门票 8800 太贵?教你“薅”这一场技术峰会的“羊毛”

ArchSummit 特别推出的 3 场技术解决方案专场,现提供免费报名