【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

开源跨平台计算机视觉库 OpenCV 4.0 正式发布

  • 2018-11-21
  • 本文字数:1667 字

    阅读完需:约 5 分钟

开源跨平台计算机视觉库OpenCV 4.0正式发布

OpenCV 是英特尔开源的跨平台计算机视觉库,它是一套包含从图像预处理到预训练模型调用等大量视觉 API 的库,并可以处理图像识别、目标检测、图像分割和行人再识别等主流视觉任务。OpenCV 提供了覆盖整个流程的工具,因此开发者不需要了解各个模型的原理就能基于各个 API 构建视觉任务。



OpenCV 使用 BSD 许可证,因此对研究和商业用途均免费。它具备 C++、Python 和 Java 接口,支持 Windows、Linux、Mac OS、iOS 和 Android 系统。OpenCV 旨在提高计算效率,专注于实时应用。它使用优化的 C/C++写成,能够有效利用多核处理。此外,在 OpenCL 的加持下,OpenCV 可以利用底层异构计算平台的硬件加速。OpenCV 应用广泛,目前在全世界约有 4.7 万用户,下载量约为 1400 万。



可以说 OpenCV 是 CV 领域开发者与研究者的必备工具包,Mask-RCNN 等很多开源项目都依赖于这个工具包。现在距离 3.0 版本的发布已经过去三年多,OpenCV 4.0 final 版本终于于近日发布,这也是 4.x 版本线的第一个稳定版本,它进一步完善了核心接口,并添加了二维码检测器、ONNX 转换格式等新特点。


重要更新如下:



  • OpenCV 4.0 现在是基于 C++ 11 的库,因此编译器需要与 C++ 11 兼容。所使用的 CMake 需要是 3.5.1 以上版本。

  • OpenCV 1.x 中大量 C 的 API 已经被移除,受影响的模块包括 objdetect、photo、video、videoio、imgcodecs、calib3d。

  • core 模块中的 Persistence(用于存储和加载 XML、YAML 或 JSON 格式的结构化数据)已经完全基于 C++重新实现,因此这里的 C API 也被移除了。目前,base64 支持尚未完成(仅支持加载 base64 编码的 XML 和 YAML)。 此外,存储在 FileNode 中的序列的随机访问是慢速 O(N)操作;使用cv :: FileNodeIterator可以做更快速的顺序访问。从积极的方面来说,加载FileStorage比原来的实现方法节省了 3-6 倍的内存。




  • 针对 DNN 的改进

  • 增加对 Mask-RCNN 的支持,官方提供了操作指南Python样例

  • 集成 ONNX 解析器。当前版本的 OpenCV 支持许多流行的分类网络,部分支持 YOLO 对象检测网络(ONNX 版本的 YOLO 缺少一些提供矩形列表的最终图层)。

  • 进一步提升使用英特尔 DLDT 构建的 DNN 模块的性能。DLDT 最近已经正式开源。 请参阅指南了解如何构建和使用支持 DLDT 的 OpenCV。

  • 添加实验性的 Vulkan 后端

  • 修复了 AMD 和 NVIDIA GPU 上的 OpenCL 加速问题。 现在,用户可以直接为模型启用DNN_TARGET_OPENCL,无需额外的环境变量。不过需要注意的是,DNN_TARGET_OPENCL_FP16仅在英特尔 GPU 上做了测试,因此仍需要额外的标志。

  • 为 OpenCV 支持的最流行的深度学习网络添加了快捷方式。开发者可以指定模型的别名,从而跳过预处理参数甚至模型路径的设置!下面是一个操作示例,原来的做法是:


   python object_detection.py --model    opencv_face_detector.caffemodel --config    opencv_face_detector.prototxt --mean 104 177 123 --width 300 --height 300
复制代码


现在只需要:


   python object_detection.py opencv_fd
复制代码



  • 添加了新模块 G-API,它可作为基于图的高效图像处理流程的引擎。详细信息可以参见Graph API(G-API)页面



  • 实现了流行的 Kinect Fusion 算法并集成到 opencv_contrib/rgbd 模块,同时针对 CPU 和 GPU (OpenCL) 做了优化。为了使实时样本正常工作,我们在 opencv/videoio 模块中添加了对 Kinect 2 的支持。在 4.0 beta 版本的代码中已经对 iGPU 做了加速,从而使得高分辨率的情况下(512x512x512 集成量)性能提升了 3 倍。

  • objdetect 模块中添加了二维码检测器和解码器,可以参考这里的代码示例

  • 将高效、高质量的 DIS dense optical flow 算法从 opencv_contrib 迁移到 video 模块。

  • 此外,OpenCV 4.0 性能也有所提升,图像处理操作可实现 15%-30%的速度提升。


以下是目前 OpenCV 支持的一些框架:


  • Caffe

  • TensorFlow

  • Torch

  • Darknet

  • ONNX 交换格式的模型


最后附上 OpenCV 4.0 发布地址:https://opencv.org/opencv-4-0-0.html




会议推荐:12 月 20-21,AICon将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-21 18:242447
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 496.3 次阅读, 收获喜欢 2749 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

2024最新风口项目 巨量 腾讯 百度 快手 小红书广告代理 信息流广告代理

陈老师讲创业

文心中国行走进成都!4月24日一起把握大模型时代的产业新机遇

飞桨PaddlePaddle

百度 BAIDU 百度飞桨 文心大模型 文心中国行

Stable Diffusion中的常用术语解析

程序那些事

人工智能 程序那些事 openai

MES管理系统与其他系统的集成

万界星空科技

数字化转型 系统集成 mes 万界星空科技

MES系统解决方案,MES系统主要能解决什么问题

万界星空科技

数字化 生产管理系统 mes 万界星空科技 车间管理

Ceph的crush算法与一致性hash对比介绍

天翼云开发者社区

云计算 存储 云服务

仓储管理解决方案:混合低代码与定制开发,实现灵活性与效率的完美结合

天津汇柏科技有限公司

低代码开发 软件开发定制 仓储系统

如何通过二维码追踪物品流转情况?添加这个组件即可

草料二维码

二维码 草料二维码

Anon Network:基于 Ator Protocol 的 DePIN 匿名互联网

大瞿科技

玩转云端| 拥有HBlock这项“存储盘活绝技”,数据中心也能“热辣瘦身”!

天翼云开发者社区

云计算 存储 数据中心 集群

LLaMA 2语言大模型的微调策略:LoRA与全参数选择

百度开发者中心

人工智能 大模型 llama2

出海不出局 | 小游戏引爆高线市场,新竞争态势下的应用出海攻略

融云 RongCloud

Giants Planet 宣布推出符文,建立在坚实价值的基础上

西柚子

卡片式笔记系统BYEAP介绍

zhumingwu

QCN9274 vs QCN9224 chip performance comparison-wireless communication innovation

wifi6-yiyi

5G qcn9274 QCN9224

第六届科技无障碍发展大会(2024TADC)

信息无障碍研究会

驼峰与下划线在python中转化

麦兜

Prompt工程师压箱底绝活——Prompt的基本组成部分、格式化输出与应用构建

百度Geek说

企业号 4 月 PK 榜 Prompt

软件测试学习笔记丨Selenium网页frame

测试人

软件测试

Anon Network:基于 Ator Protocol 的 DePIN 匿名互联网

长安区块链

Apifox 最新功能更新:OAuth 2.0 鉴权、多分支Mock及更多

Apifox

程序员 前端 后端 Apifox

利用jd.item_get API获取商品信息,打造可读性强的商品介绍

技术冰糖葫芦

API 接口 API 文档 pinduoduo API

青否数字人直播带货源码有哪些功能?

青否数字人

数字人

金三银四 面试准备 数据结构面试题,编程与算法经典面试题

测试人

面试 软件测试 求职

信创国产化替换势在必行,“重复造车轮”应避免

FinFish

国产化 小程序容器 信创化软件 信创化

金三银四 面试准备 数据结构面试题,编程与算法经典面试题

测吧(北京)科技有限公司

测试

GLM国产大模型训练加速:高效性能与成本优化的实践

百度开发者中心

人工智能 深度学习 大模型

面试不会算法和数据结构,经典面试题讲解来了!

霍格沃兹测试开发学社

认识一下JavaScrip中的元编程

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号2024年4月PK榜

刘强东“分身”直播首秀带火 AI 数字人直播,青否数字人厂商备受关注!

青否数字人

数字人

lerna-lite 轻量化 monorepo 管理利器

小鑫同学

开源跨平台计算机视觉库OpenCV 4.0正式发布_AI&大模型_蔡芳芳_InfoQ精选文章