写点什么

arm 优化 图像处理

收录了 arm 优化 图像处理 频道下的 50 篇内容

Armv9 终于来了,Arm 盯上了英特尔的“蛋糕”?
Armv9 终于来了,Arm 盯上了英特尔的“蛋糕”?

Arm 发布了下一代芯片架构 Armv9,距离上一代芯片架构 Armv8 的推出,已经有 10 年时间。

Arm推出业内首创的面向 GPU 的“神经技术”,为移动设备注入活力
Arm 推出业内首创的面向 GPU 的“神经技术”,为移动设备注入活力

搭载这项技术的设备预计将于2026年底上市,神经图形开发套件现已发布。

高级自动扩展功能助力企业降低70%的AWS成本
高级自动扩展功能助力企业降低 70% 的 AWS 成本

下一代 Kubernetes 自动扩展技术与工具正在帮助组织节省大量的云基础设施成本。最近,Svetlana Burninova 使用 Karpenter 构建了一个多架构 EKS 集群,在提高性能的同时节省了 70% 的成本。

嵌入式深度学习框架研发与落地实践
嵌入式深度学习框架研发与落地实践

本次分享介绍硬件面对的困难,落地应用层面的问题解决,以简单搜索App为案例全面讲解从汇编到顶层架构实现等。

异构计算系列(三):Adlik在深度学习异构计算上的实践
异构计算系列(三):Adlik 在深度学习异构计算上的实践

在模型应用上,需要使用深度神经网络的推理能力完成网络前向计算。

优Tech分享 | 多场景适配,TNN如何优化模型部署的存储与计算?
优 Tech 分享 | 多场景适配,TNN 如何优化模型部署的存储与计算?

在新基建大潮下,人工智能在社会发展中的角色越来越重要。技术开源构建了开放共进的生态环境,帮助行业应用加速落地,同时在解决行业实际问题时不断迭代,推动了人工智能技术普及。

网易有道开源EMLL:高性能端侧机器学习计算库,大幅提高计算性能
网易有道开源 EMLL:高性能端侧机器学习计算库,大幅提高计算性能

EMLL 为加速端侧 AI 推理而设计,提供基于端侧处理器的高性能机器学习计算库,支持 fp32、fp16、int8 等数据类型

苹果对外招聘RISC-V工程师,或欲节省每年数百万美元的ARM专利费
苹果对外招聘 RISC-V 工程师,或欲节省每年数百万美元的 ARM 专利费

苹果正在向更加自主可控的芯片研发道路迈进。

我们如何从0到1搭建了训练、部署机器学习模型的开源库NeoML
我们如何从 0 到 1 搭建了训练、部署机器学习模型的开源库 NeoML

与其他主流开源库相比,NeoML可以在所有设备上为预训练图像处理模型提供15%-20%的性能优化。

在边缘实现机器学习都需要什么?
在边缘实现机器学习都需要什么?

边缘机器学习必备要素。

GCC 4.9 发布,完整支持 Go 1.2.1

GNU项目和GCC开发者近日发布了GCC 4.9。这是一个主要版本,提供了大量新功能。比如改进了LTO(链接时优化)、跨过程优化,支持在终端中显示带颜色的诊断信息,继续增加对C++1y的支持,标准库支持C++11的等等。该版本还提供了Go 1.2.1的完整实现。

工程之道,旷视MegEngine工业级模型量化能力的构建与实战
工程之道,旷视 MegEngine 工业级模型量化能力的构建与实战

本文将简要介绍神经网络量化的原理,并与大家分享MegEngine量化方面的设计思路与实操教程。

华为发布业界首款AI-Native数据库,挑动了谁的神经?
华为发布业界首款 AI-Native 数据库,挑动了谁的神经?

华为又一重磅产品推出

从业20年,计算机视觉老兵谈算法从研究到落地
从业 20 年,计算机视觉老兵谈算法从研究到落地

对工程师来说,一个算法项目从建立到实用一般需要经历论文方法调研、数据采集、模型训练、算法优化和实用部署这些流程,但论文算法离实用还有比较大的距离,主要体现在效果无法覆盖广泛的场景,且效率很难满足落地要求等。

AI芯片年终盘点:有些公司年产N片,有些N年产1片都难
AI 芯片年终盘点:有些公司年产 N 片,有些 N 年产 1 片都难

AI前线小组盘点了2019年国内外主流科技公司在AI芯片方面的进展

专访高性能计算领军人物刘文志:并行计算的未来,是让人工智能无处不在

大数据、算法和计算能力决定了人工智能的发展。在计算领域上,主要依靠的硬件就是GPU、CPU,以及最近刚推出的TPU,背后是英伟达、英特尔和谷歌的角力。伴随着这些公司的股价一路上涨的趋势,从此也能看出并行计算的再次崛起。InfoQ一直很关注并行计算领域,联系了业界领军人物刘文志老师,并拜托杨旸进行了一次较深入的访谈,以下是访谈实录。 刘文志(花名风辰),商汤科技高性能计算总监,毕业于中国科学院研究生院,闻名于并行计算江湖,尤善异构并行计算(X86、ARM、GPU、APU及PHI)和大规模集群计算,有7年相关经验,涉及图像处理、计算机视觉、数据挖掘和石油勘探。曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队)。

基于 TensorflowLite 在移动端实现人声识别

本文使用机器学习的方法识别人声,采用的框架是谷歌的 tensorflowLite 框架,该框架跟它的名字一样具有小巧的特点。在保证精度的同时,框架的大小只有 300KB 左右,且经过压缩后产生的模型是TensorFlow 模型的四分之一。

arm 优化 图像处理专题_资料-InfoQ中文网