写点什么

2020 年十大热门机器学习项目

  • 2021-01-22
  • 本文字数:2519 字

    阅读完需:约 8 分钟

2020 年十大热门机器学习项目

本文最初发表于 Medium 博客,经原作者 Anupam Chugh 授权,InfoQ 中文站翻译并分享。


2021 年才刚刚开始,在过去的一年中,机器学习领域中发生了很多事情。


本文介绍了最流行的开源研究项目、演示和原型。其范围从照片编辑到自然语言处理,再到使用“无代码”训练模型,我希望这些能够激发你去构建令人难以置信的人工智能产品。


1、Background Matting v2


https://github.com/PeterL1n/BackgroundMattingV2


Background Matting v2(背景抠图)从广受欢迎的 The World is Your Green Screen(世界是你的绿幕)开源项目中汲取灵感,展示了如何实时删除或更改背景。它提供了更好的性能(4K 时为 30fps,FHD 时为 60fps),并可与流行的视频会议应用 Zoom 一起使用。


该技术使用附加捕获的背景帧,并将其用于恢复 alpha 哑光和前景层。采用两个神经网络对高分辨率图像进行实时处理。


假如你想把某人从视频中移除,同时保留背景,这个项目绝对有用。



2、SkyAR


https://github.com/jiupinjia/SkyAR


这是一个神奇的项目,它能对视频中的天空进行替换和协调,并能在视频中自动生成具有逼真和戏剧性风格的天空背景,而且风格可控。


这个以 Pytorch 为基础的项目使用了 pytorch-CycleGAN-and-pix2pix 项目中的部分代码,使用了天空抠图,通过光流进行运动估计,以及图像混合,实时提供视频艺术背景。


上面提到的开源项目在电影和视频游戏中有惊人的潜力,比如增加雨天、晴天等等。



3、AnimeGAN v2


https://github.com/TachibanaYoshino/AnimeGANv2


将照片卡通化总是一个有趣的机器学习项目。不是吗?


这个项目 AnimeGAN v2 是 AnimeGAN 的改进版本。具体来说,它在保证防止高频伪影产生的同时,将神经风格转移与生成对抗网络(GAN)结合起来完成任务。



4、txtai


https://github.com/neuml/txtai


人工智能精准化的搜索引擎和问答聊天机器人永远是当前的需求。而这正是这个项目所要做的。


txtai 利用 sentence-transformers、transformers 和 faiss,为上下文搜索和提取式问题回答构建了一个人工智能引擎。


实际上, txtai 支持构建用于相似性搜索的文本索引,并基于抽取式创建问题回答系统。



5、Bringing-Old-Photos-Back-to-Life


https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life


接下来是微软最新的照片修复项目,可以自动修复受损照片。


具体来说,它通过在 PyTorch 中的深度学习实现,利用划痕检测、人脸增强等技术,修复遭受复杂退化的老照片。


根据他们的研究论文:“我们训练了两种变自编码器(variational autoencoders,VAEs),它们分别将旧照片和干净照片转换到两个潜在空间。而这两个潜在空间之间的转换是通过合成的配对数据来学习的。由于紧凑的潜在空间中的域隙是封闭的,所以这种转换能很好地泛化到真实照片中。此外,为了解决一张旧照片中的各种混杂退化问题,我们设计了一个全局分支和一个局部分支,该分支包括一个局部非局部分块,针对结构化缺陷,如划痕和尘点,以及一个局部分支,针对非结构化缺陷,如噪声和模糊。”


从下面的演示中可以看出,该模型的性能明显优于传统的技术方法。



6、Avatarify


https://github.com/alievk/avatarify


Deepfake 项目已经横扫机器学习和人工智能社区。这个项目展示了一个典型的示例,它允许你在实时视频会议应用中创建照片般逼真的头像。


主要是利用 First Order Model(一阶模型)来提取视频中的动作,然后利用光流把它们应用到目标的头像上。通过这种方式,你可以在虚拟的摄像机上生成虚拟的人物,甚至可以将经典画作做成动画。从伊隆·马斯克到蒙娜丽莎,你可以模仿任何人来玩耍!



7、Pulse


https://github.com/adamian98/pulse


这是一个人工智能模型,它显示了如何从一个低分辨率的人脸图像中生成一个逼真的人脸图像。


PULSE,即 Self-Supervised Photo Speampling via Latent Space Exploration of Generative Models(通过生成模型的潜在空间探索进行的自监督照片上行采样)的缩写,它提供了一个超分辨率问题的替代公式,这个问题基于创建真实的超分辨率图像,同时也正确地缩小比例。



8、pixel2style2pixel


https://github.com/eladrich/pixel2style2pixel


基于研究论文《风格编码:用于图像到图像转换的 StyleGAN 编码器》(Encoding in Style: a StyleGAN Encoder for Imag-to-Image Translation),该项目使用 Pixel2Pixel 框架,其目的是使用相同的架构,以解决广泛的图像到图像转换任务,从而避免任何可能的局部性偏差。


在新一代编码网络的基础上,这个网络可以被训练成将人脸图像与正面姿势对齐,条件图像合成,并创建超分辨率图像。


从使用漫画家的作品生成近乎真实的人物,到将草图或人脸分割转换为照片般逼真的图像,你可以用它做的事情太多了。



9、igel


https://github.com/nidhaloff/igel


也许是因为预算问题或者缺乏清晰的愿景,但是对于创业公司来说,找到有机器学习经验的人总是一项挑战。更何况这方面的工作一直都在不断进步。


所以最近无代码机器学习平台大行其道,谷歌、苹果等公司也推出了自己的快速模型训练工具集。


这种有趣的开源机器学习项目可以让你不用编写代码就可以训练 / 拟合、测试和使用模型。尽管 GUI 拖放版本仍然处于开发阶段,但是通过该项目的命令行工具,你可以完成以下许多工作:


//train or fit a modeligel fit -dp 'path_to_your_csv_dataset.csv' -yml 'path_to_your_yaml_file.yaml'//evaluateigel evaluate -dp 'path_to_your_evaluation_dataset.csv'//predictigel predict -dp 'path_to_your_test_dataset.csv'
复制代码


此外,还可以使用单独的命令 igel experiment 将各个阶段结合起来:训练、评估和预测。更多细节,请参考这里的文档。



10、Pose Animator


https://github.com/yemount/pose-animator/


最后,我们有一个网络动画工具。基本上,这个项目利用 PoseNet 和 FaceMesh 里程碑式的成果,通过利用一些 TensorFlow.js 模型,让 SVG 矢量图像活起来。


你可以通过以下方式将自己的设计或骨架图像制作成动画。



作者介绍:


Anupam Chugh,Anupam Chugh,Android 和 iOS 开发者、拥有超过 200 万阅读量的作家。视技术和代码为毕生追求。


原文链接:


https://medium.com/better-programming/the-top-10-trending-machine-learning-projects-of-2020-d923bf31abb7

2021-01-22 15:177990
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 559.8 次阅读, 收获喜欢 1978 次。

关注

评论 5 条评论

发布
用户头像
确实很有趣啊,每个项目
2021-02-01 12:29
回复
用户头像
mark
2021-01-31 14:55
回复
用户头像
fun
2021-01-30 20:53
回复
用户头像
消费过气主播,就离谱
2021-01-24 08:42
回复
fivefiveiopen?
2021-02-02 14:08
回复
没有更多了
发现更多内容

首份把架构三原则拆开来讲的“架构师宝典”,电子版已上线

Geek_0c76c3

Java 数据库 开源 程序员 开发

欢迎数造科技加入openGauss社区

如何使用流程 中的 DataObject 并为流程设置租户

江南一点雨

Java springboot workflow flowable

“智领医疗 数创未来”活动成功举办,海量数据携手openGauss为医疗数字化创新赋能

OpenHarmony有氧拳击之应用端开发

OpenHarmony开发者

OpenHarmony

说说 Spring 定时任务如何大规模企业级运用

阿里巴巴云原生

spring 阿里云 云原生

啃完这些Spring知识点,我竟吊打了阿里面试官(附面经+笔记)

Geek_0c76c3

Java 数据库 开源 面试 开发

Github 访问量过百万!阿里内部springcloud手册, 实至名归

Geek_0c76c3

Java 数据库 程序员 开发

cuda+cudnn ubuntu20安装

Ayosh

defi质押挖矿存币生息理财系统开发

开发微hkkf5566

如何实时、高效地处理如此海量的路况数据

华为云开发者联盟

人工智能 华为云 图片处理 智慧交通 企业号十月 PK 榜

欢迎海天起点加入openGauss社区

带你认识什么是“回流重绘”

华为云开发者联盟

html 前端 浏览器 企业号十月 PK 榜

10分钟开发Kubernetes Operator

俞凡

架构 Kubernetes 云原生

创新公司iLabService 释普科技启示录

B Impact

欢迎奥看科技加入openGauss社区

DDD 建模案例分享

Bright

敏捷 DDD TDD

算法统治者!打破传统方式,即将爆火的Leetcode刷题指南

Geek_0c76c3

Java 数据库 开源 程序员 开发

openGauss 社区 2022 年 9 月运作报告

知道了web的攻击方式,还不快防起来?

CoderBin

前端 安全 10月月更

【LeetCode】优势洗牌Java题解

Albert

LeetCode 10月月更

不要小看一个Redis!阿里最新开源Redis核心原理+应用实践,涵盖了Redis的所有操作

程序员小毕

面试 程序人生 中间件 Java后端 redis 底层原理

云和恩墨大讲堂 x openGauss Meetup x 鲲鹏生态孵化营(上海站)圆满落幕

云图说丨带你了解GaussDB(for Redis)双活解决方案

华为云开发者联盟

数据库 数据资产 云数据库 企业号十月 PK 榜

携手武汉白鱀豚保护基金会,英特尔以责任为先多举推动环保公益

科技之家

企业社会责任先行,公益课程推动环保科普教育

科技之家

Google 发布:DevOps 2022现状报告

SEAL安全

DevOps 研发效能 软件交付 软件供应链

Java 隐藏 Word 文档中的特定段落

在下毛毛雨

从零开始学Graph Database:什么是图

华为云开发者联盟

人工智能 华为云 图数据库 图计算引擎 企业号十月 PK 榜

openGauss 3.1.0版本正式发布 | 七个方面全面增强

【活动报名】共建云原生开源生态 PolarDB × Curve 线下 Meetup 来袭!(杭州站)

阿里云数据库开源

数据库 阿里云 开源 polarDB

2020 年十大热门机器学习项目_AI&大模型_Anupam Chugh_InfoQ精选文章