写点什么

2020 年十大热门机器学习项目

2021 年 1 月 22 日

2020 年十大热门机器学习项目

本文最初发表于 Medium 博客,经原作者 Anupam Chugh 授权,InfoQ 中文站翻译并分享。


2021 年才刚刚开始,在过去的一年中,机器学习领域中发生了很多事情。


本文介绍了最流行的开源研究项目、演示和原型。其范围从照片编辑到自然语言处理,再到使用“无代码”训练模型,我希望这些能够激发你去构建令人难以置信的人工智能产品。


1、Background Matting v2


https://github.com/PeterL1n/BackgroundMattingV2


Background Matting v2(背景抠图)从广受欢迎的 The World is Your Green Screen(世界是你的绿幕)开源项目中汲取灵感,展示了如何实时删除或更改背景。它提供了更好的性能(4K 时为 30fps,FHD 时为 60fps),并可与流行的视频会议应用 Zoom 一起使用。


该技术使用附加捕获的背景帧,并将其用于恢复 alpha 哑光和前景层。采用两个神经网络对高分辨率图像进行实时处理。


假如你想把某人从视频中移除,同时保留背景,这个项目绝对有用。



2、SkyAR


https://github.com/jiupinjia/SkyAR


这是一个神奇的项目,它能对视频中的天空进行替换和协调,并能在视频中自动生成具有逼真和戏剧性风格的天空背景,而且风格可控。


这个以 Pytorch 为基础的项目使用了 pytorch-CycleGAN-and-pix2pix 项目中的部分代码,使用了天空抠图,通过光流进行运动估计,以及图像混合,实时提供视频艺术背景。


上面提到的开源项目在电影和视频游戏中有惊人的潜力,比如增加雨天、晴天等等。



3、AnimeGAN v2


https://github.com/TachibanaYoshino/AnimeGANv2


将照片卡通化总是一个有趣的机器学习项目。不是吗?


这个项目 AnimeGAN v2 是 AnimeGAN 的改进版本。具体来说,它在保证防止高频伪影产生的同时,将神经风格转移与生成对抗网络(GAN)结合起来完成任务。



4、txtai


https://github.com/neuml/txtai


人工智能精准化的搜索引擎和问答聊天机器人永远是当前的需求。而这正是这个项目所要做的。


txtai 利用 sentence-transformers、transformers 和 faiss,为上下文搜索和提取式问题回答构建了一个人工智能引擎。


实际上, txtai 支持构建用于相似性搜索的文本索引,并基于抽取式创建问题回答系统。



5、Bringing-Old-Photos-Back-to-Life


https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life


接下来是微软最新的照片修复项目,可以自动修复受损照片。


具体来说,它通过在 PyTorch 中的深度学习实现,利用划痕检测、人脸增强等技术,修复遭受复杂退化的老照片。


根据他们的研究论文:“我们训练了两种变自编码器(variational autoencoders,VAEs),它们分别将旧照片和干净照片转换到两个潜在空间。而这两个潜在空间之间的转换是通过合成的配对数据来学习的。由于紧凑的潜在空间中的域隙是封闭的,所以这种转换能很好地泛化到真实照片中。此外,为了解决一张旧照片中的各种混杂退化问题,我们设计了一个全局分支和一个局部分支,该分支包括一个局部非局部分块,针对结构化缺陷,如划痕和尘点,以及一个局部分支,针对非结构化缺陷,如噪声和模糊。”


从下面的演示中可以看出,该模型的性能明显优于传统的技术方法。



6、Avatarify


https://github.com/alievk/avatarify


Deepfake 项目已经横扫机器学习和人工智能社区。这个项目展示了一个典型的示例,它允许你在实时视频会议应用中创建照片般逼真的头像。


主要是利用 First Order Model(一阶模型)来提取视频中的动作,然后利用光流把它们应用到目标的头像上。通过这种方式,你可以在虚拟的摄像机上生成虚拟的人物,甚至可以将经典画作做成动画。从伊隆·马斯克到蒙娜丽莎,你可以模仿任何人来玩耍!



7、Pulse


https://github.com/adamian98/pulse


这是一个人工智能模型,它显示了如何从一个低分辨率的人脸图像中生成一个逼真的人脸图像。


PULSE,即 Self-Supervised Photo Speampling via Latent Space Exploration of Generative Models(通过生成模型的潜在空间探索进行的自监督照片上行采样)的缩写,它提供了一个超分辨率问题的替代公式,这个问题基于创建真实的超分辨率图像,同时也正确地缩小比例。



8、pixel2style2pixel


https://github.com/eladrich/pixel2style2pixel


基于研究论文《风格编码:用于图像到图像转换的 StyleGAN 编码器》(Encoding in Style: a StyleGAN Encoder for Imag-to-Image Translation),该项目使用 Pixel2Pixel 框架,其目的是使用相同的架构,以解决广泛的图像到图像转换任务,从而避免任何可能的局部性偏差。


在新一代编码网络的基础上,这个网络可以被训练成将人脸图像与正面姿势对齐,条件图像合成,并创建超分辨率图像。


从使用漫画家的作品生成近乎真实的人物,到将草图或人脸分割转换为照片般逼真的图像,你可以用它做的事情太多了。



9、igel


https://github.com/nidhaloff/igel


也许是因为预算问题或者缺乏清晰的愿景,但是对于创业公司来说,找到有机器学习经验的人总是一项挑战。更何况这方面的工作一直都在不断进步。


所以最近无代码机器学习平台大行其道,谷歌、苹果等公司也推出了自己的快速模型训练工具集。


这种有趣的开源机器学习项目可以让你不用编写代码就可以训练 / 拟合、测试和使用模型。尽管 GUI 拖放版本仍然处于开发阶段,但是通过该项目的命令行工具,你可以完成以下许多工作:


//train or fit a modeligel fit -dp 'path_to_your_csv_dataset.csv' -yml 'path_to_your_yaml_file.yaml'//evaluateigel evaluate -dp 'path_to_your_evaluation_dataset.csv'//predictigel predict -dp 'path_to_your_test_dataset.csv'
复制代码


此外,还可以使用单独的命令 igel experiment 将各个阶段结合起来:训练、评估和预测。更多细节,请参考这里的文档。



10、Pose Animator


https://github.com/yemount/pose-animator/


最后,我们有一个网络动画工具。基本上,这个项目利用 PoseNet 和 FaceMesh 里程碑式的成果,通过利用一些 TensorFlow.js 模型,让 SVG 矢量图像活起来。


你可以通过以下方式将自己的设计或骨架图像制作成动画。



作者介绍:


Anupam Chugh,Anupam Chugh,Android 和 iOS 开发者、拥有超过 200 万阅读量的作家。视技术和代码为毕生追求。


原文链接:


https://medium.com/better-programming/the-top-10-trending-machine-learning-projects-of-2020-d923bf31abb7

2021 年 1 月 22 日 15:174617
用户头像
刘燕 InfoQ记者

发布了 521 篇内容, 共 161.2 次阅读, 收获喜欢 974 次。

关注

评论 5 条评论

发布
用户头像
确实很有趣啊,每个项目
2021 年 02 月 01 日 12:29
回复
用户头像
mark
2021 年 01 月 31 日 14:55
回复
用户头像
fun
2021 年 01 月 30 日 20:53
回复
用户头像
消费过气主播,就离谱
2021 年 01 月 24 日 08:42
回复
fivefiveiopen?
2021 年 02 月 02 日 14:08
回复
没有更多了
发现更多内容

企业架构实施简介

周金根

性能测试 + 操作系统 + 锁

Arvin

Java架构-不要成为项目风险的奴隶

我是苞谷

Java

在线互动课堂低延迟交互利器:高性能异步化设计与监控

SocketSide

线程模型 异步 Task 在线课堂

架构师训练营 第八周 总结

Poplar

ARTS-WEEK8

一周思进

ARTS 打卡计划

高并发系统设计要点

南方有乔木兮

Java

没想到 Hash 冲突还能这么玩,你的服务中招了吗?

石头

Java 安全攻防 hashmap hash 后端开发

影响企业架构项目成功的8个重要步骤

周金根

搞事情?Spring Boot今天一口气发布三个版本

YourBatman

Spring Boot 新特性

ARTS WEEK6

紫枫

ARTS 打卡计划

股权交易中心+区块链试点将开始

CECBC区块链专委会

防篡改 股权交易 可追溯 信息存证

JVM系列-读懂 GC 日志

Rayjun

Java JVM GC

Unix路径是如何简化算法,架构师性能优化 John 易筋 ARTS 打卡 Week 10

John(易筋)

ARTS 打卡计划

OMG组织的企业架构建模规范

周金根

JVM系列之:String.intern和stringTable

程序那些事

Java JVM GC 常量池 字符串

面试题:Java 中的 ==, equals 与 hashCode 的区别与联系

简爱W

LeetCode题解:206. 反转链表,JavaScript,While循环迭代,详细注释

Lee Chen

LeetCode 前端进阶训练营

【总结】性能优化2

小胖子

应用程序研发之基础知识分层与进化

superman

癌症筛查清单

Lee Chen

随笔杂谈 前端进阶训练营

Zookeeper从入门到放弃之Zookeeper典型应用场景

小隐乐乐

zookeeper 分布式 分布式锁

TOGAF实用教程(IT帮)

周金根

比 996 更可怕的是职场 PUA

非著名程序员

职场 职场成长 职场误区 职场 PUA

区块链如何切入供应链金融市场?

CECBC区块链专委会

浅析区块链如何改变生活

CECBC区块链专委会

数字银行 供应链 身体监测 资产管理

Java架构-代码分层的设计之道

我是苞谷

编程核心能力之重构

顿晓

学习 重构

【API进阶之路】无法想象!大龄码农的硬盘里有这么多宝藏

华为云开发者社区

容器 层次 API 网关 华为云

设计模式之外观模式解析

七哥爱编程

程序员 设计模式 外观模式

拥抱400GE新引擎,跨越新基建的时代龙门

脑极体

快手实时处理中存储痛点及解决方案

快手实时处理中存储痛点及解决方案

2020 年十大热门机器学习项目-InfoQ