【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

Pymetrics 开源公平性感知机器学习算法 Audit AI

  • 2018-08-02
  • 本文字数:1218 字

    阅读完需:约 4 分钟

Pymetrics 是一件专注于向企业提供招聘服务的初创企业。最近,Pymetrics 在 Github 上开源了企业使用的偏差检测(bias detection)算法,称为“Audio AI”。Audit AI 用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。

现在,越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics 一直致力于确保机器学习算法的公平性。

我们研究的总体目标,就是提出一种合理的考虑问题方式,使机器学习算法更公平。即便识别了训练数据集中存在的偏差,使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前,越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度,这是朝正确方向迈出的一步。

企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近,法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月,法国总统 Emmanuel Macron 发布了人工智能国家战略,其中包括在未来五年内支出 18.5 亿美元,发展可与硅谷和中国竞争的生态系统。总统做出如此层次的 AI 投资,这无疑是经过了仔细的考虑:

我认为 AI 完全可能危及民主。例如,我们正在使用人工智能来组织学生访问大学,对算法委以重任。很多人认为算法是一个黑箱,他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时,算法就具有了特定的责任。要避免争议的发生,必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见,至少不存在歧视性偏见,我对此充满信心。

对于法国而言,“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度,那么 Macron 总统预计“人们最终会拒绝这种创新”。

Pymetrics 的客户包括消费品企业、技术企业和研究企业。Pymetrics 提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程,完全不考虑应聘者的种族、性别和教育水平等个体特征,而是基于应聘者的记忆、对风险的态度等近 80 个特征做出评估。之后,Pymetrics 就能够针对已有的最佳表现者对应聘者做出评定,预测应聘者在应聘职位上可能的未来表现。

出于社会责任上的考虑,Pymetrics 选择开源 Audit AI。Pymetrics 的产品负责人 Priyanka Jain 给出了解释:

作为技术的创造者,我们十分强烈地感受到,我们的责任就是构建人工智能,努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助,那么我们责无旁贷应做出共享。

Audit AI 的 Github 代码库中,开发人员可以看到一个用于实现上述“公平”的机器学习算法的 Python 软件库,该软件库是基于 pandas 和 sklearn 构建的。此外,代码库还给出了两个示例数据集,场景分别涉及德国的学分和学生的成绩。

查看英文原文: Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-08-02 09:161290
用户头像

发布了 391 篇内容, 共 126.9 次阅读, 收获喜欢 255 次。

关注

评论

发布
暂无评论
发现更多内容

OpenKruise:Kubernetes 核心控制器 Plus

郭旭东

Kubernetes 云原生 OpenKruise

JAVA,.NET项目开发难上手?Learun敏捷开发框架解君愁

Philips

Java 敏捷开发 .net core

10万奖金等你拿!2020第四届易观OLAP算法大赛火热开启

易观大数据

Week12

一叶知秋

文件系统

Linuxer

易观CTO郭炜:如何构建企业级大数据Ad-hoc查询引擎

易观大数据

Spring Boot中获取配置的一些方法

Geek_416be1

Spring Boot 2

管理时间还是挥霍时间?

钰湚—付晓岩

学习 时间管理 工作体会 工作哲学

Redis 持久化--AOF

是老郭啊

redis redis持久化 aof

USDT承兑商软件开发,区块链支付系统源码搭建

13530558032

向云再出发:如数据般飞驰的内蒙古

脑极体

controller-manager的主动驱逐

Geek_f24c45

Kubernetes k8s

Python 到底是强类型语言,还是弱类型语言?

Python猫

Java c++ Python 编程

【译】Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases 上篇

花里胡哨

分布式数据库 异步 Amazon Aurora 日志驱动

面试是一张窄窄的船票

escray

学习 面试

开发者的福音,LR.NET模块化代码生成器

Learun

Java 敏捷开发 .net core 计算机程序设计艺术 软件设计

开发任务管理分析报告

森林

数字人民币钱包短暂露面 金融诈骗伺机而起

CECBC

数字货币 钱包 货币

数字资产钱包开发,深圳区块链理财钱包服务商

13530558032

合约跟单软件开发,合约跟单交易所系统开发搭建

13530558032

在面试中成长

escray

学习 面试

Spring整合WebSocket

牛初九

消息队列之事务消息,RocketMQ 和 Kafka 是如何做的?

yes

分布式事务 RocketMQ kafak 事务消息

Vue+Springboot项目部署

ZRK

Vue 前后端分离 springboot 部署

新基建迎来风口 新人才仍有缺口

CECBC

人工智能 新基建 数字化基础

深入了解 Rust 异步开发模式

lipi

rust 异步

Redis常见问题--单线程

是老郭啊

nosql redis 线程

数字化转型需要低/零代码平台的支持

代码制造者

低代码 数字化转型 企业信息化 零代码 编程开发

NodeX Component - 滴滴集团 Node.js 生态组件体系

滴滴普惠出行

人民版权 获2020中国产业区块链创新奖

CECBC

区块链 产业发展 版权

数字货币交易平台搭建,去中心化交易所开发方案

13530558032

Pymetrics开源公平性感知机器学习算法Audit AI_开源_Kent Weare_InfoQ精选文章