Pymetrics开源公平性感知机器学习算法Audit AI_开源_Kent Weare_InfoQ精选文章

《HarmonyOS：领航者说》技术公开课来啦，大咖分享、实战解码，不容错过了解详情 



 写点什么

登录/注册

Pymetrics 是一件专注于向企业提供招聘服务的初创企业。最近，Pymetrics 在 Github 上开源了企业使用的偏差检测（bias detection）算法，称为“Audio AI”。Audit AI 用于降低存在于训练数据集中的判别模式。这些判别模式会改进或影响机器学习算法在选取总体上的概率。

现在，越来越多的工作任务借助于机器学习实现过程自动化。重要的是应确保这些算法不会产生可从中不当受益的偏差。Pymetrics 一直致力于确保机器学习算法的公平性。

我们研究的总体目标，就是提出一种合理的考虑问题方式，使机器学习算法更公平。即便识别了训练数据集中存在的偏差，使用该训练集训练的机器学习算法并不足以解决其中的判别问题。当前，越来越多的决策使用人工智能自动做出。人们需要理解并识别算法的公平或偏差程度，这是朝正确方向迈出的一步。

企业对多样性的关注与日俱增。一些人担心算法学习偏差的方式事实上可能会破坏这些多样性努力。最近，法国宣布希望成为能在国际舞台占有一席之地的人工智能强国。今年三月，法国总统 Emmanuel Macron 发布了人工智能国家战略，其中包括在未来五年内支出 18.5 亿美元，发展可与硅谷和中国竞争的生态系统。总统做出如此层次的 AI 投资，这无疑是经过了仔细的考虑：

我认为 AI 完全可能危及民主。例如，我们正在使用人工智能来组织学生访问大学，对算法委以重任。很多人认为算法是一个黑箱，他们并不明白选取学生的过程是如何发生的。但当他们开始明白这依赖于某种算法时，算法就具有了特定的责任。要避免争议的发生，必须为算法创造公平性和完全透明性的条件。这样的算法中并不存在偏见，至少不存在歧视性偏见，我对此充满信心。

对于法国而言，“公平”的算法可确保在性别、年龄及其它个体特征上不存在偏见。如果算法中并未建立公平性和透明度，那么 Macron 总统预计“人们最终会拒绝这种创新”。

Pymetrics 的客户包括消费品企业、技术企业和研究企业。Pymetrics 提供的部分产品是为应聘候选者给出了一套参与性游戏。这些游戏通常完成于招聘的前期过程，完全不考虑应聘者的种族、性别和教育水平等个体特征，而是基于应聘者的记忆、对风险的态度等近 80 个特征做出评估。之后，Pymetrics 就能够针对已有的最佳表现者对应聘者做出评定，预测应聘者在应聘职位上可能的未来表现。

出于社会责任上的考虑，Pymetrics 选择开源 Audit AI。Pymetrics 的产品负责人 Priyanka Jain 给出了解释：

作为技术的创造者，我们十分强烈地感受到，我们的责任就是构建人工智能，努力创造一个人人希望生活于其中的未来。如果我们可以为其他技术创造者继续构建特性提供帮助，那么我们责无旁贷应做出共享。

在 Audit AI 的 Github 代码库中，开发人员可以看到一个用于实现上述“公平”的机器学习算法的 Python 软件库，该软件库是基于 pandas 和 sklearn 构建的。此外，代码库还给出了两个示例数据集，场景分别涉及德国的学分和学生的成绩。

查看英文原文： Pymetrics Open-Sources Fairness-Aware Machine Learning Algorithms

评论

发布

暂无评论

鸿蒙 FoldSplitContainer 解析：折叠屏布局适配与状态管理

UCloud环境使用----环境购买以及安装UV

环塔淬炼可靠技术，纵横G700解码硬核冠军基因

智慧联防系统（源码+文档+讲解+演示）

深圳亥时科技

灵宝CASBOT完成近亿元天使+轮融资，技术务实加速商业化落地

Web3 项目的开发框架

北京木奇移动技术有限公司

区块链技术软件外包公司 web3开发

Web3 项目开发的技术难点

北京木奇移动技术有限公司

区块链技术软件外包公司 web3开发

闪迪创作者系列赋能插画师：从碎片化灵感到完整创作的自由之路

【HarmonyOS 5】鸿蒙跨平台开发方案详解（三）

二级等保的要求

原生一体化：企业数智化焕新升级的“终局思维”

电商媒体必看:淘宝天猫商品详情接口指南

淘宝商品详情接口淘宝API 天猫商品详情接口天猫API 电商社媒

HarmonyOS NEXT仓颉开发语言实现画板案例

数智焕新| 从传统到智能：AI赋能下的消费品服务体验新模式

荔枝鲜行记：从枝头到餐桌，豪沃TS7冷藏车让鲜甜如约而至

什么是 QueryGPT？智能查询工具如何重塑信息检索的未来？

数据分析 StarRocks 数据查询 QueryGPT 多模态交互

数智焕新| AI+人才供应链：从"岗找人"到"智配人"的升维革命

最受欢迎的三方库之SpinKit

桃花镇童长老

HarmonyOS ArkTS

鸿蒙 SplitLayout 组件解析：折叠屏分割布局与多端适配指南

软件确认测试的内容和流程有哪些？

DeepSeek等常用大模型使用分析

程序员架构进阶

架构大模型 6月月更 6 月优质更文活动 DeepSeek

数智焕新| AI+财务，开启企业财务效率革命与决策升级

巅峰对决 · 超三十万奖金等你挑战！第十届“信也科技杯”全球 AI 算法大赛火热开赛！

人工智能算法

智能体(AI Agent)开发实战之【LangChain】(四)结合大模型基于RAG实现本地知识库问答和纠错

我和AI的成长

AI 人工自能 langchain AI Agent AI 智能体

高德开放平台SDK鸿蒙版，助力千余家应用高效构建LBS服务

高德开放平台

鸿蒙 sdk 高德地图

给Javaer看的大模型开发指南｜得物技术

小米AI眼镜暴露了雷军的“野心”

人工智能小米科技 AI眼镜

跨国企业在华经营数智跃迁：用友BIP企业AI全栈云引领从适配到创新的范式升级

大数据-23 Sqoop 数据MySQL到HDFS(部分) JDBC ETL MapReduce

Apache 大数据 hadoop hdfs sqoop

The AI Moat Pyramid：构建不可复制的 AI 护城河

人工智能 AI LLM Baihai IDP

HarmonyOS NEXT仓颉开发语言实战案例：简约音乐播放页