写点什么

为孩子和开发团队解密机器学习

  • 2018-03-15
  • 本文字数:1321 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

QCon 2018 伦敦大会于 3 月 5 日举行, Rob Harrop 做了“面向软件工程师的AI 和ML ”的主题演讲。按照Harrop 的说法,机器学习知识经常躲在开发团队和数据科学团队之间的高墙背后。这种分割导致开发出的模型脱离了对数据的理解及其底层领域。而且,由于这种分割的存在以及ML 被神秘的光环环绕,所以软件团队经常无法提升自己的能力。 Dale Lane 在 Sponsor Stream 里介绍了他如何让孩子通过可用的声明式工具使用ML,并针对ML 的极端情况进行实践指导。

Harrop 是 Skipjaq 的首席技术官,也是 SpringSource 的最初创始人。他在 QCon 2018 伦敦大会上的主题演讲可以通过 qcon.ai 观看。他着重指出,这再次引入了在各自为政的专家之间交接工作的危险;这次是在数据专家和希望使用 ML 功能的团队之间。Harrop 谈到,由于数据专家不了解开发团队的有界上下文所处的业务环境,所以,在和他们合作时要防止引入偏见。

Lane 是 IBM 的一名开发人员,也是大会的发起人之一。他提供了一个实验性工程 ml-for-kids ,让孩子们可以使用基于 Web 的工具学习机器学习。ml-for-kids 基于 MIT 的 Scratch 构建,这是一个用于编程教学的可视化平台。它提供了实用的界面,让孩子们可以创建可编程的流程,并加入 ML 功能。有一个简单的界面让用户可以训练用于图像识别、自然语言处理(NLP)、情感分析及检测其他模式的模型。

Lane 通过实际的例子介绍自己如何使孩子意识到数据质量问题,如过拟合或引入数据偏见。他举了一个为主题公园或游乐场训练推荐模型的例子,使用了一个有利于游乐场的数据集来授课。由于结果模型对游乐场过度拟合,所以 Lane 能够建议孩子们思考个人生计与企业成功的道德后果。鼓励孩子们考虑救命药物的建议,他在故事中介绍了孩子在面对此类数据偏见时如何更好地了解其道德意义。

Harrop 提到了欧盟的《通用数据保护条例》所带来的问题,很快,组织使用那些区分个人信仰、宗教背景、种族、性取向或政治倾向的数据将不再合法。他特别指出,模型可能仍然会继续学习固有的模式,运用类似的偏见,即使对数据预先过滤,仍会如此,这很危险。为此,Harrop 建议,开发人员必须要设计和测试一种没有意外偏见的解决方案。他认为,“有关机器学习的所有社会学问题,偏见是最重要的一个。”

Harrop 和 Lane 都谈到了社会上对机器学习的神秘化。Harrop 提醒说,通常,人们关注的是,机器学习需要了解底层理论的数据专家,其实,大多数情况下,使用 ML 只是另外一种软件工程活动。回答了 Lane 提出的问题“非技术出身的老师如何通过 ml-for-kids 框架理解、传授并有效的利用适用的 ML”,就进一步降低了进入门槛。

Harrop 在演讲总结中指出,机器学习是一个重要的竞争优势,但是,其核心主要是软件工程。他提醒听众要避免再犯老错误:

不要再尝试分别设立数据科学团队和软件团队。把它们放在一起。确保每个人都知道其他人在干什么。

Lane 分享了一些可以随时访问的 Web ML 平台,不管是孩子,还是大人,都可以开始在上面做试验:

查看英文原文 Demystifying ML for Children and Dev Teams

2018-03-15 19:001997
用户头像

发布了 1008 篇内容, 共 440.7 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

基于 SLO 告警(Part 1):基础概念

Grafana 爱好者

可观测性 SRE SLO

电商秒杀系统架构设计

π

架构实战营

委派模式——从SLF4J说起

vivo互联网技术

Java slf4j 委派模式

Java高手速成 | JSP MVC模式项目案例

TiAmo

mvc java; jsp

编程技术面试的7个英文网站,你知道几个?

风铃架构日知录

Java 技术 面试 后端 技能提升

OpenYurt v1.2 新版本深度解读(一): 聚焦边云网络优化

阿里巴巴云原生

阿里云 开源 云原生 openyurt

Verilog HDL行为级建模

timerring

FPGA

OpenStack的“神秘组件” 裸金属(Ironic)管理使用

统信软件

OpenStack 服务管理 裸金属

除了Navicat破解版、DBeaver,免费还好用的数据库管理工具/SQL工具还有推荐吗?

雨果

sql navicat 数据库管理工具 Dbeaver SQL开发工具

5 个 JavaScript 代码优化技巧

devpoint

JavaScript 前端开发 JS代码优化 扩展运算符

企业用好WMS(仓库管理系统),需要注意的几个要点

SAP虾客

WMS系统 ERP系统 RFID

NFTScan 与 MAY 达成战略伙伴关系,双方在元宇宙 NFT 数据方面进行深度合作!

NFT Research

NFT 元宇宙

易观千帆 | 2022年12月银行APP月活跃用户规模盘点

易观分析

金融 手机银行 用户

架构实战营模块四作业

西山薄凉

「架构实战营」

如果在冬夜,你是一位新能源旅人

脑极体

新能源 领克 混动

「Go框架」路由中间件:为什么能够在目标函数前后运行?

Go学堂

golang 开源 程序员 个人成长 框架学习

架构训练营模块五作业

张Dave

C++实现惰性求值

SkyFire

c++ 函数式编程 模板元编程

使用启科QuPot+Runtime+QuSaaS进行量子应用开发及部署-调用AWS Braket计算后端

启科量子开发者官方号

量子计算 Amazon Braket

Go语言DDD实战初级篇

百度Geek说

Go 数据库 微服务 企业号 1 月 PK 榜

如何实现千万级优惠文章的优惠信息同步

京东科技开发者

redis 企业号 1 月 PK 榜 信息同步 伸缩任务 任务检测

组合多个动画效果 —— Flutter 交错动画(Staggered Animation)简介

岛上码农

flutter ios 前端 动画 安卓开发

基于Spring Cache实现Caffeine、jimDB多级缓存实战

京东科技开发者

spring 缓存 接口 系统 企业号 1 月 PK 榜

RCC目前最近技术与今后发展

华秋PCB

PCB PCB设计 HDI 生产工艺 RCC

预测本年度 10 大薪酬最高的 IT 技术工种!

风铃架构日知录

程序员 互联网 后端 IT

架构实战营4.6 千万学生管理系统存储设计

西山薄凉

「架构实战营」

真相了!TCP连接原来是这么被墙干掉的!

程序员小毕

程序员 后端 网络协议 架构师 tcpip

镜像拉取节省 90% 以上,快手基于 Dragonfly 的超大规模分发实践

OpenAnolis小助手

开源 架构 快手 龙蜥技术 容器云平台

秒杀场景下的业务梳理——Redis分布式锁的优化

小小怪下士

Java redis 分布式

视频发布失败原因不好找?火山引擎数智平台这款产品能帮忙

字节跳动数据平台

大数据 增长 用户分析

为孩子和开发团队解密机器学习_语言 & 开发_Rafiq Gemmail_InfoQ精选文章