【AICon】硅谷视野+中国实践,汇聚全球顶尖技术的 AI 科技盛会 >>> 了解详情
写点什么

为孩子和开发团队解密机器学习

  • 2018-03-15
  • 本文字数:1321 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

QCon 2018 伦敦大会于 3 月 5 日举行, Rob Harrop 做了“面向软件工程师的AI 和ML ”的主题演讲。按照Harrop 的说法,机器学习知识经常躲在开发团队和数据科学团队之间的高墙背后。这种分割导致开发出的模型脱离了对数据的理解及其底层领域。而且,由于这种分割的存在以及ML 被神秘的光环环绕,所以软件团队经常无法提升自己的能力。 Dale Lane 在 Sponsor Stream 里介绍了他如何让孩子通过可用的声明式工具使用ML,并针对ML 的极端情况进行实践指导。

Harrop 是 Skipjaq 的首席技术官,也是 SpringSource 的最初创始人。他在 QCon 2018 伦敦大会上的主题演讲可以通过 qcon.ai 观看。他着重指出,这再次引入了在各自为政的专家之间交接工作的危险;这次是在数据专家和希望使用 ML 功能的团队之间。Harrop 谈到,由于数据专家不了解开发团队的有界上下文所处的业务环境,所以,在和他们合作时要防止引入偏见。

Lane 是 IBM 的一名开发人员,也是大会的发起人之一。他提供了一个实验性工程 ml-for-kids ,让孩子们可以使用基于 Web 的工具学习机器学习。ml-for-kids 基于 MIT 的 Scratch 构建,这是一个用于编程教学的可视化平台。它提供了实用的界面,让孩子们可以创建可编程的流程,并加入 ML 功能。有一个简单的界面让用户可以训练用于图像识别、自然语言处理(NLP)、情感分析及检测其他模式的模型。

Lane 通过实际的例子介绍自己如何使孩子意识到数据质量问题,如过拟合或引入数据偏见。他举了一个为主题公园或游乐场训练推荐模型的例子,使用了一个有利于游乐场的数据集来授课。由于结果模型对游乐场过度拟合,所以 Lane 能够建议孩子们思考个人生计与企业成功的道德后果。鼓励孩子们考虑救命药物的建议,他在故事中介绍了孩子在面对此类数据偏见时如何更好地了解其道德意义。

Harrop 提到了欧盟的《通用数据保护条例》所带来的问题,很快,组织使用那些区分个人信仰、宗教背景、种族、性取向或政治倾向的数据将不再合法。他特别指出,模型可能仍然会继续学习固有的模式,运用类似的偏见,即使对数据预先过滤,仍会如此,这很危险。为此,Harrop 建议,开发人员必须要设计和测试一种没有意外偏见的解决方案。他认为,“有关机器学习的所有社会学问题,偏见是最重要的一个。”

Harrop 和 Lane 都谈到了社会上对机器学习的神秘化。Harrop 提醒说,通常,人们关注的是,机器学习需要了解底层理论的数据专家,其实,大多数情况下,使用 ML 只是另外一种软件工程活动。回答了 Lane 提出的问题“非技术出身的老师如何通过 ml-for-kids 框架理解、传授并有效的利用适用的 ML”,就进一步降低了进入门槛。

Harrop 在演讲总结中指出,机器学习是一个重要的竞争优势,但是,其核心主要是软件工程。他提醒听众要避免再犯老错误:

不要再尝试分别设立数据科学团队和软件团队。把它们放在一起。确保每个人都知道其他人在干什么。

Lane 分享了一些可以随时访问的 Web ML 平台,不管是孩子,还是大人,都可以开始在上面做试验:

查看英文原文 Demystifying ML for Children and Dev Teams

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-03-15 19:001371
用户头像

发布了 1008 篇内容, 共 375.6 次阅读, 收获喜欢 341 次。

关注

评论

发布
暂无评论
发现更多内容

移卡AI Lab占懿:AIGC让AI从幕后走向台前,将带来产业颠覆变革!

科技热闻

openGauss开源社区2022年度运营报告

openGauss

广袤乡村气象新丨烟台有了新模式

浪潮云

乡村振兴

软件测试 | 接口测试的价值与体系

测吧(北京)科技有限公司

测试

软件测试 | postman进行发送请求

测吧(北京)科技有限公司

测试

软件测试 | HTTP和HTTPS抓包分析

测吧(北京)科技有限公司

测试

软件测试 | session、cookie和token的区别是什么?

测吧(北京)科技有限公司

测试

TiDB Serverless 和技术生态全景

PingCAP

TiDB

软件测试 | 常见代理工具

测吧(北京)科技有限公司

测试

3D与Blender:开源的3D计算机图形软件集

Finovy Cloud

blender 3D软件

国产软件之光,鲜为人知但堪称神器,实用且强大!

这我可不懂

基于深度学习的表格检测与识别技术的优势

合合技术团队

人工智能 深度学习 模型 自动学习

易点天下基于 StarRocks 全面构建实时离线一体的湖仓方案

StarRocks

数据库 大数据 开源

openGauss内核分析(五):统计信息与行数估计

openGauss

软件测试 | 什么是HTTP

测吧(北京)科技有限公司

测试

数据库掌门人论坛回顾,激辩技术和行业发展趋势

镜舟科技

数据库 数据库、

【观察】汇聚中国开源数据库创新力量,openGauss驶入发展“快车道”

openGauss

2023年2月中国数据库排行榜:OTO新格局持续三月,人大金仓、AnalyticDB排名创新高

墨天轮

数据库 华为云 TiDB oceanbase 国产数据库

openGauss 年终成绩单出炉,聚开发者之力,建繁荣生态

openGauss

软件测试 | GET和POST区别与实战

测吧(北京)科技有限公司

测试

openGauss数据库荣获中国计算机学会(CCF)科技成果特等奖

Geek_2d6073

软件测试/测试开发 | 一文带你了解测试流程体系

测试人

软件测试 自动化测试 测试开发 测试流程

如何制作可视化报表?

XxinQi

ForkJoinPool实践

FunTester

软件测试 | 常见接口协议

测吧(北京)科技有限公司

测试

openGauss正式推出资源池化架构,全新升级社区工具DataKit

openGauss

如何使用appuploader制作apple证书

雪奈椰子

apple ios打包 IPA上传

软件测试 | 抓包分析TCP

测吧(北京)科技有限公司

测试

软件测试 | 使用CURL发送请求

测吧(北京)科技有限公司

测试

携手同心,三阳开泰:读懂2023华为中国政企合作伙伴政策

脑极体

华为

openGauss获2022年度创新产品奖!

openGauss

为孩子和开发团队解密机器学习_语言 & 开发_Rafiq Gemmail_InfoQ精选文章