写点什么

为孩子和开发团队解密机器学习

  • 2018-03-15
  • 本文字数:1321 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

QCon 2018 伦敦大会于 3 月 5 日举行, Rob Harrop 做了“面向软件工程师的AI 和ML ”的主题演讲。按照Harrop 的说法,机器学习知识经常躲在开发团队和数据科学团队之间的高墙背后。这种分割导致开发出的模型脱离了对数据的理解及其底层领域。而且,由于这种分割的存在以及ML 被神秘的光环环绕,所以软件团队经常无法提升自己的能力。 Dale Lane 在 Sponsor Stream 里介绍了他如何让孩子通过可用的声明式工具使用ML,并针对ML 的极端情况进行实践指导。

Harrop 是 Skipjaq 的首席技术官,也是 SpringSource 的最初创始人。他在 QCon 2018 伦敦大会上的主题演讲可以通过 qcon.ai 观看。他着重指出,这再次引入了在各自为政的专家之间交接工作的危险;这次是在数据专家和希望使用 ML 功能的团队之间。Harrop 谈到,由于数据专家不了解开发团队的有界上下文所处的业务环境,所以,在和他们合作时要防止引入偏见。

Lane 是 IBM 的一名开发人员,也是大会的发起人之一。他提供了一个实验性工程 ml-for-kids ,让孩子们可以使用基于 Web 的工具学习机器学习。ml-for-kids 基于 MIT 的 Scratch 构建,这是一个用于编程教学的可视化平台。它提供了实用的界面,让孩子们可以创建可编程的流程,并加入 ML 功能。有一个简单的界面让用户可以训练用于图像识别、自然语言处理(NLP)、情感分析及检测其他模式的模型。

Lane 通过实际的例子介绍自己如何使孩子意识到数据质量问题,如过拟合或引入数据偏见。他举了一个为主题公园或游乐场训练推荐模型的例子,使用了一个有利于游乐场的数据集来授课。由于结果模型对游乐场过度拟合,所以 Lane 能够建议孩子们思考个人生计与企业成功的道德后果。鼓励孩子们考虑救命药物的建议,他在故事中介绍了孩子在面对此类数据偏见时如何更好地了解其道德意义。

Harrop 提到了欧盟的《通用数据保护条例》所带来的问题,很快,组织使用那些区分个人信仰、宗教背景、种族、性取向或政治倾向的数据将不再合法。他特别指出,模型可能仍然会继续学习固有的模式,运用类似的偏见,即使对数据预先过滤,仍会如此,这很危险。为此,Harrop 建议,开发人员必须要设计和测试一种没有意外偏见的解决方案。他认为,“有关机器学习的所有社会学问题,偏见是最重要的一个。”

Harrop 和 Lane 都谈到了社会上对机器学习的神秘化。Harrop 提醒说,通常,人们关注的是,机器学习需要了解底层理论的数据专家,其实,大多数情况下,使用 ML 只是另外一种软件工程活动。回答了 Lane 提出的问题“非技术出身的老师如何通过 ml-for-kids 框架理解、传授并有效的利用适用的 ML”,就进一步降低了进入门槛。

Harrop 在演讲总结中指出,机器学习是一个重要的竞争优势,但是,其核心主要是软件工程。他提醒听众要避免再犯老错误:

不要再尝试分别设立数据科学团队和软件团队。把它们放在一起。确保每个人都知道其他人在干什么。

Lane 分享了一些可以随时访问的 Web ML 平台,不管是孩子,还是大人,都可以开始在上面做试验:

查看英文原文 Demystifying ML for Children and Dev Teams

2018-03-15 19:002028
用户头像

发布了 1008 篇内容, 共 443.8 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

从超越数字到卓越叙事,感受数据可视化的力量

智达方通

企业管理 全面预算管理 财务管理 财务规划

Python 使用 FastAPI 和 PostgreSQL 构建简单 API

我再BUG界嘎嘎乱杀

Python postgresql 开发语言 FastApi

【邀请函】相约CommunityOverCode Asia 2024,共探Flink、Paimon、Celeborn开源新境界!

Apache Flink

大数据 flink Celeborn paimon

MES系统生产计划的实施流程

万界星空科技

生产管理系统 mes 万界星空科技 生产计划

“英特尔x希沃:40分钟高效课堂“诞生记”

E科讯

市场表现低迷,本周期的山寨币还有投资机会吗?

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

结合RNN与Transformer双重优点,深度解析大语言模型RWKV

华为云开发者联盟

深度学习 华为云 transformers 华为云开发者联盟 企业号2024年7月PK榜

万字详解!在 Go 语言中操作 ElasticSearch

左诗右码

Elasticsearch SQL

职场<火焰杯>测试开发大赛决赛即将开始!

测吧(北京)科技有限公司

测试

Rust编程语言到底是不是炒作的噱头?

伤感汤姆布利柏

EMQX 与 MQTT: AI 大模型时代的分布式数据中枢

EMQ映云科技

mqtt mqtt broker

华为大咖说 企业应用AI大模型的“道、法、术” -- 法:落地篇 (上)

人工智能 企业 华为云

利用亚马逊云科技生成式AI工具微调COE流程

亚马逊云科技 (Amazon Web Services)

用flutter实现五种寻路算法的可视化效果,快来看看!

编程的平行世界

flutter 算法

一文搞懂到底什么是 AQS

不在线第一只蜗牛

Java JVM

使用 Makefile 管理和部署 Go 项目

左诗右码

Go

Net5.5G,全球运营商的AI之翼

脑极体

AI

“自我实现的预言”摩尔定律,如何继续引领创新

E科讯

Renderless 思想正在影响前端开发

OpenTiny社区

开源 组件库 OpenTiny TinyVue

为孩子和开发团队解密机器学习_语言 & 开发_Rafiq Gemmail_InfoQ精选文章