写点什么

为孩子和开发团队解密机器学习

  • 2018-03-15
  • 本文字数:1321 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

QCon 2018 伦敦大会于 3 月 5 日举行, Rob Harrop 做了“面向软件工程师的AI 和ML ”的主题演讲。按照Harrop 的说法,机器学习知识经常躲在开发团队和数据科学团队之间的高墙背后。这种分割导致开发出的模型脱离了对数据的理解及其底层领域。而且,由于这种分割的存在以及ML 被神秘的光环环绕,所以软件团队经常无法提升自己的能力。 Dale Lane 在 Sponsor Stream 里介绍了他如何让孩子通过可用的声明式工具使用ML,并针对ML 的极端情况进行实践指导。

Harrop 是 Skipjaq 的首席技术官,也是 SpringSource 的最初创始人。他在 QCon 2018 伦敦大会上的主题演讲可以通过 qcon.ai 观看。他着重指出,这再次引入了在各自为政的专家之间交接工作的危险;这次是在数据专家和希望使用 ML 功能的团队之间。Harrop 谈到,由于数据专家不了解开发团队的有界上下文所处的业务环境,所以,在和他们合作时要防止引入偏见。

Lane 是 IBM 的一名开发人员,也是大会的发起人之一。他提供了一个实验性工程 ml-for-kids ,让孩子们可以使用基于 Web 的工具学习机器学习。ml-for-kids 基于 MIT 的 Scratch 构建,这是一个用于编程教学的可视化平台。它提供了实用的界面,让孩子们可以创建可编程的流程,并加入 ML 功能。有一个简单的界面让用户可以训练用于图像识别、自然语言处理(NLP)、情感分析及检测其他模式的模型。

Lane 通过实际的例子介绍自己如何使孩子意识到数据质量问题,如过拟合或引入数据偏见。他举了一个为主题公园或游乐场训练推荐模型的例子,使用了一个有利于游乐场的数据集来授课。由于结果模型对游乐场过度拟合,所以 Lane 能够建议孩子们思考个人生计与企业成功的道德后果。鼓励孩子们考虑救命药物的建议,他在故事中介绍了孩子在面对此类数据偏见时如何更好地了解其道德意义。

Harrop 提到了欧盟的《通用数据保护条例》所带来的问题,很快,组织使用那些区分个人信仰、宗教背景、种族、性取向或政治倾向的数据将不再合法。他特别指出,模型可能仍然会继续学习固有的模式,运用类似的偏见,即使对数据预先过滤,仍会如此,这很危险。为此,Harrop 建议,开发人员必须要设计和测试一种没有意外偏见的解决方案。他认为,“有关机器学习的所有社会学问题,偏见是最重要的一个。”

Harrop 和 Lane 都谈到了社会上对机器学习的神秘化。Harrop 提醒说,通常,人们关注的是,机器学习需要了解底层理论的数据专家,其实,大多数情况下,使用 ML 只是另外一种软件工程活动。回答了 Lane 提出的问题“非技术出身的老师如何通过 ml-for-kids 框架理解、传授并有效的利用适用的 ML”,就进一步降低了进入门槛。

Harrop 在演讲总结中指出,机器学习是一个重要的竞争优势,但是,其核心主要是软件工程。他提醒听众要避免再犯老错误:

不要再尝试分别设立数据科学团队和软件团队。把它们放在一起。确保每个人都知道其他人在干什么。

Lane 分享了一些可以随时访问的 Web ML 平台,不管是孩子,还是大人,都可以开始在上面做试验:

查看英文原文 Demystifying ML for Children and Dev Teams

2018-03-15 19:002019
用户头像

发布了 1008 篇内容, 共 442.7 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

产品更新丨谷云科技ETLCloud 3.9.3 版本发布

谷云科技RestCloud

API 组件 ETL 数据集成工具

TextIn OCR Frontend前端开源组件库发布!

合合技术团队

人工智能 算法 #大数据

localhost 和 127.0.0.1 到底有啥区别?

左诗右码

一文简述:低代码是什么?低代码开发平台的分类、功能与构成

优秀

低代码 低代码开发平台 低代码平台

数字江西里的通信蝶变

脑极体

AI

多智能体协作:浪潮海岳解锁企业智能化新范式

inBuilder低代码平台

大数据-03-Hadoop集群 免密登录 超详细 3节点云 分发脚本 踩坑笔记 SSH免密 集群搭建

武子康

大数据 hadoop mapreduce hive

狄耐克与鸿蒙生态深度战略合作 并启动“百城万户鸿蒙社区家庭战略”

新消费日报

微店商品详情API接口指南

tbapi

微店商品API接口 微店API 微店详情接口

心怀热爱,共绽光芒——鲲鹏昇腾开发者大会 2025 印象记

猫头虎

鲲鹏 昇腾 昇腾AI 鲲鹏云 昇腾CNN

React-native之Flexbox

溪抱鱼

React native FlexBox

区块链ETF系统的安全性

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链ETF

Python打包

安信无限

Python 打包工具

1688寻原通API接口攻略

tbapi

1688寻原通 1688寻原通API 1688寻原通系统

活动招募:如何构建一个学习型开发者社区?来 Dev.Together 2025 线下交流!丨 6 月 13 日,北京

声网

区块链RWA系统的主要功能

北京木奇移动技术有限公司

区块链技术 软件外包公司 区块链RWA

2025深圳国际家电制造及供应链博览会(11月)

秋硕展览

简单好用免费的防火墙软件 LuLu for Mac

Rose

开源夜莺V8.Beta11发版,支持CK告警、事件Pipeline等

巴辉特

监控告警 运维监控 开源监控 开源夜莺

使用 Amazon Q Developer CLI 快速搭建各种场景的 Flink 数据同步管道

亚马逊云科技 (Amazon Web Services)

Linux下版本控制器(SVN) -服务器端环境搭建步骤

刘大猫

人工智能 svn 算法 tortoiseSVN 版本控制器

5个case实测Fellou 2.0!做视频/网页/游戏/爬数据丝滑搞定!

阿星AI工作室

AI 智能体 大模型 agent AI产品

别再用 MySQL Workbench 了,快试试 SQLark!

严少安

MySQL 达梦数据 SQLark

鸿蒙仓颉语言开发实战教程:商城登录页

幽蓝计划

鸿蒙仓颉

深入浅出:微店商品列表API接口Python代码攻略

tbapi

微店API 微店商品列表接口 微店商品采集接口

Solana 推出SAS认证服务工具解决KYC 瓶颈问题

PowerVerse

区块链 去中心化 web3 Solana DePIN

11Labs 发布对话式 AI 2.0,集成话轮转换和知识库,多语言多角色多模态;通义公布空间音频生成模型 OmniAudio

声网

Spring AI Alibaba + Nacos 动态 MCP Server 代理方案

阿里巴巴云原生

阿里云 微服务 云原生 Spring AI Alibaba

深入浅出:拼多多商品详情API接口Python攻略

tbapi

拼多多API 拼多多商品数据采集 拼多多商品详情API 拼多多商品接口

演唱会LED背景墙方案:打造震撼视听

Dylan

音乐 LED LED display 虚拟演唱会 舞台表演

为孩子和开发团队解密机器学习_语言 & 开发_Rafiq Gemmail_InfoQ精选文章