写点什么

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘

  • 2018-11-22
  • 本文字数:2682 字

    阅读完需:约 9 分钟

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘

人工智能帮助我们构建基于说和写的人机接口,而不是使用键盘或鼠标;它让人保持人性。最大的挑战是找到方法告诉系统哪些答案令人不满意,以帮助它们学习,记录和保留的数据要保持透明,并确保训练数据的多样性和包容性,以防止人工智能系统的偏见。


2018年柏林Codemotion大会上,微软高级项目经理Christian Heilmann谈了使用人工智能构建人机接口。InfoQ 正以 Q&A、概述和文章的形式对此次大会进行追踪报道。


Heilmann 认为,我们已经越来越习惯把电脑作为我们生活的一部分。我们可能是将电脑视为连接到屏幕的键盘的最后一代人了。与总是待在那里的计算机交谈正成为一种常态——无论好坏。


Heilmann 指出,使用人工智能的方法创建接口使我们可以做人类所做的事——说话、写作和表达情感——我们创造出了恰当有用的工具,而又无需学习它们。为了使我们的接口更人性化,我们需要在我们积累的数据和我们得到的传感器读数中添加人类可以理解的信息。


人工智能的一大问题是夸大其词,给我们承诺了完美的科幻一般的接口。Heilmann 认为,如果 Siri 或 Cortana 听不懂你的话,你感觉更多的会是失望,而不是通过表单在数据集中找不到结果。我们向最终用户提供人机接口,因此,我们需要确保我们的代码和训练模型允许人为的随机性和错误。


InfoQ 采访了 Heilmann,谈了如何在人机接口中应用人工智能、人工智能带来的好处以及人工智能软件开发面临的主要挑战。


InfoQ:人工智能似乎已经成为软件开发的一个热点。为什么会这样?


Christian Heilmann:人工智能的话题已经讨论了很长一段时间了,但过去的技术现实阻碍了它的蓬勃发展。随着当今科技的进步,在海量数据集上进行深度学习的必要计算从几个月的数值运算下降到几秒钟。

我们积累的数据比以往任何时候都多——要么是有意识地拍摄了大量照片和录制了大量视频,要么是通过每台设备的传感器自动积累的。过去,我们编写的程序有明确的数据处理指令,而我们所收集的大量信息要求系统从数据本身中学习,并找到可以遵循的模式。

人在那里只是为了指出异常值和错误。当计算机可以更快、更好地进行模式检测和信息分类时,我们就不需要做那些枯燥而重复的任务了。


InfoQ:我们如何在人机接口中应用人工智能?


Heilmann:这已经发生了。照片软件会自动检测照片中的人和物,并将结果作为元数据添加进去,以方便检索。

例如,当你使用谷歌照片数周,并在自己的照片中搜索“食物”时,它将找到包含食物的照片,而你从来都没有描述过这些图片。这种便利性源于两个要素:大量的数据和自动检测及分类方法。这就是机器学习和深度学习的作用。

在大多数情况下,我们使用托管云服务来训练系统,因为计算开销非常高。然而最近,芯片组和语言方面的创新使我们可以从计算机体系结构的强大中获益,甚至使得在设备上实现这一功能成为可能。过去,我们必须拍照,发送到一个云服务,检测出它包含了埃菲尔铁塔,现在,我们的相机几乎可以实时地与已经存在的数据集进行比较,而没有任何第三方或连接速度开销。


InfoQ:在开发人机接口时,人工智能给我们带来了什么好处?


Heilmann:这里的关键是让人类保持人性。几十年来,电脑的使用并不令人兴奋,因为它们要求我们改变自己的生活方式。我们需要点击正确的按钮,以正确的顺序完成一项任务。我们需要记住密码和地址,并知道用于不同任务的程序。本质上,我们需要习惯于使用软件,并在享受它之前学会如何与它交互。

当你与 Cortana、Siri 或谷歌交谈时,你不需要使用键盘或鼠标,你可以问这样的问题:“今天丹麦首都的气温是多少?”,而不必知道首都是什么,或者告诉计算机“今天”是什么意思。

我们已经有了大量的数据,计算机可以分析数据而不需要我们做额外的工作。这样,我们就可以添加计算机为我们提出的问题提供正确结果所需的额外信息。

这里的主要变化是,人们开始以这种方式使用计算时没有想到它会失败。我总是惊讶于接口的智能化程度,但我已经习惯地认为电脑是愚蠢的。当你把一张照片拖到 PowerPoint 中,它会在后台创建一个人类可读的描述,向搜索引擎和非可视用户解释图片。例如,我使用我的狗的照片,而描述“一只狗坐在人行道上”是自动创建的。这太神奇了,我们应该以这种方式构建我们所有的系统。如果一个表单要求用户以某种格式提问,但用户输入错误时却得不到任何结果,那么这个表单就不合时宜了。我们应该做得更好。


InfoQ:AI 软件开发面临的主要挑战是什么?


Heilmann:我们仍然需要应对一些挑战。人工智能的关键在于规模和速度。为了从一个智能系统中得到一个好的结果,你需要有很多经过适当训练的数据,你需要问一些精确的问题来得到合理的结果。人类,作为一个整体,不善于提出正确的问题,所以通常一个智能系统会给出令人不满意的答案。我们需要找到一种方法来告诉系统为什么答案不令人满意,而不是在那之后把系统作为一个失败的产品而马上丢弃。机器不会受到感情上的伤害,所以告诉它们某件事是完全错误的,就像说它是正确的一样有效。

但我看到的主要挑战是,我们拥有很大的权力,我们处理人们的个人信息,有时甚至是身份相关的信息。作为一个注重安全和隐私的人,我担心人们为了方便而泄露太多的信息。你家的智能扬声器很像老间谍电影中旅馆房间里隐藏的麦克风。但是,我们可以接受每天 24 小时的生活记录,这样我们就可以问一台无处不在的电脑外面天气如何了。作为智能系统的提供者,我们不仅要提供出色的结果,而且还要向这些系统的用户灌输一种所有权意识,并对记录的数据、保留的数据和流向保持透明。

我们还需要小心,不要让机器学习放大我们的偏见。只在白人数据集上训练过的面部识别会告诉有色人种,不允许他们使用系统。这是不好的。我们需要确保多样性和包容性,那是我们的训练数据和接口的一部分,而不是迎合我们自己或我们想接触的人。


InfoQ:如果人们希望了解更多关于在软件开发中使用 AI 的信息,他们可以去哪里?


Heilmann:这是一个很开放的问题,也是一个很难回答的典型问题。大多数大型软件公司都有很好的门户网站,可以让你开始了解基础知识,但也可以使用预先构建好的数据集和 API 从深度学习中获益,而不必掌握它。以下是一些对我有所帮助的内容:微软AI新闻与活动深度学习网站

如果你对面向人类的人工智能感兴趣的话,可以看下我自己创建的一个持续更新的资源列表。


查看英文原文:https://www.infoq.com/news/2018/11/human-interfaces-ai

相关推荐


12 月 7 日北京 ArchSummit 全球架构师峰会上,来自 微软的技术专家将分享“微软小冰实时感官系统与未来发展趋势”、“基于 Kubernetes 的 DevOps”等相关经验与实践。详情点击 https://bj2018.archsummit.com/schedule


2018-11-22 14:321767
用户头像

发布了 1008 篇内容, 共 419.6 次阅读, 收获喜欢 346 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

直击中小企业转型通用痛点 联想百应推出智能会议解决方案

极客天地

MSVC编译静态库

Loken

5月月更

一份优秀的产品帮助文档怎么写?

小炮

对象存储 S3 在分布式文件系统中的应用

焱融科技

对象存储 存储 分布式存储 云存储

硬之城获阿里云首批产品生态集成认证,携手阿里云共建新合作

阿里巴巴云原生

阿里云 云原生 合作伙伴 合作

PostgreSQL 15 新特性解读 | 墨天轮优质文章合集

墨天轮

数据库 sql postgresql 新特性

UniqueMergeTree:支持实时更新删除的ClickHouse表引擎

字节跳动数据平台

Clickhouse 表引擎 实时

架构实战营 - 第 6 期 模块七课后作业

乐邦

「架构实战营」

「开源人的福音」一键部署Java构件到Sonatype

Jianmu

后端 持续集成 开源项目 部署 Java构件

未来已来:云原生时代(二)云计算发展现状调研

看,未来

云原生

MSVC编译多个C程序文件

Loken

音视频 5月月更

企评家,企业成长性评价系统怎么用?

企评家

企业成长性分析 企评家 企业投资价值评价

【直播预告】研发效率百倍提升的秘密,这些破圈思路了解一下!

FinClip

小程序 finclip 直播预告

Spring之 @Component和@ComponentScan注解用法介绍和注意事项

echoes

ZooKeeper 在阿里巴巴的服务形态演进

阿里巴巴云原生

Apache zookeeper 阿里云 开源 云原生

基于边缘计算的云游戏场景实践

火山引擎边缘云

最佳实践 边缘计算 实时音视频 云游戏

React 实现 PDF 文件在线预览 - 手把手教你写 React PDF 预览功能

蒋川

JavaScript react.js 低代码 CRM pdf预览

自动驾驶等级家喻户晓,小微企业宽带等级你知道吗?

脑极体

国产ETL数据仓库调度平台TASKCTL对于Kettle作业类型的转换使用

敏捷调度TASKCTL

DevOps 数据仓库 kettle ETL 自动化运维

直播回顾|携手 Opentelemetry 中国社区,走进可观测性

Daocloud 道客

云原生 可观测性

Vue进阶(贰零捌):ES6 对象解构

No Silver Bullet

ES6 5月月更 对象解构

11年程序员给本科、研究生应届生以及准备从事后台开发同学的建议,学习进阶之路

C++后台开发

后台开发 社招 应届生 Linux服务器开发 校招

面向高校 | “云原生技术应用与实践”示范课程项目开放申报

阿里巴巴云原生

阿里云 云原生 云原生课程

未来已来:云原生时代(一)云计算如何一步步走来?

看,未来

精彩回顾|KubeCon EU 2022 Kubernetes Batch + HPC 专题日

Daocloud 道客

Kubernetes 云原生 HPC batch

易周金融分析 |“一参一控一牌”落地;两家支付机构更名

易观分析

金融 银行

实验室信息管理系统如何工作?

低代码小观

低代码 实验室管理系统 企业管理系统 LIMS实验室信息管理系统 企业管理软件

什么是时序数据库

领创集团Advance Intelligence Group

Kubernetes下Stdout日志白名单最佳实践

观测云

可观测性 可观测

书单 | 5月,这10本上榜新书带你打开新世界的大门!

博文视点Broadview

优秀标杆!华泰证券多芯协同云网管理平台

BoCloud博云

多云管理平台 多云管理

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘_AI&大模型_Ben Linders_InfoQ精选文章