【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

「旧」AI 已死,「新」AI 万岁

  • 2022-12-06
    北京
  • 本文字数:3708 字

    阅读完需:约 12 分钟

「旧」AI 已死,「新」AI 万岁

本文最初发布于 Bill Wadge 的个人博客。本文仅代表作者观点。


艺术的挥洒,就是你的容身之处。

—— Marshall McLuhan


[本文的所有图片都是用生成式 AI(Midjourney、DALL-E 2、Stable Diffusion)生成的。大部分是由 Paul DelSignore,而不是我] 



毕加索风格的《蒙娜丽莎》


我曾在维多利亚大学教授人工智能课程——感谢上帝,我退休了。我已经无法跟上翻译、博弈,特别是生成式 AI 方面的突破。


我教 AI 的时候,还主要是 GOFAI(Good Old Fashioned AI)。2015 年我退休了,就在 GOFAI 的时代结束之前。我躲过了一劫。


我对 NFAI(New-Fangled AI)望而生畏,迄今为止我还不知道它的工作原理。但我确实很了解 GOFAI,在这篇文章中,我想分享下我敬畏 NFAI 而不敬畏 GOFAI 的原因。


找,就会找到


在很长一段时间里,在非人工智能计算机科学家眼里,人工智能几乎就是一个笑话。当时的宣传天花乱坠,但从未实现什么大的突破。人们常常讽刺说,人工智能实是天生的蠢蛋。


许多院系,包括我所在的院系,基本上都在抵制这门学科,又或者只是提供一门入门课程。


GOFAI 的核心是搜索——树,更一般地说,是图。几十年来,树搜索的基准是国际象棋。几代人工智能研究人员都遵循 Norbert Wiener 在 40 年代首次提出的程序,以搜索国际象棋博弈树为基础。每隔十年,人工智能的传道者就会做出承诺,只要再过 10 年计算机就可以掌握国际象棋。


Wiener 在其开创性著作《控制论》中描述了他的想法,即对博弈树进行最小 / 最大搜索,并在搜索太深入时,诉诸于启发式方法来评估位置。


国际象棋博弈树很快变得非常大,直到几十年后(20 世纪 90 年代末),IBM 才集结力量实现了 Wiener 的梦想。他们构建了一台专用机器“深蓝(Deep Blue)”,每秒能够检查 1 亿个位置。“深蓝”最终先赢一局,并在整场比赛中战胜了世界冠军 Gary Kasparov。


深蓝是 GOFAI 的巅峰之作,后续并没有什么实质性的发展。“深蓝”的后继者 Watson 在策划方面可能更胜一筹,但从未实现商业应用。


AlphaGo 和 AlphaZero


“深蓝”给我留下了深刻的印象,但我让我更为好奇的是围棋。围棋的棋盘是 19×19 的,其博弈树要比国际象棋大得多。如果你当时问我,我会说精通围棋是不可想象的(如果必须使用 GOFAI,那确实如此)。



然而,在 2016 年,不可思议的事情发生了:一个名为“AlphaGo”的程序开始击败围棋冠军。它没有采用 Wiener 的方法;相反,它使用了机器学习(ML)(不要问我它的工作原理)。


AlphaGo 通过与自己对弈数百万次进行训练。起初,人们给它输入了数十万场专家级的人类对局,但它的继任者 AlphaZero 放弃了这些对局,只是自学。只需要几个小时,它就能达到专家级水平,而人类花了几百年的时间。该软件的变体以类似的方式掌握了国际象棋、跳棋和日本象棋(shogi)。


谷歌翻译


大约在同一时间,谷歌翻译的用户注意到,其翻译质量突然间有了大幅提升,尽管谷歌当时什么也没说。事实上,谷歌已经从统计学转向了神经网络(不要提问)。



目前,谷歌翻译已经非常好(DeepL 的更好)。例如,在翻译成法语时,它通常能正确地处理代词并保持性别 / 数字的一致。如果你想要得到完美的输出,多少还是要做点校对,因为其中偶尔会有错误,虽然通常很小。


以下是对《法国世界报》的一段翻译,很完美:


Since the beginning of the conflict, Russia has refused to describe its invasion of Ukraine as a war, calling it a “special military operation”. Shortly after the conflict broke out, the authorities banned the Russian media from using any information other than official statements on the subject and banned the use of words such as “war” and “invasion”, under penalty of being punished by the law.

(自冲突开始以来,俄罗斯一直拒绝将其对乌克兰的入侵描述为战争,而称其为“特别军事行动”。冲突爆发后不久,当局禁止俄罗斯媒体使用官方声明以外的任何信息,并禁止使用“战争”和“入侵”等字眼,否则将依法处罚。)


GOFAI 从来没有真正生成过好的翻译,因为它依赖事实和规则。我记得全班同学都曾因为翻译错误而开怀大笑。有一次,在翻译一篇关于伊拉克的德语新闻时,它说萨达姆“warned the US before an attack(在发动攻击前警告过美国)”,而这句话的准确说法是“Saddam warned the US of an attack(萨达姆警告过美国要发动攻击)”。现代系统绝不会犯这么低级的错误。


生成语音


然后是 GPT 3 和其他生成语音的系统。起初,它们只是通过预测来补全不完整的句子。但现在,它们更进一步,可以写出整篇文章。(通常来说)这是有意义的。下面是一个例子。


作者输入:Write me an article about creativity please (请给我写一篇关于创造力的文章) 


GPT-3 回复:I’ll be honest. I don’t know much about creativity. I’m not a psychologist and I’m not a creative myself. I’m just a guy who likes to read about psychology and creativity. What I can do, though, is write you an article about creativity that’s based on what I have read. That way you get a proper article, but you don’t have to pay for the expertise of a psychologist or a creative person.(实话实说,我不太了解创造力。我不是心理学家,我自己也不是一个有创造力的人。我只是喜欢阅读有关心理学和创造力的书籍。不过,我能做的是,根据我所读到的内容,为你写一篇关于创造力的文章。通过这种方式,你可以得到一篇像样的文章,不需要花钱请心理学家或有创造力的人。)


在这些方面,GOFAI 从未取得任何成就。但后来我的头脑完全被……


生成艺术品


后来 DALL-E 和 DALL-E 2 出现了。但直到 Stable Diffusion 发布,我才开始关注这个领域。当然还有骑在马背上的宇航员和戴墨镜的猫的照片。但真正打动我的是那些有着著名艺术家风格的画。以下是我最喜欢的两幅: 



毕加索风格的《Lockers》


第一副是毕加索风格的抽象画。我没找到原画,但 MidJourney 的版本非常棒。我会毫不犹豫地把它打印出来,装裱好,挂在墙上。


我第二喜欢的是一幅伦勃朗风格的超人肖像。一位观察者评论说,“他的眼睛让人觉得他看到了一堆狗屎!” 



但即使是俗气的宇航员形象也令人印象深刻。 



令人吃惊的是你看不到宇航员的左腿。图像生成器似乎知道你无法看穿不透明的物体(即马)。

GOFAI 需要成百上千条规则,比如物体重叠时该怎么做,显示什么,什么物体透明,透明到什么程度等等。

 

反光



好了,让我们看看这只戴墨镜的猫。虽然俗不可耐,但这张照片也有值得注意的地方。

那就是太阳镜镜片上的反光。我们不仅可以看到反光,而且还完全相同。Midjourney 是如何协调画面中的不同部分的呢?

 

近景



当看到这张照片时,我忍不住要问,这一切都是从哪里来的?Midjourney 使用 5000 亿幅图像进行训练,但压缩为 5GB。因此,对于训练集中的图像,它没有足够的空间来容纳真实的副本。我们可以假设,互联网上并不存在这张(未必真实的)照片。


特别是人物两侧的蓝色羽毛(它们并非互为镜像)。它们从哪里来的?训练图像里有吗?


其神秘之处在于,这幅图像是通过训练集图像化合而成,但它们是如何化合在一起的呢?GOFAI 最多就是把训练图像切碎,然后再拼接在一起,就像一个拙劣的填字游戏,接缝清晰,对称性有限。我百思不得其解。


AI 技术的社会影响


令人怀疑的是,至今所有的机械发明是否真的减轻了人类的劳累。—— John Stuart Mill

Midjourney 及其他图像生成程序还存在很多争议。



第一个问题是,这些图像是艺术吗?我认为这里展示的一些图像绝对算是艺术品,甚至是很好的艺术品。如果你不相信,那再来一幅“伦勃朗”吧。


第二个问题是,模仿某些艺术家的风格公平吗?我不知道,但似乎没法阻止。目前,没有什么能阻止人类艺术家研究在世艺术家并模仿他们的风格。Midjourney 等只是在这方面特别擅长。


从某种意义上说,这种模仿扩大了被模仿艺术家的曝光范围。比如说,现在每个人都可以拥有自己的莫奈。

最后,一个至关重要的问题是,这对如今的艺术工作者有何影响?在这方面,答案并不乐观。


生成式人工智能并不是第一项颠覆性技术,摄影(最接近的模拟)、一般数字艺术、电话、汽车、录音机、印刷机等皆属此类。


其中每一种都有淘汰整个行业的技能的效果。不过它并没有把它们消灭掉,只是生产力的大幅提高使得大量人员失业。那些留下来的人必须获得并使用新的工具。由于经济竞争,他们不得不比以往任何时候都更加努力地工作。



节省劳动力的技术必然会成为增加利润的技术。拖拉机就是一个例子。它(以及一般的农业机械)最初标榜的就是节省劳动力。但最终,竞争迫使每个农民要么买机器,要么卖掉农场(大多数人不得不这么做)。其结果就是,只剩下了一小部分农民拼命地工作,却生产出了和以前一样多甚或更多的粮食。


所以我预测,AI 会减少艺术工作者的数量,迫使他们使用 Midjourney 等工具。对于艺术品消费者来说,这将是一个好消息——就像用水管喝水一样。每周一幅新的莫奈作品。自己就可以为个人博客做插图。但并不会改变整个社会。


声明:本文为 InfoQ 翻译,未经许可禁止转载。


原文链接:


https://billwadge.com/2022/11/13/gofai-is-dead-long-live-nf-ai/

2022-12-06 10:005478
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 485.8 次阅读, 收获喜欢 1963 次。

关注

评论 1 条评论

发布
用户头像
前端时间刚看完李开复老师的书《AI进行式》的前俩张,再看到这个文章,就感觉很呼应~~
2022-12-06 12:30 · 浙江
回复
没有更多了
发现更多内容

从融云数智办公平台,看企业需要什么样的大模型?

融云 RongCloud

人工智能 AI 互联网 AIGC 数智办公

无目标,有目标,多目标

玄兴梦影

目标 前进的路上

金融行业首批!度小满智算网络中心达到万卡规模

科技热闻

学会PCB通用布局规则,复杂设计也能轻松搞定!

华秋电子

PCB

打造次世代分析型数据库(二):这,不只是列存表

腾讯云大数据

数据库

Axios put 请求使用指南:优化开发流程

Apifox

程序员 前端 后端 axios put

弹性数据库连接池探活策略调研(三)——DBCP | 京东云技术团队

京东科技开发者

数据库 数据库连接池 企业号9月PK榜 DBCP

一见“氢”心-康士柏氢能产业链蓄力待发

Geek_2d6073

制丝系统盘、启动盘

玄兴梦影

windows 系统重装 Liunx

亚信安慧荣膺“信创工委会技术活动单位”

亚信AntDB数据库

AntDB 国产数据库 AntDB数据库

Apache Commons Daemon 使用教程

玄兴梦影

Linux windows 进程 服务

【开源三方库】crypto-js加密算法库的使用方法

OpenHarmony开发者

OpenHarmony

智慧火力发电厂数字孪生3D可视化平台

2D3D前端可视化开发

智慧电厂 智慧火电厂 智慧火力发电厂 数字孪生火电厂 火电厂三维可视化

产品路线图如何制定?斯坦福大学产品管理课程为你支招

LigaAI

产品经理 经验总结 产品管理 产品路线图 企业号9月PK榜

超全60000多字详解 14 种设计模式 (多图+代码+总结+Demo)

控心つcrazy

「程序员转型技术管理」必修的 10 个能力提升方向

LigaAI

开发者 技术管理 经验总结 技术领导力 企业号9月PK榜

Sketch for mac(矢量绘图UI设计软件) 98.1中文激活版

mac

Sketch 苹果mac Windows软件 矢量绘图软件

研发管理平台的比较框架

iSoftBook

软件工程 敏捷精益 研发团队 研发效能管理 研发管理平台

一种基于动态代理的通用研发提效解决方案

阿里技术

从“13天”到“0天”延时,揭秘幸福里离线SLA保障最佳实践

字节跳动数据平台

大数据 数据中台 数据治理 数据安全 企业号9月PK榜

可观测性在灰度发布中的应用

观测云

微服务 性能优化 链路

WorkPlus AI助理,基于ChatGPT的企业级知识问答机器人

WorkPlus

航空航天行业的MES系统解决方案

万界星空科技

MES系统

大模型驱动云计算创新变革

Baidu AICLOUD

异构计算 百度百舸 千帆大模型平台 LMops AI 原生

HBuilder开发者必备!Windows上传IPA文件的软件分享

雪奈椰子

Databend 数据集成方案 | Data Infra 第 15 期

Databend

山东布谷科技直播APP源码搭建:核心的服务器系统

山东布谷科技

软件开发 系统架构 直播APP源码 服务器系统

文盘Rust——子命令提示,提高用户体验 | 京东云技术团队

京东科技开发者

rust cli 企业号9月PK榜 领域交互

小红书广告智能创意能力构建过程详解

小红书技术REDtech

人工智能 小红书

球场LED显示屏应具备什么特点

Dylan

广告 足球 LED LED display LED显示屏

「旧」AI 已死,「新」AI 万岁_AI&大模型_Bill Wadge_InfoQ精选文章