【AICon】AI 基础设施、LLM运维、大模型训练与推理,一场会议,全方位涵盖! >>> 了解详情
写点什么

飞桨文心大模型挑战高考作文:平均 1 秒生成 1 篇,水平超 75% 考生

  • 2022-06-10
  • 本文字数:1698 字

    阅读完需:约 6 分钟

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生

全国高考正在进行中,百度 AI 技术也迎来一场“高考”。6 月 7 日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作。


AI 写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓完成了高考作文的写作。


度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40 秒就根据题目创作了 40 多篇文章,平均 1 秒生成 1 篇,随机抽取其中一篇,其分数已赶超约 75%高考考生。



文心大模型写作:平均 1 秒 1 篇,成绩超 75%考生


将 AI 应用于文字创作,在技术圈里早已不算新鲜事。随着大数据、深度学习等技术的发展,AI 在文本生成能力上有了大幅度提升。从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI 写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。


但相比于评论、摘要、快报等内容形式,用 AI 生成高考作文的难度显然更高。高考作文的写作在“审题”、“逻辑”和“创意”等三个方面对 AI 提出了更大的挑战。在审题层面,高考作文题材、形式众多,再加上纷繁复杂的内容主题,每一种千变万化的组合都是对 AI 的理解能力的极限考验。逻辑层面,高考作文要求 800 字以上,如何保证长文各个片段之间的逻辑性和连贯性对 AI 是另一大挑战。最后,在创意层面,可读性是高考作文最重要的评分标准之一,AI 写作不仅要切题连贯,还要善于引经据典、巧用修辞,甚至推陈出新,避免文章空洞乏味。


面对这些挑战,度晓晓在飞桨文心大模型的帮助指导下,又快又好地完成了写作。曾担任北京高考语文阅卷组组长的申怡为度晓晓的作文打出了 48 分的成绩(满分 60 分)。她表示,根据往年情况,获得 48 分及以上作文成绩的考生,仅占不到 25%,也就是说,度晓晓的作文分数已赶超约 75%高考考生。



这背后得益于文心大模型最新发布的融合任务相关知识的千亿大模型 ERNIE 3.0 Zeus,该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上表现出了更强的零样本和小样本学习能力。通俗地讲,文心大模型就像个见多识广的“尖子生”、“学霸”,它的理解能力和创作能力比传统模型更强。不仅具备“倚马可待”的快速生产能力,还具备“下笔如有神”的质量保证。


在文心大模型的支持下,度晓晓完成的高考作文比以往有了明显的质量提升。首先,生成的作文能够紧扣主题、立意明确,度晓晓很好地理解了给定的作文题目,围绕主题进行文字的组织,佐证文章观点,输出对于主题积极正向的见解;然后在 800 字的长文本中,度晓晓能够保证生成的内容结构完整、语言流畅,并在开头引入和结尾扣题,上下文衔接流畅。同时,由于文心大模型具备更强的知识储备,度晓晓生成的作文更善于引经据典,并恰当使用排比、比喻等修辞手法,提升了文章的可读性。


不过,让申怡感到意外的是,度晓晓在作文里犯了个小错误——使用了网络热词 YYDS。而之所以会出现这样的“丢分点”,是因为度晓晓学习了一些热门网络数据。从生成文章的前后文看,度晓晓是领会了 YYDS 的“精髓”,本身用法贴切,但不太符合高考作文写作规范,也侧面反映了 AI 写作还可以继续学习、进步。


文心大模型助力智能创作,推动 AIGC 时代到来


过去一年,百度 AI 技术落地加速,其中尤以近来新兴的 AIGC 引人注目。AIGC 是继 UGC、PGC 之后一种新型的内容生产方式,指运用人工智能技术自动生产内容,数字人、TTV(Text to Video)等都是其标杆性应用。


百度研究院预测,2022 年 AIGC 技术将借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,实现大规模应用。


本次度晓晓写高考作文,就是基于飞桨文心大模型实现的 AIGC 创作。文心大模型具备“知识增强”的核心特点,能从大规模知识和海量数据中进行融合学习,学习效率更高、效果更好,具有通用性好、泛化性强的特点。


除了智能写作,在文心大模型的支持下,AI 已经具备了很强的理解和生成能力,能够实现创意作品的自动生成,包括 AI 作画、AI 写歌、AI 剪辑等。目前,智能作画、智能对话、智能创作、故事生成等大模型的创意应用已经上线文心大模型创意与探索社区——旸谷社区,搜索「文心大模型」即可进入官网进行体验。未来,基于大模型的 AIGC 将会开放赋能到更多的内容生产领域。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-06-10 17:033314
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 494.7 次阅读, 收获喜欢 1968 次。

关注

评论

发布
暂无评论
发现更多内容

OpenHarmony设备开发环境搭建/源码获取/编译/烧录

拓维信息

OpenHarmony 烧录

《第四期(2021-2022)传统行业云原生技术落地调研报告——金融篇》重磅发布!

York

容器 DevOps 云原生 金融科技 金融行业

2021物联之星评选结果重磅出炉!AIoT产业核心玩家已经浮现

dgiot

LabVIEW保存、读取配置文件

不脱发的程序猿

LabVIEW 保存、读取配置文件

Redis线程模型

javaadu

redis 面试题

关于帮助中心,你需要知道的一切

小炮

使用 CachedNetworkImage 实现图片离线缓存

岛上码农

flutter ios Android开发 移动端开发 3月月更

持续集成引擎篇:K8S与服务自动发布

Docker 架构 k8s 持续集成 jenkins

低代码如何助力化学材料行业数字化升级?

TOBESOFT特碧软件

低代码 数字化转型 MES系统 制造业 TOBESOFT

网络安全 kali Web安全之CSRF攻击

学神来啦

网络安全 CSRF WEB安全 kali kali Linux

欧拉的奇异之旅·共赴开源时代

脑极体

微博评论高性能高可用场景

风中奇缘

架构实战营 「架构实战营」

golang并发控制设计中的“流式模型”

不登山的小鲁

golang

低调不了!最佳体验尽在 Erda 2.0 版本

尔达Erda

云计算 云原生 设计 发布 界面改版

条码WMS系统与ERP接口实现方法

源字节1号

后端开发 WMS系统 ERP接口

尤达 DDD 领域驱动设计思想 第三章作业(识别SmartRM系统货柜机免密支付购物场景里的聚合)

代廉洁

尤达DDD领域驱动设计思想

2022年,人工智能和数据发展呈现哪五大趋势?

澳鹏Appen

人工智能 机器学习 深度学习 训练数据

使用APICloud平台实现朋友圈功能

YonBuilder低代码开发平台

html5 css3 APP开发 APICloud JavaScrip

微博评论高性能高可用架构设计

随欣所遇

架构训练营5期

限时200位免费!网易云信娱乐社交公开课来啦!

网易云信

娱乐社交

搜索引擎Elasticsearch简介实践

yuexin_tech

elasticsearch

腾讯云COS对象存储攻防

火线安全

云原生 云安全 云原生应用

OceanBase 在线体验环境,现已上线!

OceanBase 数据库

oceanbase OceanBase 社区版 在线体验站

一文剖析:LVS/Nginx/HAProxy原理及应用场景

穿过生命散发芬芳

3月月更

大型企业SAP集成WMS系统方案流程

源字节1号

开源 解决方案 后端技术

LabVIEW设计自定义滚动条

不脱发的程序猿

LabVIEW 设计自定义滚动条

微软云对象存储攻防

火线安全

云原生 云原生应用 云安全攻防 云安全研究

利用Struts拦截器限制上传图片的格式和大小

喀拉峻

网络安全

最棒的 7 个 Laravel admin 后台管理系统推荐 - 卡拉云

蒋川

laravel vue admin

重学架构之微博评论高性能高可用计算架构

陈华英

架构实战营 #架构实战营

Linux网络管理工具:ifconfig,从入门到精通!

Ethereal

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生_AI&大模型_刘燕_InfoQ精选文章