《2023中国云原生成熟度模型报告》清晰展现中国云原生技术发展成熟度现状! 了解详情
写点什么

飞桨文心大模型挑战高考作文:平均 1 秒生成 1 篇,水平超 75% 考生

  • 2022-06-10
  • 本文字数:1698 字

    阅读完需:约 6 分钟

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生

全国高考正在进行中,百度 AI 技术也迎来一场“高考”。6 月 7 日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作。


AI 写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓完成了高考作文的写作。


度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40 秒就根据题目创作了 40 多篇文章,平均 1 秒生成 1 篇,随机抽取其中一篇,其分数已赶超约 75%高考考生。



文心大模型写作:平均 1 秒 1 篇,成绩超 75%考生


将 AI 应用于文字创作,在技术圈里早已不算新鲜事。随着大数据、深度学习等技术的发展,AI 在文本生成能力上有了大幅度提升。从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI 写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。


但相比于评论、摘要、快报等内容形式,用 AI 生成高考作文的难度显然更高。高考作文的写作在“审题”、“逻辑”和“创意”等三个方面对 AI 提出了更大的挑战。在审题层面,高考作文题材、形式众多,再加上纷繁复杂的内容主题,每一种千变万化的组合都是对 AI 的理解能力的极限考验。逻辑层面,高考作文要求 800 字以上,如何保证长文各个片段之间的逻辑性和连贯性对 AI 是另一大挑战。最后,在创意层面,可读性是高考作文最重要的评分标准之一,AI 写作不仅要切题连贯,还要善于引经据典、巧用修辞,甚至推陈出新,避免文章空洞乏味。


面对这些挑战,度晓晓在飞桨文心大模型的帮助指导下,又快又好地完成了写作。曾担任北京高考语文阅卷组组长的申怡为度晓晓的作文打出了 48 分的成绩(满分 60 分)。她表示,根据往年情况,获得 48 分及以上作文成绩的考生,仅占不到 25%,也就是说,度晓晓的作文分数已赶超约 75%高考考生。



这背后得益于文心大模型最新发布的融合任务相关知识的千亿大模型 ERNIE 3.0 Zeus,该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上表现出了更强的零样本和小样本学习能力。通俗地讲,文心大模型就像个见多识广的“尖子生”、“学霸”,它的理解能力和创作能力比传统模型更强。不仅具备“倚马可待”的快速生产能力,还具备“下笔如有神”的质量保证。


在文心大模型的支持下,度晓晓完成的高考作文比以往有了明显的质量提升。首先,生成的作文能够紧扣主题、立意明确,度晓晓很好地理解了给定的作文题目,围绕主题进行文字的组织,佐证文章观点,输出对于主题积极正向的见解;然后在 800 字的长文本中,度晓晓能够保证生成的内容结构完整、语言流畅,并在开头引入和结尾扣题,上下文衔接流畅。同时,由于文心大模型具备更强的知识储备,度晓晓生成的作文更善于引经据典,并恰当使用排比、比喻等修辞手法,提升了文章的可读性。


不过,让申怡感到意外的是,度晓晓在作文里犯了个小错误——使用了网络热词 YYDS。而之所以会出现这样的“丢分点”,是因为度晓晓学习了一些热门网络数据。从生成文章的前后文看,度晓晓是领会了 YYDS 的“精髓”,本身用法贴切,但不太符合高考作文写作规范,也侧面反映了 AI 写作还可以继续学习、进步。


文心大模型助力智能创作,推动 AIGC 时代到来


过去一年,百度 AI 技术落地加速,其中尤以近来新兴的 AIGC 引人注目。AIGC 是继 UGC、PGC 之后一种新型的内容生产方式,指运用人工智能技术自动生产内容,数字人、TTV(Text to Video)等都是其标杆性应用。


百度研究院预测,2022 年 AIGC 技术将借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,实现大规模应用。


本次度晓晓写高考作文,就是基于飞桨文心大模型实现的 AIGC 创作。文心大模型具备“知识增强”的核心特点,能从大规模知识和海量数据中进行融合学习,学习效率更高、效果更好,具有通用性好、泛化性强的特点。


除了智能写作,在文心大模型的支持下,AI 已经具备了很强的理解和生成能力,能够实现创意作品的自动生成,包括 AI 作画、AI 写歌、AI 剪辑等。目前,智能作画、智能对话、智能创作、故事生成等大模型的创意应用已经上线文心大模型创意与探索社区——旸谷社区,搜索「文心大模型」即可进入官网进行体验。未来,基于大模型的 AIGC 将会开放赋能到更多的内容生产领域。

2022-06-10 17:033043
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 464.9 次阅读, 收获喜欢 1951 次。

关注

评论

发布
暂无评论
发现更多内容

桌面应用打包:pyinstaller | 京东物流技术团队

京东科技开发者

Python pyinstaller 桌面应用 企业号 8 月 PK 榜

在langchain中使用自定义example selector

程序那些事

程序那些事 大语言模型 langchain

DFS算法解析

数新网络官方账号

算法 DFS 深度优先搜索

AI概念引爆ChinaJoy,聆心智能助力数字娱乐产业新应用

硬科技星球

堡垒机-企业最好的家人,信息安全的守门人

行云管家

互联网 网络安全 信息安全 堡垒机

InnoDB 单表数据量超过 2000W 出现性能问题

红袖添香

MySQL innodb 索引 B+树 缓冲池

HDC 2023丨以HarmonyOS技术赋能艺术,引领鸿蒙生态媒体体验升级

最新动态

R2在全渠道业务线的落地 | 京东云技术团队

京东科技开发者

测试 质量 企业号 8 月 PK 榜 R2

MySQL 体系结构

红袖添香

MySQL 存储引擎 InnoDB存储引擎

什么是数字化管理,对企业价值几何?

优秀

数字化转型 数字经济 数字化管理

速度提升10倍,腾讯基于Iceberg的数据治理与优化实践

腾讯云大数据

数据湖

MySQL事务ACID原理

红袖添香

MySQL 数据库 事务 ACID MySQL InnoDB

融云荣登36氪WISE2023「全球化最佳基础设施」榜单

融云 RongCloud

全球化 通信 运营 融云 wise

以数驱动 | 智能分析云助力流程制造行业绿色高效运营

用友BIP

智能分析

解锁Spring组件扫描的新视角

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

一文详解TextBrewer

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 8 月 PK 榜

LMOps 工具链与千帆大模型平台

Baidu AICLOUD

LLMOps 大模型微调 千帆大模型平台 LMops

5 小时玩转阿里云 Flink 实时湖仓,速速报名!

Apache Flink

大数据 flink 实时计算

Downie 4 for Mac(视频下载软件) 4.6.24中文直装版

mac

视频下载工具 苹果mac Windows软件 Downie

10分钟了解Flink Watermark水印

不焦躁的程序员

Java 大数据 flink 程序员

啾啾火箭队 宇宙 ChuChu Rocket Universe for Mac(益智解谜游戏)v1.3.0中文版

mac

mac游戏 苹果mac ChuChu Rocket Universe 益智游戏

深入理解 HDFS(四):Socket

冰心的小屋

hdfs NameNode IPC Server HDFS client 通信渠道

一条SQL如何被MySQL架构中的各个组件操作执行的?

砖业洋__

MySQL MySQL架构 MySQL优化器 MySQL执行器 MySQL存储引擎

C4D软件都应用在影视后期什么领域?

Finovy Cloud

杭钢集团:以一体化管控赋能为引领提升五大能力

用友BIP

数智化转型

直播源码硬核技术分析:主播PK功能

山东布谷网络科技

直播源码

关于ANCE OS兼容性评估 & Linux智能全栈调优KeenTune介绍 | 第 93-94 期

OpenAnolis小助手

QA sig 龙蜥大讲堂 KeenTune ANCE

搭载KaihongOS的工业平板、机器人、无人机等产品通过OpenHarmony3.2 Release版本兼容性测评

Geek_2d6073

《这就是ChatGPT》读后感

叶轩子

人工智能 深度学习 ChatGPT

利用uplugin对比Webpack和Rollup插件系统

OpenTiny社区

前端

实时入库不用愁,HStore帮分忧

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

  • 扫码添加小助手
    领取最新资料包
飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生_AI_刘燕_InfoQ精选文章