写点什么

飞桨文心大模型挑战高考作文:平均 1 秒生成 1 篇,水平超 75% 考生

  • 2022-06-10
  • 本文字数:1698 字

    阅读完需:约 6 分钟

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生

全国高考正在进行中,百度 AI 技术也迎来一场“高考”。6 月 7 日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作。


AI 写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓完成了高考作文的写作。


度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40 秒就根据题目创作了 40 多篇文章,平均 1 秒生成 1 篇,随机抽取其中一篇,其分数已赶超约 75%高考考生。



文心大模型写作:平均 1 秒 1 篇,成绩超 75%考生


将 AI 应用于文字创作,在技术圈里早已不算新鲜事。随着大数据、深度学习等技术的发展,AI 在文本生成能力上有了大幅度提升。从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI 写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。


但相比于评论、摘要、快报等内容形式,用 AI 生成高考作文的难度显然更高。高考作文的写作在“审题”、“逻辑”和“创意”等三个方面对 AI 提出了更大的挑战。在审题层面,高考作文题材、形式众多,再加上纷繁复杂的内容主题,每一种千变万化的组合都是对 AI 的理解能力的极限考验。逻辑层面,高考作文要求 800 字以上,如何保证长文各个片段之间的逻辑性和连贯性对 AI 是另一大挑战。最后,在创意层面,可读性是高考作文最重要的评分标准之一,AI 写作不仅要切题连贯,还要善于引经据典、巧用修辞,甚至推陈出新,避免文章空洞乏味。


面对这些挑战,度晓晓在飞桨文心大模型的帮助指导下,又快又好地完成了写作。曾担任北京高考语文阅卷组组长的申怡为度晓晓的作文打出了 48 分的成绩(满分 60 分)。她表示,根据往年情况,获得 48 分及以上作文成绩的考生,仅占不到 25%,也就是说,度晓晓的作文分数已赶超约 75%高考考生。



这背后得益于文心大模型最新发布的融合任务相关知识的千亿大模型 ERNIE 3.0 Zeus,该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上表现出了更强的零样本和小样本学习能力。通俗地讲,文心大模型就像个见多识广的“尖子生”、“学霸”,它的理解能力和创作能力比传统模型更强。不仅具备“倚马可待”的快速生产能力,还具备“下笔如有神”的质量保证。


在文心大模型的支持下,度晓晓完成的高考作文比以往有了明显的质量提升。首先,生成的作文能够紧扣主题、立意明确,度晓晓很好地理解了给定的作文题目,围绕主题进行文字的组织,佐证文章观点,输出对于主题积极正向的见解;然后在 800 字的长文本中,度晓晓能够保证生成的内容结构完整、语言流畅,并在开头引入和结尾扣题,上下文衔接流畅。同时,由于文心大模型具备更强的知识储备,度晓晓生成的作文更善于引经据典,并恰当使用排比、比喻等修辞手法,提升了文章的可读性。


不过,让申怡感到意外的是,度晓晓在作文里犯了个小错误——使用了网络热词 YYDS。而之所以会出现这样的“丢分点”,是因为度晓晓学习了一些热门网络数据。从生成文章的前后文看,度晓晓是领会了 YYDS 的“精髓”,本身用法贴切,但不太符合高考作文写作规范,也侧面反映了 AI 写作还可以继续学习、进步。


文心大模型助力智能创作,推动 AIGC 时代到来


过去一年,百度 AI 技术落地加速,其中尤以近来新兴的 AIGC 引人注目。AIGC 是继 UGC、PGC 之后一种新型的内容生产方式,指运用人工智能技术自动生产内容,数字人、TTV(Text to Video)等都是其标杆性应用。


百度研究院预测,2022 年 AIGC 技术将借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,实现大规模应用。


本次度晓晓写高考作文,就是基于飞桨文心大模型实现的 AIGC 创作。文心大模型具备“知识增强”的核心特点,能从大规模知识和海量数据中进行融合学习,学习效率更高、效果更好,具有通用性好、泛化性强的特点。


除了智能写作,在文心大模型的支持下,AI 已经具备了很强的理解和生成能力,能够实现创意作品的自动生成,包括 AI 作画、AI 写歌、AI 剪辑等。目前,智能作画、智能对话、智能创作、故事生成等大模型的创意应用已经上线文心大模型创意与探索社区——旸谷社区,搜索「文心大模型」即可进入官网进行体验。未来,基于大模型的 AIGC 将会开放赋能到更多的内容生产领域。

2022-06-10 17:034069
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 581.2 次阅读, 收获喜欢 1981 次。

关注

评论

发布
暂无评论
发现更多内容

云上如何实现 Autoscaling: AutoMQ 的实战经验与教训

AutoMQ

大数据 kafka 云原生 AutoMQ autoscaling

荣获优秀共建方!开放原子开源大赛&龙蜥机密赛题决赛圆满结束

OpenAnolis小助手

操作系统 龙蜥社区 机密计算

《龙蜥理事说》第二期对话统信软件 AI 让操作系统更智能

OpenAnolis小助手

AI 操作系统 国产操作系统 龙蜥社区

基础设施SIG月度动态:社区官网上线《龙蜥理事说》专题页,内核门禁提速

OpenAnolis小助手

开源 操作系统 龙蜥社区 龙蜥社区SIG

全球首发!龙蜥社区助力 Intel SPR 加速器上云

OpenAnolis小助手

云原生 操作系统 envoy 龙蜥社区 Intel SPR

华为云FunctionGraph构建高可用系统的实践

华为云开发者联盟

华为云 华为云FunctionGraph 华为云开发者联盟 华为云Serverless 企业号2024年4月PK榜

1 名工程师轻松管理 20 个工作流,创业企业用 Serverless 让数据处理流程提效

阿里巴巴云原生

阿里云 Serverless 云原生

大模型微调提升AI应用性能

百度开发者中心

人工智能 大模型

Go-Zero微服务快速入门和最佳实践(一)

王中阳Go

Go golang 分布式 微服务 go-zero

好消息!职场<火焰杯>测试开发大赛开始报名啦!

测试人

软件测试 自动化测试 测试开发

浪潮信息联合龙蜥社区推出 InManageBoot:让开局交付变得如此简单!

OpenAnolis小助手

运维 操作系统 龙蜥社区 InManageBoot

助力用户快速学习、使用大模型,天翼云即将上线Llama 3大模型学习机

编程猫

合合信息Embedding模型获得MTEB中文榜单第一

陈橘又青

合合信息

灵魂画手有救了!字节开放模型 Hyper-SD,最快 1 步生成 SOTA 级图片(有demo 来试试

字节跳动开源

人工智能 视觉智能 开放应用模型 扩散模型

MES系统功能有什么?对企业有什么价值?

万界星空科技

工业互联网 制造业 生产管理系统 mes 万界星空科技

商品计划在服装品牌供应链管理中的突出地位

第七在线

选择便宜的云主机,让你的网站实现高性价比托管

一只扑棱蛾子

云主机

软件测试如何选择最佳的自动化测试定位策略?

测试人

软件测试

时之鑫门窗|为什么选购门窗时推荐用十大品牌门窗

科技热闻

4 月 30 日启动报名!2024 开源之夏&龙蜥社区赛题等你来挑战

OpenAnolis小助手

开源 操作系统 龙蜥社区 开源之夏

安全厂商长擎软件加入龙蜥社区,共建领先的 OS 基础设施

OpenAnolis小助手

操作系统 国产操作系统 龙蜥社区生态伙伴

Anolis OS 23.1 BETA 预览版:龙芯同源异构完成,支持更多芯片厂家

OpenAnolis小助手

开源 操作系统 龙蜥社区 龙蜥操作系统 Anolis OS

张朝阳对话华为Fellow陈海波:万物智联时代,鸿蒙如何实现“换道超车”?

最新动态

飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生_AI&大模型_刘燕_InfoQ精选文章