
AlphaWrite 是由 Toby Simonds 开发的一个新的写作框架,通过结构和可衡量的改进来增强创意写作,在推理过程中采用进化算法迭代提升故事的质量。
创意生成一直是大语言模型面临的一个难题,这并非因为缺乏流畅性,而是因为难以评估角色发展、情感冲击和叙事连贯性等相对比较主观的故事质量。AlphaWrite 借鉴了进化算法和 AlphaEvolve 等系统的思想,并将其应用于故事生成。
这个系统按照周期进行迭代,首先生成一组多样化的故事,这些故事在风格和主题上各不相同。然后,LLM 裁判依据详尽的叙事质量评分标准和 Elo 评分系统 对故事进行比较。表现最佳的故事被选中,用于生成在结构优化、对话精炼或散文润色等方面具有针对性改进的故事变体。这个过程在各个迭代中重复进行,随着时间的推移逐步打磨和完善故事。

来源:tobysimonds.com
正如 AlphaWrite 的作者 Toby Simonds 在 X 上分享的那样:
其奥秘在于进化压力。故事不是只生成一次 —— 它们会竞争、变异,并在多次迭代中改进。表现最好的故事成为下一代的 “父母”,而表现不佳的故事则被更好的变体取代。
早期采用 Llama 3.1 8B 进行的实验已彰显出显著的成效。AlphaWrite 生成的故事有 72% 的概率优于初始单次生成的故事,比通过连续提示词生成的故事高出 62%,这两个结果都具有统计学意义。这个系统还支持递归改进:经过提炼的输出被整合回基础模型,然后可以进行另一轮进化。

来源:tobysimonds.com
尽管实验结果令人振奋,但这一进展并非得到了所有人的认可。一位用户在 Hacker News 的评论中写道:
如果有什么是我希望人工智能永远不要触碰的,那就是它。请停止让世界变得更糟。
对此,另一位用户补充道:
并非每个人的世界观都跟你一样……你可以选择不参与,可以忽略人工智能生成或辅助的内容……但你没有必要贬低和忽视他人的兴趣。
这些不同的反应反映出了人工智能在创意领域更广泛的文化张力 —— 它是增强了还是削弱了人类表达能力。AlphaWrite 团队承认,评估故事质量仍然带有主观性,并警告仍然存在提示词偏差和创意趋同等风险。
尽管如此,AlphaWrite 的潜力并不仅限于小说创作。作者指出,该系统协助起草了他们论文的部分内容,并且能够适应技术写作、营销以及学术内容等多种领域。凭借合适的评分标准,这种方法可以用于优化特定的写作任务,甚至有望用于改进基础模型本身。
代码已在 AlphaWrite GitHub 仓库中公开,供开发人员和研究人员探索。
【声明:本文由 InfoQ 翻译,未经许可禁止转载。】
评论