写点什么

Distill CLI:亚马逊 CTO Werner Vogels 发布由 Rust 驱动的媒体总结工具

Renato Losio

  • 2024-07-15
    北京
  • 本文字数:1296 字

    阅读完需:约 4 分钟

大小:618.51K时长:03:31
Distill CLI:亚马逊 CTO Werner Vogels 发布由 Rust 驱动的媒体总结工具

亚马逊 CTO Werner Vogels 近期发布了一款用 Rust 编写的私人项目,Distill CLI。该开源工具借助亚马逊的 Transcribe 和 Bedrock 直接从命令行生成录音的摘要总结。  


新的 CLI 是基于开源工具 Amazon Bedrock Audio Summarizer,利用 Amazon S3、Amazon Lambda、Amazon Transcribe、Amazon Bedrock 以及 AWS CDK 管理项目的基础设施,从而提供自动转录和总结多媒体文件的方式。今年上半年,Vogels 在介绍 Distill 的《骇入更好的 Team 会议》一文首次提到了这个项目。



Example of Distlll CLI 的输出示例。来源:博客《分布的万物》

这款由 Vogels 和他在亚马逊的团队开发的 Rust 应用程序可以总结提取日常会议中的重要细节,他写道:


我一直在寻找能够帮我完善自己记笔记过程的工具和策略(比如康奈尔笔记法)。虽然通常情况下我更喜欢纸笔(因为纸笔有助于记忆和归纳),但不可否认的是技术的确可以帮我们提高积累能力,尤其是在会议等场合,积极参会和记录笔记可能会互相冲突。



Distill 的首个版本。来源:博客《分布的万物》


Vogels 分享了项目早期阶段的技术选择细节,该项目意在利用人工智能转录和总结线上多人会议:


我们用 Rust 重写了一个 Lambda 函数,结果发现冷启动速度提高了 12 倍,内存占用减少了 73%。随即我就开始思考其他可以提高整体流程效率的方式。


他强调说最初的 POC 里是将媒体文件、记录稿和总结稿保存在 S3,但发布版本的 Distill CLI 则是将记录稿和总结稿保存在内存,从而减少向 S3 写入的次数。该 CLI 的简单用户界面提供状态更新,并会在出现任何故障时通知用户,使用户可在不离开命令行界面即可上传 meticulous 文件并监控总结摘要的处理过程。


Distill CLI 支持将摘要输出到终端和 Word 文档、文本文件、markdown 及 Slack 消息等格式。这项工具可以处理 Amazon Transcribe 所支持的任何语言 的音频文件。


尽管 Distill CLI 需求是源自团队,但 Vogels 承认他的目标是用一种新的语言挑战自己,证明鼓捣是学习和保持好奇心的有效方法:


我以前也说过,这些事情你都要自己做,否则这些都是瞎扯。随着越来越多的人选择用 Rust 来大规模解决棘手的问题,我觉得是时候亲自动手了。


他承认 Rust 可能会颇具挑战性:


前期会有很多难题,当你只想立刻在 IDE 里开始构建的时候,这些有时会很难。但只要度过了开头的门槛,你就会发现速度加快的巨大潜力。请记住,构建一个系统、服务或应用程序的成本与它的运营成本相比微不足道。因此我们应不断审视自己的构建方式。


Pyle 云科技的联合创始人 Benjamen Pyle 评论道:


非常高兴能看到亚马逊支持、鼓励并投资于 Rust。这是一款适合各类型用例的神奇编程语言,适用于 CLI 工具、嵌入式系统、Web API,甚至是无服务器的工作负载。


用户 erikhopf 在 Hacker News 上补充道:


和在亚马逊上编写文档相比,我很喜欢这种学习用 Rust 写文档,前者简直是战场雷区。Distill CLI 目前在 GitHub 上以 Apache 2.0 许可发布。


查看英文原文:


Distill CLI: Amazon CTO Werner Vogels Unveils Rust-Powered Media Summarization Tool (https://www.infoq.com/news/2024/07/distill-cli-werner-vogels/)


声明:本文由 InfoQ 翻译,未经许可禁止转载。

2024-07-15 10:006080

评论

发布
暂无评论
发现更多内容

比曲婉婷云尽孝更可怕的是:2020年,低收入家庭仍然在被收割

成周

心理学 教育 培训 维权 曲婉婷

Go编程(二) 多线程简单斗地主

dongfanger

编程 开发 Go 语言

点对点音视频应用场景及优势

anyRTC开发者

音视频 WebRTC 直播 RTC 安卓

一篇文章搞定 Nginx 反向代理与负载均衡

哈喽沃德先生

nginx 负载均衡 反向代理 服务器 正向代理与反向代理

10多家公司的Java开发面试常见问题合集

Java架构师迁哥

StreamNative 宣布开源 MoP:Apache Pulsar 支持原生 MQTT 协议

Apache Pulsar

开源 云原生 mqtt Apache Pulsar 消息中间件

一次注定失败的裸面

escray

ruby 程序员 面试 面经

奈学:Java 和 JavaScript 是什么关系?

古月木易

Java

浅谈滴滴需求响应式公交背后的技术

滴滴技术

滴滴技术 创新公交 路径优化

Go编程(一) 怎么写Go代码

dongfanger

编程 开发 Go 语言

国庆假期快来了,打开8天长假的正确方式是...

老胡爱分享

读书 书籍推荐 随笔杂谈

奈学:Java 和 JavaScript 是什么关系?

奈学教育

Java

DàYé玩转数据战略Step By Step

曲水流觞TechRill

数据中台 数字化

JAVA集合之ConcurrentHashMap

彭阿三

Java JAVA集合

信息公交服务在滴滴的应用实践

滴滴技术

滴滴技术 人工只能 信息公交 路径优化

融云技术分享:基于WebRTC的实时音视频首帧显示时间优化实践

JackJiang

音视频 即时通讯 实时通信

2020年行摄回忆录(上)

穿过生命散发芬芳

生活 摄影

Java源码系列1——ArrayList

超超不会飞

Java

初学源码之——Spring IOC 应用

Java架构师迁哥

linux 文件权限控制

kcnf

linux 文件权限控制 acl

聊一下《技术力量-一线技术团队成功启示录》

Man

中台 研发管理

架构1期第三周作业二

道长

极客大学架构师训练营

Spring 5 中文解析数据存储篇-JDBC数据存储(下)

青年IT男

Spring5

甲方日常 24

句子

工作 随笔杂谈 日常

java安全编码指南之:异常处理

程序那些事

java安全编码 java安全 java安全编码指南

图解 K8S 源码 - Deployment Controller 篇

郭旭东

Kubernetes Kubernetes源码

数据挖掘技术在轨迹数据上的应用实践

滴滴技术

人工智能 数据挖掘 滴滴技术 轨道技术 创新公交

看看别人是怎么面试蚂蚁金服的!社招Java面经分享

Java架构师迁哥

Java 阿里巴巴 面试 蚂蚁金服

不一样的面向对象(三)

书旅

php 面向对象 面向对象编程

2020面试阿里字节跳动90%被问到的JVM面试题附答案

Java架构师迁哥

倒计时!Pulsar Summit Asia 2020 演讲征集

Apache Pulsar

开源 云原生 pulsar Apache Pulsar 消息中间件

Distill CLI:亚马逊 CTO Werner Vogels 发布由 Rust 驱动的媒体总结工具_管理/文化_InfoQ精选文章