最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

Amazon Transcribe – 大规模实现准确的语音转文本

  • 2019-11-01
  • 本文字数:1371 字

    阅读完需:约 4 分钟

Amazon Transcribe – 大规模实现准确的语音转文本

今天,我们将发布 Amazon Transcribe 的非公开预览版,这是一种自动语音识别 (ASR) 服务,使开发人员可以轻松地为应用程序添加语音转文本功能。随着带宽和连接情况的不断改进,世界上越来越多的数据以视频和音频格式进行存储。人们创建和使用所有这类数据的速度比以往任何时候都快。对于企业来说,拥有从所有这些丰富的多媒体内容中获取价值的一些手段是非常重要的。利用 Amazon Transcribe,您可以通过高效且可扩展的 API 节省成本昂贵的手动转录过程。


您可以通过使用 API 启动一个任务来分析以许多常见格式 (WAV、MP3、Flac 等) 存储在 Amazon Simple Storage Service (S3) 上的音频文件。您将收到每个单词的带时间戳的详细准确的录音文本以及推断的标点符号。在预览过程中,您可以使用异步转录 API 来以英语或西班牙语转录语音。



很多公司正在寻求从其现有的目录及其传入数据中获取价值。通过转录这些存储的媒体,公司可以:


  • 分析客户电话数据

  • 自动创建副标题

  • 基于内容确定广告目标

  • 针对音频和视频内容存档启用丰富的搜索功能


您可以使用 AWS 命令行界面 (CLI)AWS 软件开发工具包 或 Amazon Transcribe 控制台轻松启动转录任务。



Amazon Transcribe 目前提供 3 个 API 操作 (用途不言自明):


  • StartTranscriptionJob

  • GetTranscriptionJob

  • ListTranscriptionJobs


以下是一个简单的 Python 脚本,用于启动一个任务并轮询,直到完成该任务:


Python


from __future__ import print_functionimport timeimport boto3transcribe = boto3.client('transcribe')job_name = "RandallTest1"job_uri = "https://s3-us-west-2.amazonaws.com/randhunt-transcribe-demos/test.flac"transcribe.start_transcription_job(    TranscriptionJobName=job_name,    Media={'MediaFileUri': job_uri},    MediaFormat='flac',    LanguageCode='en-US',    MediaSampleRateHertz=44100)while True:    status = transcribe.get_transcription_job(TranscriptionJobName=job_name)    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:        break  print("Not ready yet...")    time.sleep(5)print(status)
复制代码


完成的任务的结果将链接到一个以 JSON 格式包含我们的转录的 Amazon Simple Storage Service (S3) 预签名 URL:


Json


{  "jobName": "RandallTest1",  "results": {    "transcripts": [{"transcript": "Hello World", "confidence": 1}],    "items": [      {        "start_time": "0.880", "end_time": "1.300",        "alternatives": [{"confidence": 0.91, "word": "Hello"}]      },      {        "start_time": "1.400", "end_time": "1.620",        "alternatives": [{"confidence": 0.84, "word": "World"}]      }    ]  },  "status": "COMPLETED"}
复制代码


如您所见,您获得了每个单词的时间戳和置信度得分。


无论是单独使用还是与其他 Amazon AI 服务结合使用,这都是一项功能强大的服务,我迫不及待地想要看到我们的客户会使用这项服务构建什么!


Randall


附言:


您可能已注意到,这非常适合于 AWS Step Functions,我也是这么认为的。以下是我可能使用的工作流程:



本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-scalable-and-accurate-automatic-speech-recognition/


2019-11-01 08:00909

评论

发布
暂无评论
发现更多内容

Java笔试题及答案详解,nginx入门到精通百度云,全网最全原理讲解

Java 程序员 后端

Java知识体系!极客学院黑马程序员,BIO和NIO有啥区别

Java 程序员 后端

Java程序员如何有效提升学习效率,如何化身BAT面试收割机

Java 程序员 后端

Java程序员面试中最容易答错的8道面试题,tomcat面试题及答案

Java 程序员 后端

Java程序员面试笔试真题,java零基础入门视频百度云,阿里P7大牛亲自讲解

Java 程序员 后端

Java编程入门经典,linux使用教程课后答案,mysql常见笔试题

Java 程序员 后端

Java程序员全套,百度三面牛客网猿生活,疯狂膜拜

Java 程序员 后端

Java框架,黑马java视频教程,面试资料分享

Java 程序员 后端

Java爬虫爬取视频,尚硅谷笔试答案,最全面试考点与面试技巧

Java 程序员 后端

Java百度云教程,深入java虚拟机百度云,附详细答案

Java 程序员 后端

Java百度云资源,java基础案例教程黑马程序员在线阅读,美团Java面试流程

Java 程序员 后端

Java研发岗必问30+道高级面试题,腾讯,字节等大厂面试真题汇总

Java 程序员 后端

Java研发岗面试复盘总,4面技术5面HR附加笔试面

Java 程序员 后端

Java程序员必会!开课吧java高级架构师课程,Java开发大厂面试经验

Java 程序员 后端

Java架构师必备技能,java程序设计实用教程第五版答案,掌握这个提升路径

Java 程序员 后端

Java经典入门教程,vue尚学堂,Java面试问项目

Java 程序员 后端

Java编程入门自学,牛客网在线编程,Java基础入门视频教程

Java 程序员 后端

Java程序员最新职业规划,尚学堂高琪300集,初级Java工程师面试题

Java 程序员 后端

Java月薪过万要掌握的技能,javajdk下载教程,高级Java工程师面试问题

Java 程序员 后端

Java日常开发的12个坑,你踩过几个,一招让你拿下seata分布式事务框架

Java 程序员 后端

Java百度云,springboot实例教程,面试大厂应该注意哪些问题

Java 程序员 后端

Java的Io模型你了解多少?尚硅谷大厂学院课,Java开发面试笔试题大汇总

Java 程序员 后端

Java算法基础面试题,java教程张孝祥百度云,Java初级程序员面试题目

Java 程序员 后端

Java编程书籍推荐,尚硅谷springboot,遇到的面试官都是架构师级别

Java 程序员 后端

Java编程入门经典,慕课网java架构师百度网盘,字节跳动Java高级工程师

Java 程序员 后端

云栖发布|企业级互联网架构全新升级 ,助力数字创新

阿里巴巴云原生

阿里云 云原生 产品升级 云栖大会

Java知识体系!java黑马视频和达内,链表反转的两种实现方法

Java 程序员 后端

Java笔试编程题大全带答案,mysql入门视频教程,Java多态实现原理

Java 程序员 后端

Java春招实习面试经验汇总,图灵学院诸葛,Java微服务架构视频下载

Java 程序员 后端

Java程序员面试笔记,极客时间vue开发实战,Java进阶教程视频

Java 程序员 后端

Java架构师进阶之路,马士兵的java教程,大厂Java面试总结+详细解答

Java 程序员 后端

Amazon Transcribe – 大规模实现准确的语音转文本_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章