写点什么

Amazon Transcribe 现已支持中文普通话和俄语

  • 2019-09-18
  • 本文字数:1605 字

    阅读完需:约 5 分钟

Amazon Transcribe 现已支持中文普通话和俄语

由于语音是人类互动的核心,人工智能研究长期以来一直专注于语音识别,这是设计和构建可使人类与机器进行直观互动的系统的第一步。语言、口音和语音的多样性使这成为一个非常困难的问题,需要专家技能、超大数据集和庞大的计算能力来训练效率模型。


为帮助组织和开发人员在他们的应用程序中使用语音识别,我们在 AWS re:Invent 2017 上发布了 Amazon Transcribe,这是一项自动语音识别服务。借助 Amazon Transcribe,客户(如 VideoPeel、Echo360 或 GE Appliances)能够快速、轻松地将语音识别功能添加到其应用程序和设备中。


只需一个 API 调用即可…您无需了解有关机器学习的核心知识。您可以分析存储在 Amazon Simple Storage Service (S3) 中的音频文件,并使用该服务返回转录的语音的文本文件。您还可以向 Amazon Transcribe 发送实时音频流,并实时接收转录内容流。


自该项服务发布以来,团队不断添加新语言,今天我们很高兴地宣布该项服务现已支持中文普通话和俄语,使支持的语言总数达到 16 种。


推出中文普通话支持


使用 Amazon Transcribe 非常简单:给我几分钟向您展示如何操作。


我们先试试普通话。从这个“小红帽的故事”视频入手,我提取了音轨,将其保存为 MP3 格式,并将其上传到我的一个 Amazon Simple Storage Service (S3) 存储桶中。下面是实际文件。


然后,我使用 AWS CLI 开始转录:


$ aws transcribe start-transcription-job--media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/little_red_riding_hood-mandarin.mp3 --media-format mp3 --language-code zh-CN --transcription-job-name little_red_riding_hood-mandarin
复制代码


几分钟后,转录完成。查看 AWS 控制台时,我可以使用 Amazon Transcribe 提供的 URL 下载,也可以直接读取。



不过,我不会说普通话,但借助 Amazon Translate 可以知道该文本讲的是一个生病的祖母和一只大坏狼的故事,因此看起来 Amazon Transcribe 顺利完成了任务!


推出俄语支持


现在,我们用这个短视频中的对话试试俄语。


Здравствуйте! Greetings!


Добрый день! Good day!


Давайте познакомимся.Меня зовут Слава. Let’s introduce ourselves.My name is Slava.


Очень приятно, а меня – Наташа. Nice to meet you, and mine – Natasha.


Наташа, кто вы по профессии? Natasha, what is your profession?


Я врач.А вы? I (am a) doctor.And you?


Я инженер. I (am an) engineer.


这次,我也会让 Amazon Transcribe 进行说话人识别。


$ aws transcribe start-transcription-job --media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/russian-dialogue.mp3 --media-format mp3 --language-code ru-RU --transcription-job-name russian_dialogue --settings ShowSpeakerLabels=true,MaxSpeakerLabels=2
复制代码


结果如下。



如您所见,Amazon Transcribe 不仅忠实地将语音转换为文本,还准确地将每个句子分配给正确的说话人。


现已推出!


您可以在以下地区开始使用这两种新语言:


  • 美洲:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、AWS GovCloud(美国西部)、加拿大(中部)、南美洲(圣保罗)。

  • 欧洲:欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(巴黎)。

  • 亚太地区:亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)。

  • 从您首次请求转录开始,免费套餐在前 12 个月供您免费使用 60 分钟。


与以往一样,我们希望收到您的反馈:请将反馈发布到 AWS 论坛的 Amazon Transcribe 版块,或通过您常用的 AWS 联系方式发送反馈。


本文转载自 AWS 博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-now-supports-mandarin-and-russian/


2019-09-18 17:171451
用户头像

发布了 1960 篇内容, 共 167.8 次阅读, 收获喜欢 82 次。

关注

评论

发布
暂无评论
发现更多内容

从零开始,开启属于你的 RTE 漫游之旅!丨漫游指南 x 即将启航

RTE开发者社区

音视频

华为云CDN,为企业内容加速打开新局面!

IT科技苏辞

国产时序数据库TDengines学习调研及总结

李草凯

Go Ubuntu 安装 gvm:Go 版本管理工具

非晓为骁

Go ubuntu 版本管理工具 gvm

Wallys/MIMO/Industrial-grade/2x 2 900M high powerRadio /902-928Mhz/AR9223/ AR9582/AR9531/AR9344/

Cindy-wallys

智能勘探 | AIRIOT智慧油田管理解决方案

AIRIOT

物联网 智慧油田

为什么 APISIX Ingress 是比 Traefik 更好的选择?

API7.ai 技术团队

云原生 APISIX Ingress Controller Kubernetes Serverless

华为云CDN节点扩增力度加大,构建全球智能边缘网络

爱尚科技

华为云CDN通过全站加速引领网站性能全面优化

爱尚科技

【附下载】政企数智办公平台研究报告,何以数智化?

融云 RongCloud

数智化 百幄

作业2:微信朋友圈的高性能复杂度

白杨

阿里云斩获2022全球分布式云大会两项大奖

云布道师

阿里云

哈啰出行高质量故障复盘法:“3+5+3”(附模板)

TakinTalks稳定性社区

学习无代码开发工具有什么用?

间隔

微信小程序 无代码开发

AI 训练加速原理解析与工程实践分享

Baidu AICLOUD

异构计算 云原生AI 百度百舸

华为云CDN,助力中小企业提升用户体验

IT科技苏辞

华为云CDN,助力电商平台无惧流量洪峰

IT科技苏辞

南开大学团队采用全场景AI框架昇思MindSpore,打造“皮肤病大规模可信综合辅助诊断系统”

极客天地

天花板级别ZooKeeper+Dubbo笔记,通俗易懂,颠覆认知

小小怪下士

Java zookeeper dubbo

我们是如何构建自己的可观测性的

观测云

云计算 可观测性 云服务 观测云

数据也能开口说话?这次汇报,老板疯狂给我点赞

图灵教育

数据分析 可视化 图表

数据也能开口说话?这次汇报,老板疯狂给我点赞

图灵社区

数据分析 可视化 图表

华为云CDN助力企业用户体验全面优化,让企业“惠”加速

爱尚科技

以英雄之名为S9总决赛助攻!虎牙直播and华为云CDN,team work才会赢

爱尚科技

为什么说华为云CDN更值得选择?

爱尚科技

华为云CDN,为企业提供极致低时延用户体验

IT科技苏辞

什么样的技术,能让黄河开口说话?

白洞计划

数据治理:数据集成架构的演进

用友BIP

华为云CDN为芒果TV加速,打造丝滑“追剧观综”的观看体验

爱尚科技

当 Amazon Lambda 遇上 Apache APISIX 可以擦出什么火花?

API7.ai 技术团队

微服务 AWS API Gateway APISIX 网关

Amazon Transcribe 现已支持中文普通话和俄语_编程语言_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章