写点什么

Amazon Transcribe 现已支持中文普通话和俄语

  • 2019-09-18
  • 本文字数:1605 字

    阅读完需:约 5 分钟

Amazon Transcribe 现已支持中文普通话和俄语

由于语音是人类互动的核心,人工智能研究长期以来一直专注于语音识别,这是设计和构建可使人类与机器进行直观互动的系统的第一步。语言、口音和语音的多样性使这成为一个非常困难的问题,需要专家技能、超大数据集和庞大的计算能力来训练效率模型。


为帮助组织和开发人员在他们的应用程序中使用语音识别,我们在 AWS re:Invent 2017 上发布了 Amazon Transcribe,这是一项自动语音识别服务。借助 Amazon Transcribe,客户(如 VideoPeel、Echo360 或 GE Appliances)能够快速、轻松地将语音识别功能添加到其应用程序和设备中。


只需一个 API 调用即可…您无需了解有关机器学习的核心知识。您可以分析存储在 Amazon Simple Storage Service (S3) 中的音频文件,并使用该服务返回转录的语音的文本文件。您还可以向 Amazon Transcribe 发送实时音频流,并实时接收转录内容流。


自该项服务发布以来,团队不断添加新语言,今天我们很高兴地宣布该项服务现已支持中文普通话和俄语,使支持的语言总数达到 16 种。


推出中文普通话支持


使用 Amazon Transcribe 非常简单:给我几分钟向您展示如何操作。


我们先试试普通话。从这个“小红帽的故事”视频入手,我提取了音轨,将其保存为 MP3 格式,并将其上传到我的一个 Amazon Simple Storage Service (S3) 存储桶中。下面是实际文件。


然后,我使用 AWS CLI 开始转录:


$ aws transcribe start-transcription-job--media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/little_red_riding_hood-mandarin.mp3 --media-format mp3 --language-code zh-CN --transcription-job-name little_red_riding_hood-mandarin
复制代码


几分钟后,转录完成。查看 AWS 控制台时,我可以使用 Amazon Transcribe 提供的 URL 下载,也可以直接读取。



不过,我不会说普通话,但借助 Amazon Translate 可以知道该文本讲的是一个生病的祖母和一只大坏狼的故事,因此看起来 Amazon Transcribe 顺利完成了任务!


推出俄语支持


现在,我们用这个短视频中的对话试试俄语。


Здравствуйте! Greetings!


Добрый день! Good day!


Давайте познакомимся.Меня зовут Слава. Let’s introduce ourselves.My name is Slava.


Очень приятно, а меня – Наташа. Nice to meet you, and mine – Natasha.


Наташа, кто вы по профессии? Natasha, what is your profession?


Я врач.А вы? I (am a) doctor.And you?


Я инженер. I (am an) engineer.


这次,我也会让 Amazon Transcribe 进行说话人识别。


$ aws transcribe start-transcription-job --media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/russian-dialogue.mp3 --media-format mp3 --language-code ru-RU --transcription-job-name russian_dialogue --settings ShowSpeakerLabels=true,MaxSpeakerLabels=2
复制代码


结果如下。



如您所见,Amazon Transcribe 不仅忠实地将语音转换为文本,还准确地将每个句子分配给正确的说话人。


现已推出!


您可以在以下地区开始使用这两种新语言:


  • 美洲:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、AWS GovCloud(美国西部)、加拿大(中部)、南美洲(圣保罗)。

  • 欧洲:欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(巴黎)。

  • 亚太地区:亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)。

  • 从您首次请求转录开始,免费套餐在前 12 个月供您免费使用 60 分钟。


与以往一样,我们希望收到您的反馈:请将反馈发布到 AWS 论坛的 Amazon Transcribe 版块,或通过您常用的 AWS 联系方式发送反馈。


本文转载自 AWS 博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-now-supports-mandarin-and-russian/


2019-09-18 17:171330
用户头像

发布了 1908 篇内容, 共 146.8 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

TDengine 与煤矿智能 AI 视频管理系统实现兼容性互认

TDengine

时序数据库 #TDengine 恒达智控

坐标休斯顿,TDengine 受邀参与第九届石油天然气数字化大会

TDengine

时序数据库 #TDengine

用友iuap 技术平台:创新基础架构,赋能企业数智化转型

用友BIP

数智底座 2023全球商业创新大会

简单好用的音频播放器:Infuse 激活中文最新版

胖墩儿不胖y

媒体播放器 Mac软件 播放器推荐

人民日报发文祝贺,这位作者是藏不住了!

博文视点Broadview

基于开源IM即时通讯框架MobileIMSDK:RainbowChat v10.0版已发布

JackJiang

网络编程 即时通讯 IM

第1期 | 抚今 现代企业已步入新的项目制管理时代

用友BIP

项目管理

大模型开发:从数据挖掘到智能应用

百度开发者中心

AIGC #人工智能 大模型微调

从过去5年CWE TOP 25的数据看软件缺陷的防护

云计算 软件开发 代码

香港站群服务器构建多站点网络的利器,将业务推向新高度

一只扑棱蛾子

站群服务器

创新性与自主性的融合

百度开发者中心

AIGC #人工智能 生成式AI

未来社交媒体的变革者

百度开发者中心

媒体服务 #人工智能 生成式AI

国密算法是什么意思?支持国密算法的云管平台哪家好?

行云管家

云计算 云管平台 云管理 国密 国密浏览器

如何使用Vcluster实现Kubernetes中的多租户

互联网工科生

Kubernetes 集群

SDK或低代码运行时,提示找不到某些库文件

矩视智能

深度学习 机器视觉

应用场域的深度融合与创新构想

百度开发者中心

#人工智能 ChatGPT 大模型微调

从理解到实现:一种强大的AI技术

百度开发者中心

深度学习 #人工智能 生成式AI

晋级揭晓!华秋第九届中国硬件创新创客大赛-华东分赛区决赛成功举办!

华秋电子

创业

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践

Apache Flink

大数据 flink 实时计算

文心一言 VS 讯飞星火 VS chatgpt (95)-- 算法导论9.2 4题

福大大架构师每日一题

福大大架构师每日一题

一文详解数据仓库的物理细粒度备份恢复

华为云开发者联盟

数据库 大数据 华为云 华为云开发者联盟 企业号9月PK榜

支持适配国产化平台的云管理软件你给推荐哪家?

行云管家

云计算 云服务 国产化 云管理

基于Falcon-7B模型的QLoRA微调实操:构建面向心理健康领域的Chatbot

Baihai IDP

AI LLM 白海科技 大模型微调实践 QLoRA实践

什么是高刷LED屏?

Dylan

刷新 LED显示屏 led显示屏厂家

Amazon Transcribe 现已支持中文普通话和俄语_编程语言_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章