AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

Amazon Transcribe 现已支持中文普通话和俄语

  • 2019-09-18
  • 本文字数:1605 字

    阅读完需:约 5 分钟

Amazon Transcribe 现已支持中文普通话和俄语

由于语音是人类互动的核心,人工智能研究长期以来一直专注于语音识别,这是设计和构建可使人类与机器进行直观互动的系统的第一步。语言、口音和语音的多样性使这成为一个非常困难的问题,需要专家技能、超大数据集和庞大的计算能力来训练效率模型。


为帮助组织和开发人员在他们的应用程序中使用语音识别,我们在 AWS re:Invent 2017 上发布了 Amazon Transcribe,这是一项自动语音识别服务。借助 Amazon Transcribe,客户(如 VideoPeel、Echo360 或 GE Appliances)能够快速、轻松地将语音识别功能添加到其应用程序和设备中。


只需一个 API 调用即可…您无需了解有关机器学习的核心知识。您可以分析存储在 Amazon Simple Storage Service (S3) 中的音频文件,并使用该服务返回转录的语音的文本文件。您还可以向 Amazon Transcribe 发送实时音频流,并实时接收转录内容流。


自该项服务发布以来,团队不断添加新语言,今天我们很高兴地宣布该项服务现已支持中文普通话和俄语,使支持的语言总数达到 16 种。


推出中文普通话支持


使用 Amazon Transcribe 非常简单:给我几分钟向您展示如何操作。


我们先试试普通话。从这个“小红帽的故事”视频入手,我提取了音轨,将其保存为 MP3 格式,并将其上传到我的一个 Amazon Simple Storage Service (S3) 存储桶中。下面是实际文件。


然后,我使用 AWS CLI 开始转录:


$ aws transcribe start-transcription-job--media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/little_red_riding_hood-mandarin.mp3 --media-format mp3 --language-code zh-CN --transcription-job-name little_red_riding_hood-mandarin
复制代码


几分钟后,转录完成。查看 AWS 控制台时,我可以使用 Amazon Transcribe 提供的 URL 下载,也可以直接读取。



不过,我不会说普通话,但借助 Amazon Translate 可以知道该文本讲的是一个生病的祖母和一只大坏狼的故事,因此看起来 Amazon Transcribe 顺利完成了任务!


推出俄语支持


现在,我们用这个短视频中的对话试试俄语。


Здравствуйте! Greetings!


Добрый день! Good day!


Давайте познакомимся.Меня зовут Слава. Let’s introduce ourselves.My name is Slava.


Очень приятно, а меня – Наташа. Nice to meet you, and mine – Natasha.


Наташа, кто вы по профессии? Natasha, what is your profession?


Я врач.А вы? I (am a) doctor.And you?


Я инженер. I (am an) engineer.


这次,我也会让 Amazon Transcribe 进行说话人识别。


$ aws transcribe start-transcription-job --media MediaFileUri=https://s3-us-west-2.amazonaws.com/jsimon-transcribe-demo/russian-dialogue.mp3 --media-format mp3 --language-code ru-RU --transcription-job-name russian_dialogue --settings ShowSpeakerLabels=true,MaxSpeakerLabels=2
复制代码


结果如下。



如您所见,Amazon Transcribe 不仅忠实地将语音转换为文本,还准确地将每个句子分配给正确的说话人。


现已推出!


您可以在以下地区开始使用这两种新语言:


  • 美洲:美国东部(俄亥俄)、美国东部(弗吉尼亚北部)、美国西部(加利福尼亚北部)、美国西部(俄勒冈)、AWS GovCloud(美国西部)、加拿大(中部)、南美洲(圣保罗)。

  • 欧洲:欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(巴黎)。

  • 亚太地区:亚太地区(孟买)、亚太地区(首尔)、亚太地区(新加坡)、亚太地区(悉尼)。

  • 从您首次请求转录开始,免费套餐在前 12 个月供您免费使用 60 分钟。


与以往一样,我们希望收到您的反馈:请将反馈发布到 AWS 论坛的 Amazon Transcribe 版块,或通过您常用的 AWS 联系方式发送反馈。


本文转载自 AWS 博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/amazon-transcribe-now-supports-mandarin-and-russian/


2019-09-18 17:171341
用户头像

发布了 1913 篇内容, 共 148.6 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

利用 FileSystem API 实现一个 web 端的残缺版文件管理器

yuanyxh

js #前端

链游开发指南:基于Dapp合约的链上游戏开发与源码出售

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

阿里巴巴商品详情API返回值:电商精准营销的关键

技术冰糖葫芦

api 网关 API Gateway API 文档 API 测试 pinduoduo API

望繁信科技携流程智能解决方案亮相CNDS 2024新能源产业数智峰会

望繁信科技

数字化转型 流程挖掘 流程资产 流程智能 新能源产业

物流数字化:低代码推进供应链数字化进程

不在线第一只蜗牛

低代码 数字化 供应链 物流

飞猪、去哪儿网接连“出事”,在线旅游平台有多少“坑”?

趣解商业

去哪儿网 飞猪 在线旅游平台

AI耳机成智能硬件布局入口产品 科大讯飞无线智能耳机率先突围

科技热闻

快手自研Spark向量化引擎正式发布,性能提升200%

快手技术

spark 引擎 大数据 开源

【YashanDB知识库】单机升级典型问题及应急措施

YashanDB

yashandb 崖山数据库 yashandb知识库

业界首个AI安全产业图谱发布,移动云实力入选

科技热闻

数业智能心大陆探索生成式AIGC创新前沿

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

职场女性的心灵救赎:数业智能心大陆照亮新曙光

心大陆多智能体

智能体 AI大模型 心理健康 数字心理 AI 智能体

吊打面试官!从多维度理解架构

不在线第一只蜗牛

程序员 面试

ETL数据集成丨建设BI的关键前提是ETL数据集成?

RestCloud

数据分析 BI ETL 数据集成 企业数据工具

饿了么基于Flink+Paimon+StarRocks的实时湖仓探索

Apache Flink

大数据 flink 实时计算 StarRocks

什么是函数式编程

yuanyxh

js 函数式编程 #前端

延迟退休,如何影响程序员?

秃头小帅oi

数字货币期权秒合约交易所APP开发与平台搭建全攻略

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 公链开发

延迟退休,程序员的你准备好了吗?

伤感汤姆布利柏

深度解析 MintRich 独特的价格曲线机制玩法

NFT Research

web3 NFT\

深入浅出 GIF

yuanyxh

js GIF #前端

upload 组件封装

yuanyxh

js 上传 #前端

Amazon Transcribe 现已支持中文普通话和俄语_编程语言_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章