写点什么

微软 Azure Neural TTS 新增对 9 个“小语种”语言及口音支持 | InfoQ 快讯

  • 2022-08-08
    北京
  • 本文字数:1395 字

    阅读完需:约 5 分钟

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯

AI 大模型超全落地场景&金融应用实践,8 月 16 - 19 日 FCon x AICon 大会联诀来袭、干货翻倍!

AI 语音技术的发展和应用,让中国用户在外语学习和对外沟通交流中获得了诸多便利。但对于国内的小语种学习者,或是正在小语种国家或地区开展业务的机构,目前还需要支持更多小语种的语音工具。


然而,由于缺乏训练数据,那些较少使用的口语,几乎没有任何可用的 TTS 工具。现在,在低资源TTS技术的支持下,微软 Azure 认知服务正在持续扩展对不同国家及地区语言的支持,满足更多用户的场景需求,例如小语种教育教学的有声读物、电子辞典等学习工具;面向相应国家和地区市场的 AI 语音助手、AI 语音客服;或是将 TTS 作为视频、音频等素材的生产工具,产出面向以上语种使用者的媒体产品等。


InfoQ 获悉,近期,微软 Azure Neural TTS 新增了对 9 个“小语种”语言及其不同口音的支持,包括:阿拉伯语(黎巴嫩)、阿拉伯语(阿曼)、阿塞拜疆语(阿塞拜疆)、波斯尼亚语(波黑)、格鲁吉亚语(格鲁吉亚)、蒙古语(蒙古)、尼泊尔语(尼泊尔)、阿尔巴尼亚语(阿尔巴尼亚)、泰米尔语(马来西亚)。以上几种语言均已公开发布,供开发者使用。


点击以下声音示例,感受这些不同风格的“小语种”语言。



示例:az-AZ BabekNeural 阿塞拜疆语(阿塞拜疆)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/az-AZ-BabekNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ar-LB RamiNeural 阿拉伯语(黎巴嫩)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ar-LB-RamiNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ne-NP SagarNeural 尼泊尔语(尼泊尔)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ne-NP-SagarNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:bs-BA VesnaNeural 波斯尼亚语(波黑)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/bs-BA-VesnaNeural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


示例:ta-MY KaniNaural 泰米尔语(马来西亚)

链接:http://tts.blob.core.windows.net/garfield/garfield202206/ta-MY-KaniNaural-General-Audio.wav?sv=2020-10-02&st=2022-06-16T09%3A08%3A14Z&se=2025-01-23T09%3A08%3A00Z&sr=c&sp=racwdxlt&sig=69pLAPbtLnEHlNZco8g8jnqJyhPXOWOO%2FSX2Zm0fpeI%3D


全球人类正在使用的语言有数千种,其中使用最多的前 1%(约 70 种语言)覆盖了全球 80%以上的人口,并且基本都得到了 TTS 技术的支持。但那些小语种的使用者,也应当享受 TTS 技术带来的便利。


图:微软 Azure Neural TTS 支持语言和声音列表


据悉,截止目前,Azure 认知服务的文本转语音模块支持全球140个国家和地区的语言,提供400个声音模型,企业能够利用Azure神经网络版声音定制服务,以多种语言和风格打造独特的品牌声音。微软 Azure AI 还提供语音转文本OCR翻译等一系列与语言相关的认知服务,所支持的语言已达 100 多种。

公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2022-08-08 18:334091
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 505.2 次阅读, 收获喜欢 1970 次。

关注

评论

发布
暂无评论
发现更多内容

Verilog的语句块

芯动大师

Verilog Verilog语法 Verilog语句块

一文带你快速上手云日志服务

华为云PaaS服务小智

云计算 运维 日志管理

大数据培训工作就业前景怎么样

小谷哥

浪潮 KaiwuDB 陈磊:布局数字能源,创新助力 “双碳”

KaiwuDB

来聊一聊 ElasticSearch 最新版的 Java 客户端

江南一点雨

Java elasticsearch springboot ES

打造算力新引擎!安擎上海智能制造基地正式运营

科技热闻

声网管浩森:元宇宙派对场景的最佳实践

声网

实践 元宇宙 RTE2022

云渲染是什么?云渲染和自己渲染有什么区别?

Renderbus瑞云渲染农场

云渲染 渲染农场 云渲染平台

SpringBoot整合Swagger2,再也不用维护接口文档了!

@下一站

12月日更 12月月更 springboot整合 swagger2

上海靠谱的前端培训机构有没有推荐

小谷哥

终于被我发现了这个推特视频下载的方法!超级简单!支持苹果安卓双系统!

frank

推特视频下载

大数据培训出来就业前景如何

小谷哥

C++开发,这些GUI库一定不要错过!

Jackpop

华为云12·12直播EI专场即将开始,满足电商行业全场景搜索需求

科技怪授

华为云

java自学好还是培训好?

小谷哥

关于K8s集群环境工作组隔离配置多集群切换的一些笔记

山河已无恙

k8s管理 K8s 多集群管理 12月月更

多名网络主播因恶意炒作被列入警示名单,如何打击这种违规行为

石头IT视角

架构实战模块1作业

Geek_e3a35c

场景 | 大型电商企业运营管理数字化解决方案

九科Ninetech

极客时间运维进阶训练营第八周作业

好吃不贵

什么样的web前端培训靠谱?

小谷哥

横空出世!阿里巴巴Spring全家桶实战笔记真香

Java永远的神

spring 源码 架构师 springboot SpringCloud

凭借这份Java面试复盘笔记,我在2022寒冬之际也斩获了多张Offer!

程序员小毕

spring 程序员 后端 架构师 java面试

直播继续!华为云Solution as Code一键高效上云,解决方案开箱即用

科技怪授

华为云

下一个AI舞台,名叫煤矿

脑极体

云原生 AI 的资源调度和 AI 工作流引擎设计分享

Baidu AICLOUD

AI工程化 异构计算 云原生AI 百度百舸

【计算讲谈社】第十五讲|云端即时渲染:下一代互联网的算力基座?

大咖说

数字人 云游戏

喜报 | Bonree ONE 2.0荣获信通院“2022IT新治理年度明星产品”

博睿数据

可观测性 博睿数据 荣誉 ONE平台

模块二 -- 朋友圈高性能复杂度分析

陈实

「架构实战营」

选取数据的原则

穿过生命散发芬芳

数据分析 12月月更

ZBC陆续在主要CEX开启Staking,锁定市场大部分流通量成大利好

BlockChain先知

微软Azure Neural TTS 新增对9个“小语种”语言及口音支持 | InfoQ快讯_AI&大模型_刘燕_InfoQ精选文章