NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

实时语音变声技术原理解析:“大叔变小萝莉”

  • 2019-10-30
  • 本文字数:1127 字

    阅读完需:约 4 分钟

实时语音变声技术原理解析:“大叔变小萝莉”

游戏社交化是近年来游戏行业发展的重要趋势,如何提高游戏的社交属性已成为各大游戏厂商游戏策划的重要组成部分。游戏中玩家的互动形式也不再止于语音聊天,有了更为高阶的需求,比如:玩家在“吃鸡”的时候,会通过外带的声卡或者其他的技术手段进行“变声“。大叔变萝莉,萌妹变宅男,这些都让游戏里的语音互动变得更具娱乐性。


在这股社交娱乐大浪潮下,腾讯云游戏多媒体引擎 GME 创新性地引入了变声的玩法,让变声成为了游戏内置的功能。只要接入 GME 的 SDK,游戏研发厂商就可以提供给玩家更加丰富有趣的游戏内语音体验,让玩家在不借助任何外部设备的情况下,实现抠脚大汉变声萝莉、变声口吃的的有趣玩法。


目前,腾讯云 GME 的这个变声功能已应用在手机 QQ 上,被亿万 QQ 用户所使用。用户在拨通 QQ 电话或者发送语音消息时,选择 “变声”,就可以在“萝莉”、“歪果仁”、“熊孩子”等数十种特色音效中自由切换。


年轻人追求个性,喜欢猎奇。手机 QQ 这个变声功能帮助用户展现自己的“多面人格”,让聊天更有趣,广受用户好评。



用户使用反馈


变声的原理,即是通过改变人声的音调、音色,使输出声音在感官上与原始声音不同。人耳分辨人声,是通过音色和音调两个维度去做区分。日常所说的男中音、男高音,就是音调不同;音调一致的情况下,我们依然能通过音色去区分人声。变声器,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。



在音频后处理领域,“变声”是一个相对常见的功能,语音消息的变声不难,但是在 QQ 电话中实时变声,这可是个大挑战。要保证在用户无感的超低延时下对人声进行特殊处理,怎么办呢?


为了降低时延,技术团队想了不少办法:数据采集阶段,用自研前处理替换系统的前处理,把时延降低了 30ms;处理过程中,支持更少长度的处理(常规变声处理必须定长 20ms 处理,这 20ms 等待时间也会体现在总时延上面),能将延时控制在 30ms 以内。而人耳不会感受的最大延时是 40ms,这个延时基本不被用户所感知。最终实现了用户在 QQ 里体验到的实时语音变声功能。


“趣味变声”也集成到了腾讯云游戏多媒体引擎 GME 产品能力中。只要在游戏中集成 GME 的 SDK,就能实现 QQ 通话里的趣味变声玩法,丰富游戏玩家的社交体验,让游戏玩家爱上沟通,通过社交属性有效地提升游戏热度。


腾讯云游戏多媒体引擎 GME(Gaming Multimedia Engine)提供一站式游戏语音解决方案。针对不同游戏场景深度优化,覆盖休闲社交类、MOBA 类、MMORPG、FPS 等多种游戏类型。支持多人实时语音、3D 位置语音、语音消息和语音转文本等功能。功能完备,接入门槛低,一个 SDK 即可满足多样化的游戏内语音需求。


本文转载自公众号云加社区(ID:QcloudCommunity)。


原文链接:


https://mp.weixin.qq.com/s/D3VGrgHshsWp61f0KxNDwg


2019-10-30 13:383110

评论

发布
暂无评论
发现更多内容

EMQ 映云科技为抗疫项目提供全托管 MQTT 云服务免费使用

EMQ映云科技

物联网 IoT mqtt emq 抗疫

【高并发】解密导致并发问题的第三个幕后黑手——有序性问题

冰河

并发编程 多线程 协程 异步编程 精通高并发系列

linux之ssh命令

入门小站

Linux

Redis集群架构剖析(5):复制与故障转移

非晓为骁

主从复制 redis cluster master

博睿数据首批加入云科通明湖生态联盟,赋能信创生态谋未来

博睿数据

适合中小企业的知识库软件有哪些?

小炮

知识管理

无需编程,基于甲骨文oracle数据库零代码生成CRUD增删改查RESTful API接口

crudapi

oracle 零代码 API crud 增删改查

数字产业化快于产业数字化?

WorkPlus

在线XML转JSON工具

入门小站

工具

云上MongoDB常见索引问题及最优索引规则大全

MongoDB中文社区

mongodb

传统链游的革新,PlatoFarm用实际行动回馈Dao社区

西柚子

中国SaaS的增长真相|ToB大师课

ToB行业头条

提升职场竞争力!低代码开发师(高级)认证发布

一只大光圈

低代码 数字化 钉钉宜搭 宜搭

传统链游的革新,PlatoFarm用实际行动回馈Dao社区

BlockChain先知

C++11 智能指针之shared_ptr<void>

轻口味

c++ android 4月月更

【Zeekr_Tech】汽车软件敏捷开发和分支管理

Zeekr_Tech

敏捷开发 智能驾驶

怒肝 JavaScript 数据结构 — 栈篇(二)

杨成功

数据结构 4月月更

焱融看|AI 如何驱动存储发展

焱融科技

云计算 AI 分布式 高性能 文件存储

一文让你彻底了解Linux内核源码组织结构【建议小白收藏】

简说Linux内核

Linux内核 进程管理 驱动开发 嵌入式开发 设备驱动

足不出户,搞定交付——独家交付秘籍(第二回)

阿里巴巴云原生

领域驱动设计(DDD)靠谱么?

架构精进之路

DDD 4月日更 4月月更

netty系列之:netty中的核心解码器json

程序那些事

Java Netty 程序那些事 4月月更

微信朋友圈的高性能复杂度

哈喽

「架构实战营」

我真不信,这年头还有人能懂SpringBoot的ClassLoader加载机制

Java工程师

Java spring 程序员 科技

C++后端开发进阶学习大纲指南

赖猫

c++

Java 在 IntelliJ IDEA 中提示 set the language level 9

HoneyMoose

HertzBeat入GVP啦,并 v1.0.beta.7 发布,易用友好的云监控系统

TanCloud探云

开源 APM angular java;

预约中,2022京东云产业融合新品发布会线上开启

京东科技开发者

云计算 京东云 产品发布会 直播预约

圆桌派来啦!与行业大咖聊聊Dapr的发展与实践

行云创新

云原生 dapr

Apache flink - PartitionNotFoundException

李印

flink 消费 kafak 错误排查

互联网的下一站,大概率是能源

脑极体

实时语音变声技术原理解析:“大叔变小萝莉”_文化 & 方法_云加社区_InfoQ精选文章