把握行业变革关键节点,12 月 19 日 - 20 日,AICon北京站即将重磅启幕! 了解详情
写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:4510594

    评论

    发布
    暂无评论
    发现更多内容

    Java面试必看!阿里(嵩山版)分布式核心原理笔记来了

    Java架构追梦

    Java 阿里巴巴 架构 面试 架构分布式

    如何批量下载YouTube视频到本地

    科技猫

    软件 音视频 经验分享 资源分享 工具分享

    炸了,炸了!阿里P9纯手打Java面试小抄(21版)在GitHub上已获80万star

    Java架构之路

    Java 程序员 架构 面试 编程语言

    快点来学吧!Android性能优化面试题集锦,深度解析,值得收藏

    欢喜学安卓

    android 程序员 面试 移动开发

    2B营销路径: 9大步骤自我拆解

    boshi

    营销数字化 七日更

    堪称完美!中国Java之父纯手打,阿里首发:多线程与高并发

    Java架构之路

    Java 程序员 架构 面试 编程语言

    GO训练营第12、13周—— runtime

    Glowry

    智慧党建信息管理平台系统建设

    13530558032

    Java 和 Python 关于 % 的那些坑

    与你一起学算法

    Java Python

    【前端面试题】关于一些js的一些面试题(金融行业),我和面试官扯了三个小时

    孙叫兽

    JavaScript 大前端 金融 笔试题

    打卡学习 VBA 和 PYTHON week01-02

    小怪兽

    3月日更 【IT蜗壳教学】 【自我错误点总结】

    源中瑞智慧社区解决方案,社区服务平台

    13530558032

    区块链电子发票平台,区块链电子发票优势

    13530558032

    EGG Network公链技术创新,EFTalk打造高效全能公链

    币圈那点事

    区块链

    全票通过!微众开源项目EventMesh进入Apache孵化器

    康月牙

    Apache 开源 Event 事件网格 eventmesh

    我看 JAVA 之 引用类型(Reference)

    awen

    Java ThreadLocal Reference

    跟我学ModelArts丨探索ModelArts平台个性化联邦学习API

    华为云开发者联盟

    AI 联邦学习 API 华为云 modelarts

    安卓嵌入式底层开发!整理出这份8万字Android性能优化实战解析,已开源

    欢喜学安卓

    android 程序员 面试 移动开发

    GO训练营第10周——日志&指标&链路追踪

    Glowry

    冲击大厂!阿里P9纯手打Java面试小抄(21版)在GitHub上已获80万star

    Java 程序员 面试

    电子门锁没电的解决办法

    孙叫兽

    生活 程序人生 电子锁

    拍乐云推出“实时标注”,助力少儿编程、在线金融等行业场景实现高效互动

    拍乐云Pano

    音视频 在线教育 互动白板 实时标注 在线金融

    产品调研报告

    Ashley.

    xshell不能输入命令字符了?

    Geek_6370d5

    xshell 错误集锦

    2021金三银四春招来袭,掌握这份成长宝典,offer岂不是随便拿?

    Java架构之路

    Java 程序员 架构 面试 编程语言

    寻找被遗忘的勇气(十九)

    Changing Lin

    3月日更

    看了上百份面经,发现每次面试的问题都逃不过这几方面

    yes

    面试

    FFmpeg入门篇

    Changing Lin

    ffmpeg media

    GO训练营第11周——DNS&CDN&多活架构

    Glowry

    2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)

    比伯

    Java 编程 架构 面试 程序人生

    2021 年要了解的 34 种 JavaScript 简写优化技术

    LeanCloud

    JavaScript 面试 大前端

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章