写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:459355

    评论

    发布
    暂无评论

    架构实战营 模块五

    felix

    #架构实战营

    【Pandas学习笔记01】强大的分析结构化数据的工具集

    恒生LIGHT云社区

    Python 大数据 数据分析 pandas

    微信 ClickHouse 实时数仓的最佳实践

    科技热闻

    字节跳动如何系统性治理 iOS 稳定性问题

    字节跳动终端技术

    ios 字节跳动 APM APP稳定性

    Javascript的内存管理

    Jeannette

    应急响应入门之Linux分析排查

    网络安全学海

    网络安全 信息安全 渗透测试 WEB安全 安全漏洞

    两个小时手写了个Zookeeper分布式服务注册中心

    热爱java的分享家

    Java 面试 程序人生 编程语言 经验分享

    行业分析| 大势所趋:元宇宙

    anyRTC开发者

    音视频 视频通话 虚拟现实 元宇宙

    CSS布局(五)之圣杯布局和双飞翼布局

    Augus

    CSS 11月日更

    智慧园区一体化管理平台开发,园区智能化集成系统

    电微13828808271

    恒源云(GPUSHARE)_训练一个专门捣乱的模型

    恒源云

    人工智能 深度学习 算力

    2021年26家大厂Java面试题整理了360道(分布式+微服务+高并发)

    热爱java的分享家

    Java 架构 面试 程序人生 经验分享

    一周信创舆情观察(11.15~11.21)

    统小信uos

    JS柯里化和反柯里化

    Jeannette

    TDengine在理想汽车物联网业务场景的落地实践

    TDengine

    tdengine 时序数据库

    先到先得!Alibaba甩出第四次更新的JDK源码高级笔记(终极版)

    热爱java的分享家

    Java 源码 jdk 面试 经验分享

    SAP 公有云和私有云解决方案概述

    汪子熙

    公有云 云平台 SAP 11月日更 公有云私有云

    回顾我两个月面试阿里,携程,小红书,美团,网易等等(Java岗)

    热爱java的分享家

    Java 架构 面试 程序人生 经验分享

    阿里蚂蚁花呗团队面试题:spring+分布式+jvm+session+redis

    热爱java的分享家

    Java 面试 程序人生 编程语言 经验分享

    SAP ERP classification 和 SAP Cloud for Customer 的同步

    汪子熙

    中间件 SAP ERP C4C 11月日更

    尝试 Promise A+

    Jeannette

    闭包与内存泄露

    Jeannette

    Python代码阅读(第63篇):数字奇偶性

    Felix

    Python 编程 Code 阅读代码 Python初学者

    下单延迟10s撤单性能测试

    FunTester

    性能测试 延迟队列 接口测试 测试框架 FunTester

    JS函数的this

    Jeannette

    跨端分布式计算技术初探|HDC2021技术分论坛

    HarmonyOS开发者

    HarmonyOS

    元宇宙最缺的是内容,而云计算能帮上忙

    百度开发者中心

    云计算 元宇宙

    分布式软时钟有多重要?|HDC2021技术分论坛

    HarmonyOS开发者

    HarmonyOS

    硬科技起飞,这家成立仅三年的AI研究院已颇具国际风范

    硬科技星球

    广发证券携手HarmonyOS打造智慧金融服务|HDC2021技术分论坛

    HarmonyOS开发者

    HarmonyOS

    async/await 优雅永不过时

    CRMEB

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章