写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:459141

    评论

    发布
    暂无评论

    学会这15点,让你分分钟拿下Redis数据库

    民工哥

    后端 linux运维 redis cluster

    流计算:流式处理框架

    正向成长

    流式计算框架

    隐私安全的城池营垒,能成为手机品牌高端化的赛点吗?

    脑极体

    GraphX图计算组件最短路算法实战

    小舰

    4月日更

    浅谈 MySQL 集群高可用架构

    民工哥

    MySQL MySQL 高可用 集群 linux运维

    Vue3、Vuex4、Ant Design2的实战项目开发管理系统

    devpoint

    vite Vue3 and design of vue

    Golang Slice 数组和切片

    escray

    学习 极客时间 Go 语言 4月日更

    聊聊十种常见的软件架构模式

    架构精进之路

    4月日更

    从被踢出局到5个30K+的offer,一路坎坷走来,沉下心,何尝不是前程万里

    北游学Java

    Java 数据库 分布式 微服务

    mosquitto支持websocket搭建记录

    风翱

    4月日更 web socket mosquitto

    计算机原理学习笔记 Day6

    穿过生命散发芬芳

    计算机原理 4月日更

    json基础学习

    ベ布小禅

    4月日更

    const与指针交集的那些事

    Bob

    c++ 编程语言 4月日更

    Markdown 文档可折叠化展示

    耳东@Erdong

    4月日更

    LeetCode题解:17. 电话号码的字母组合,回溯,JavaScript,详细注释

    Lee Chen

    算法 大前端 LeetCode

    阿里内部热捧“Spring全线笔记”,不止是全家桶,太完整了

    Java架构追梦

    Java spring 源码 架构 微服务

    不想搞Java了,4年经验去面试10分钟结束,现在Java面试为何这么难

    Java 编程 程序员 面试 计算机

    1分钟搞定 Nginx 版本的平滑升级与回滚

    民工哥

    nginx 后端 linux运维

    使用JavaScript解析XML文件

    空城机

    JavaScript xml 大前端 递归 4月日更

    不愧是阿里内部“Spring Cloud Alibaba学习笔记”这细节讲解,神了!

    Java架构追梦

    Java 阿里巴巴 架构 微服务 SpringCloud

    Java 常见 bean mapper 的性能及原理分析

    Java小咖秀

    Java bean Copier

    专访中寰卫星导航项目管理部负责人卜钢:如何演绎人生之路

    打工人!

    采访 调查采访能力考核

    建议收藏!看完全面掌握,最详细的Redis总结(2021最新版)

    民工哥

    运维 后端 redis cluster NoSQL数据库

    安于现状的人,不值得同情

    小天同学

    深度思考 个人感悟 4月日更 突破现状

    车行易携手睿象云:告警管理体系全升级

    睿象云

    Python OpenCV 图像2D直方图,取经之旅第 27 天

    梦想橡皮擦

    Python OpenCV 4月日更

    Python基础之:struct和格式化字符

    程序那些事

    Python 数据分析 程序那些事

    智慧城市现状调研

    程序员架构进阶

    华为 智慧城市 28天写作 4月日更

    我常用的两个外国应用

    彭宏豪95

    产品 产品经理 工具 社交 Slack

    接口的幂等性怎么设计?

    xcbeyond

    设计 幂等性 4月日更

    Java-技术专题-Stream.foreach和foreach

    码界西柚

    Java stream collection

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章