写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:456320

    评论

    发布
    暂无评论
    发现更多内容

    《持之以恒的从事运动》五

    Changing Lin

    7月日更

    PowerShell 哈希表

    耳东@Erdong

    PowerShell 7月日更

    数据仓库的基本要求

    奔向架构师

    数据仓库 数据架构 7月日更

    深入浅出 Gitalk 留言插件

    悟空聊架构

    开源 网站 7月日更 网站建设 留言

    打造中国数字军人 数军科技携黑科技亮相(北京)军博会

    科技热闻

    从零开始学习3D可视化之摄像机

    ThingJS数字孪生引擎

    大前端 可视化 数字孪生

    第一周作业-对比不同公司产品招聘JD

    小夏

    产品经理训练营 邱岳

    模块八 - 设计消息队列存储消息数据的 MySQL 表格

    华仔架构训练营

    讨论 | 低代码能解决制造业企业数字化转型所面临的问题吗?

    优秀

    低代码

    详聊微服务观测|从监控到可观测性,我们最终要走向哪里?

    尔达Erda

    开源 微服务 云原生 APM PaaS

    面对大规模 K8s 集群,这款诊断利器必须要“粉一波”!

    尔达Erda

    开源 云原生 operator PaaS kubernete

    解读区块链在制药和物流管理中具备的优势

    CECBC

    区块链技术在“三资”监管领域的应用

    CECBC

    《面试八股文》之kafka21卷

    moon聊技术

    kafka 面试

    Linkflow CDP亮相GDMS全球数字营销峰会

    Linkflow

    CDP 用户画像 数字营销

    前端 JavaScript 实现一个简易计算器

    编程三昧

    JavaScript 大前端 代码实现

    你的直观感受有可能是错的

    石云升

    学习 认知偏差 7月日更

    架构实战营模块8作业

    Geek_649372

    架构实战营

    5分钟速读之Rust权威指南(三十九)unsafe

    wzx

    rust

    推荐系统的价值观(三十二)

    Databri_AI

    价值观 推荐系统

    数字政府建设如火如荼 区块链保证数据真实安全

    CECBC

    Ubuntu Server 20.04搭建zookeeper集群

    玏佾

    zookeeper 群集安装 搭建 zk 集群部署

    为什么公司应该效仿开源的文化

    BeeWorks

    如何科学地系统地梳理出CDP的RFP?

    Linkflow

    浅谈云上攻防——Web应用托管服务中的元数据安全隐患

    腾讯安全云鼎实验室

    安全攻防 云安全 元数据 网络攻防

    隔壁工程师都馋哭了我的逆向工程IDA,说要给我搓背捏脚

    网络安全学海

    网络安全 信息安全 渗透测试 漏洞分析 逆向工程

    我看 JAVA 之 并发编程【一】FutureTask & Callable

    awen

    Java 多线程 Callable FutureTask

    禾木之变:2021我们该如何持续拥抱AI?

    脑极体

    吃药吗?AI造的!

    脑极体

    幸福来敲门

    卢卡多多

    幸福 7月日更

    【得物技术】常用注册中心原理及比较

    得物技术

    zookeeper nacos Consul Eureka 注册中心

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章