写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:457660

    评论

    发布
    暂无评论
    发现更多内容

    后 Web时代:AI 代理驱动的互联网

    PowerVerse

    智能合约 去中心化 web3 AI‘’

    原生APP开发的性能优势

    北京木奇移动技术有限公司

    软件外包公司 原生APP开发 APP外包公司

    百观科技基于阿里云 EMR 的数据湖实践分享

    阿里云大数据AI技术

    数据库 大数据 OSS OLAP EMR

    人工智能中的RAG技术在测试领域的探索

    测试人

    人工智能

    音乐 NFT 项目的上线流程

    北京木奇移动技术有限公司

    区块链技术 软件外包公司 音乐NFT

    「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

    Baihai IDP

    AI LLMs Baihai IDP MoE 混合专家模型

    macOS Sonoma 14.7.5 (23H527) Boot ISO 原版可引导镜像下载

    sysin

    macos

    百度推出端到端语音大模型,支持方言、可打断、电话语音成本砍半;雷神 AI 眼镜发布:语音助理+摄像头,1799 元起丨日报

    声网

    a16z合伙人:语音交互将成为AI应用公司最强大的突破口之一,巨头们在B2C市场已落后太多丨Voice Agent 学习笔记

    声网

    后勤采购管理系统(源码+文档+讲解+演示)

    深圳亥时科技

    新疆中泰携手用友开启智慧司库建设新征程

    用友BIP

    智能体 数智化 用友BIP 智慧司库建设

    从“新农人”到“买菜团长”,拼多多激发电商就业生态二次繁荣

    Alter

    迈向云原生:理想汽车 OLAP 引擎变革之路

    镜舟科技

    大数据 云原生 OLAP 镜舟数据库 理想汽车

    新晋 IoTDB Committer 经验谈:开源代码为用户创造价值

    Apache IoTDB

    Apache SeaTunnel MCP Server:让AI成为你的ETL助手

    Apache SeaTunnel

    电商新趋势,从“真人一键克隆”数字人进军直播间开始

    脑极体

    AI

    1688商品列表数据接口(1688.item_search)

    tbapi

    1688商品列表接口 1688API 1688商品数据采集 1688数据采集

    混合APP开发框架及性能

    北京木奇移动技术有限公司

    软件外包公司 APP外包公司 APP外包开发

    如何快速搭建自己的个人网站?Hexo、VuePress 和 WordPress 大比拼!

    程序员晚枫

    新疆中泰携手用友开启智慧司库建设新征程

    用友智能财务

    财务 会计

    Cursor搭配专业编程显示器:点燃你的代码激情

    默语

    西电整体替换SAP!用友BIP支撑装备制造业务运营和成本精细化管控升级!

    用友BIP

    智能体 数智化 用友BIP 一体化

    感受一下『迅雷』的面试强度

    王中阳Go

    Go 面试 后端 迅雷

    macOS Sequoia 15.4 (24E248) Boot ISO 原版可引导镜像下载

    sysin

    macos

    深入理解 StarRocks Bitmap 索引和 Bitmap 去重

    镜舟科技

    StarRocks Bitmap 索引 Bitmap 去重 高基数列 精确去重

    SLS 重磅升级:超大规模数据实现完全精确分析

    阿里巴巴云原生

    阿里云 云原生 日志服务

    全流程覆盖,闭环管理:中烟创新案卷评审评查系统实现精细化管理

    中烟创新

    事务处理对持久统计信息自动收集的影响

    GreatSQL

    RAG 调优指南:Spring AI Alibaba 模块化 RAG 原理与使用

    阿里巴巴云原生

    阿里云 云原生 云原生微服务

    1688API系列:1688图片搜索拍立淘接口指南

    tbapi

    1688图片搜索接口 1688拍立淘接口 1688图片识别接口 1688图片搜索API

    音乐NFT软件项目的性能优化

    北京木奇移动技术有限公司

    软件外包公司 音乐NFT 体育NFT

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章