2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

开单效率暴增 30 倍!“数字销冠”的 AI 密码:飞桨 + 文心大模型双引擎驱动

  • 2025-11-27
    北京
  • 本文字数:4447 字

    阅读完需:约 15 分钟

大小:2.20M时长:12:50
开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动

一家在成都做火锅食材批发配送的公司,每年销售额能达到数千万元,老板王总却长期因一个简单的业务流程而头疼——销售开单。在商贸批发行业,开单是库存、往来核算的重要数据来源,其效率与准确性直接关系到企业的运营管理效率和客户满意度。


公司销售每天开单 100~400 个,涵盖食材种类几百种,涉及 500 家左右上下游供应链管理和销售服务,经常因为手工开单慢、忙中出乱而影响生意。怎么能有条不紊、准确快速响应下游火锅店的采购需求?这个问题一直让这家只有三十多个人手的公司犯难。


从前他们的方法是:上人手、加班熬,“就这样还经常会出错”王总自己也吐槽。


下游客户每天要货 20~30 个品种,销售人员一行一行录入要 5 分钟左右。去年底,这家食材批发公司启用了“好业财多模态智能开单”功能,通过语音录入、拍摄手写订单以及图片上传等方式,让销售人员服务单个火锅店客户下单的时间,从 5 分钟直线缩短至几秒,效率提升近 30 倍,准确率依然保持在 90%以上,极大地解决了开单效率低的痛点,销售员们称这项功能是“数字销冠”。


“好业财”是畅捷通信息技术股份有限公司(下称“畅捷通”)旗下一款面向小微企业的业财管融合数智经营平台。2024 年 8 月,该产品开发上线“多模态智能开单”功能,针对性解决传统开单过程中存在的手工录入效率低、易出错、多渠道信息整合难度大等问题。在百度飞桨和文心大模型的技术支持下,能够实现语音、文字、表格、图片、PDF 等多种形态的内容识别,准确理解下单商品内容和详细要求,提高开单效率。


好业财“智能开单”PC 端、移动端界面

销售手工开单忙中出乱,传统识别技术效率低下


王总的食材批发公司主要经营火锅底料、预包装食材,在成都有自己的门店。


新客或散客的订货大多是线下到店进行。一张销售订单平均有二十来条商品信息,传统开单流程需要每一条信息挨个儿手敲录入财务系统,这个时间往往需要 5 分钟左右,而对于零售来说,客户接待时间即使只增加一分钟,都可能造成客户流失。


更大宗的开单主要面向二级批发商、火锅门店,这类开单情况则更为复杂。王总介绍,“有的客户直接手写到纸上,拍个照发给我们;有的打电话或者直接发一大串语音。”销售内勤每天都需要在各种字体不清的文字、夹杂方言的语音、模糊不清的图片中,辨别出正确的商品信息,誊抄订货清单,再一条条录到系统上。


除了效率的紧迫性和信息的复杂度,开单这件事还有工作时间上的压力。现在很多火锅店都营业到凌晨,等到店里打烊盘货,再下单有可能在后半夜了。王总认为公司现在都得考虑支持 24 小时订货。



“要是能把客户发来的文字、照片直接投入系统,或者像发语音消息一样说完就能转化开单,那可省事了。”王总说。


客户的需求一直促使畅捷通思考,如何让开单更高效、准确、智能。


畅捷通技术专家介绍,直到现在业界都面临两方面公认的挑战:一方面是各种噪音下的信息提取和识别,开单可能使用到格式不一的表格文件、角度像素刁钻的照片截图、五湖四海夹杂方言的口音……另一方面是信息提取后,对其语义的理解和处理。


理想中的财务 AI,既要有“千里眼”“顺风耳”,还要有一个“最强大脑”。



事实上,深耕小微企业财税及业务云服务领域十多年的畅捷通,2017 年便曾尝试探索过相关能力的实现,但当时整体技术能力有限,多次尝试后识别准确率仍然不高,最终项目暂缓。


2024 年,畅捷通技术专家“带题入组”,参加了由深度学习技术及应用国家工程研究中心与百度联合创办的 AICA 首席 AI 架构师培养计划(以下简称“AICA”),让“智能开单”的实现提上日程。“AICA 中很多课程刚好与我们的需求相关,组内很多伙伴,这个过程中百度为我们输入了很多新技术支持,我们也做了非常多尝试,推动着智能开单项目不断迭代。”

“大小模型结合” ,PaddleX 助力快速响应精准识别


“我们监测发现,客户对于开单全流程的心理预期是 10 秒以内”畅捷通技术专家介绍,一旦一批订单从上传到生成确认的时间超过这个数值,“客户群就会出现较多意见反馈,认为还不如手动输入来得顺畅。”


相比起小模型,大模型的数据处理计算时间长,考虑到效率需求,畅捷通转变完全依赖调用多模态大模型响应的模式,调整为“大小模型结合”的技术策略,将轻量级专业模型进行适配微调后,通过飞桨低代码开发工具 PaddleX 的可视化界面,直接调用具备不同识别分析能力的轻量、产业级模型,再将识别内容交给文心大模型进行深度语义理解和分析,既能保障准确率,又进一步提升了响应速度。


开单问题之所以复杂,就是因为单单图文识别一个板块,就可能面临多种复杂的业务情景。比如能不能在开单系统中直接上传与客户的聊天截图、PDF 文件,甚至有时是客户发来一张自己在纸上手写订单的照片,或者开单业务员接待客户时自己用纸笔记录的手写单据。这对不同拍摄角度、光线、图片像素和格式下信息的提取能力,提出了更高的要求。


针对这一问题,畅捷通选择了由飞桨团队自研的轻量级深度学习模型 PicoDet_layout_1x‌。该模型专门面向‌文档版面分析‌而开发,专用于定位图像中的文字、表格、图片等结构化区域,并支持中英文混合场景的复杂版面解析。作为 PaddleX 支持的专用产业级模型之一,能够解决文档图像中多元素(如表格、标题)的定位问题,不仅高精度,更有低计算开销和端侧部署友好等特点,正适用于工业级文档处理场景‌。


好业财“智能开单”的图文识别能力展示


电子表格,是开单业务员常用的订单信息汇总方式。有时客户订货也只甩一个表格过来,但上下游各环节商家都有自己的订单统计习惯,表头制式、单元格合并都不统一,对于 AI 来说识别起来难度反而比单纯的文字识别难度更大。


针对这一问题,畅捷通技术团队选择了专门面向表格解析的轻量级深度学习模型 SLANet‌。该模型核心设计包括行列定位、单元格合并检测等模块,解决了传统表格模型无法识别合并单元格的痛点‌。通过 PaddleX 的低代码开发能力进行集成与优化,两者结合可构建高效的文档智能分析解决方案‌。


畅捷通结合 PaddleX 提供的文本检测、版面分析和表格解析等模型协同能力,快速实现了从文档图像结构化解析到业务落地的全流程开发。同时,PaddleX 强大的部署能力支持高性能推理插件,旨在实现对模型端到端推理流程的显著提速,可将 PicoDet_layout_1x 和 SLANet 优化为更适合端侧设备运行的版本,进一步提升其推理速度与资源利用率‌。据了解,相较于通用商用表格等识别服务,畅捷通基于 PaddleX 框架进行专用模型微调后,在图片文字等形式的销售开单场景,识别准确率提升了近一倍。


大小模型结合的技术实现流程

装上“更强大脑” ,文心大模型驱动财务分析升级


通过上述轻量级专业模型解析并提取信息后,还要对信息进行结构化处理:抽取出商品名称、数量、计量单位以及更为复杂的规格等信息,对照这些信息在商品库中做语义逻辑关联和数据匹配。此时,小模型泛化理解能力相对有限,需要“更强大脑”文心大模型解决问题。


智能开单中对于泛化理解能力的要求场景非常多样,例如:

  • 场景一:图片表格识别开单时,上下游商户之间对于同一商品的称呼并不相同,比如“土豆”,在不同商家订单中可能被称为“洋芋”“地蛋”“马铃薯”等;

  • 场景二:语音输入开单时,客户一般会一次性念十几二十种商品,除了数量多,更难的是,用户口音差异可能会导致生成内容存在误差,比如王总的火锅食材配送开单时,曾将“独大蒜”识别为“毒大蒜”,“包包菜”识别为“巴巴菜”,“鲜苕粉丝”识别为“轩少粉丝”,“绿豆粉”识别为“罗豆粉”等。


畅捷通技术专家介绍,通过提示词工程告知文心大模型输入项为商贸企业的场景需求,基于其自身优异的理解、生成、逻辑、记忆能力,便可以将拆分召回信息对比商品库进行精排,准确理解和识别产品。


针对语音输入时容易产生的同音和谐音干扰,团队优化了召回算法,先通过商品库进行初步召回,再借助大模型进行精细排序。此外,畅捷通团队还开发了记忆模块,用于记录人工纠偏信息,以便在再次识别相同内容时快速调用,显著提升了响应速度。据介绍,这些措施有效提高了语音输入的召回准确率,尤其是针对原本识别率较低的情况,提升幅度超过 50%。



现在,像王总一样的商贸批发企业,一旦有下游客户要货,就可以直接把截屏图片、聊天内容粘贴到开单界面,或者通过语音输入实现快速开单。后台识别确认该单无欠款并且有货,AI 就能按规则自动进行审核,系统自动生成销货单。一张平均 20-30 件商品的销货单,传统手工录入需要 5 分钟左右,现在通过“好业财智能开单”功能,可以在 10 秒左右完成“输入、识别、理解、生成、审核、开单”全流程,企业平均一天使用智能开单功能的数量超百个,大客户促销高峰时支持企业单日开单上万个。


随着 AI 功能的不断布局,畅捷通进一步基于文心大模型开发了智能体“小畅 AI 助理”,并将针对产品使用的智能客服和部分 AI 业务执行接入其中。


目前,客户提出产品功能使用相关问题时,AI 可以调取相关知识库,基于文心大模型的充分的理解生成能力,进行客服功能的内容回复;同时,客户还可以通过“小畅 AI 助理”对财务报表进行交互,例如输入“请进行销售数据统计分析”并说明重点希望看到的指标, AI 便可快速进行数据概览、详细解读,还能实现对数据的可视化展示。通过可视化指标的切换,能够细致到按业务员等不同维度对销售额情况变化进行归因分析。

低门槛、一体化实习生“徒手”两周部署搞定


基于多年来对 AI 技术的探索经验,畅捷通对市面上的大小模型和开发工具进行了全面的测评,最终确定了“飞桨+文心大模型”的技术组合方案。


一直以来,飞桨为文心大模型快速发展提供核心支撑,从性能、开发效率和硬件适配三端优化。飞桨框架还集成四项关键能力——自动并行、编译优化、训推一体、跨硬件兼容,显著降低大模型开发门槛。依托芯片到应用的四层技术布局,百度 AI 技术正加速驱动 AI 在产业与科研领域的落地应用。


“百度的技术产品,在训练、推理、部署一体化的能力表现很好。”畅捷通技术专家介绍,首先,学习成本非常低,原先算法工程师才能完成的项目,现在依托低代码开发工具 PaddleX,一个实习生就能完成模型微调、训练和部署;其次产品操作逻辑简单反馈速度快,部署完成后就能进行验证,若需优化,可以直接在系统内调整提示词提升 AI 性能。


由于产品表现好、准确率稳定保持高位,越来越多业务场景和数据形式被拓展出来,各类合同识别录入、财务分析等功能也在陆续开发中。未来,更多财务功能入口将逐渐统一到“小畅 AI 助理”,用户只需通过自然语言输入指令需求,并结合文心大模型的多轮对话能力,即可完成不同流程的工作处理。


好业财希望能够通过人工智能的布局和落地,实现基于人机交互的数据分析和洞察,让 AI 成为解放传统财会专业人员的数字助理,将其从原先滞后的审核流程工作中解脱出来,进阶到提前发出财会层面的决策预警,推动财务安排更加合理和精细化。


未来,百度 AI 也将与以畅捷通为代表的更多财务智能化服务企业携手,助力 AI 融合到真移动、易交付、智能化、行业化、平台化、生态化的“业财管融合”SaaS 服务中,拓展更多场景化功能,为企业客户提供更广泛的技术连接以及全方位的数字化管理服务。

2025-11-27 11:486

评论

发布
暂无评论

第一周学习总结

月殇

极客大学架构师训练营

第一周架构之UML

若水先生

极客大学架构师训练营

作业一:食堂就餐卡系统设计

静海

UML

架构师训练营1期作业-学习总结

道长

极客大学架构师训练营

第10周总结

纯纯

架构师训练营第一期-第一周课后作业

卖猪肉的大叔

【架构师训练营第 1 期】第一周作业

万里

极客大学架构师训练营

潮汕之旅第一站

熊斌

摄影 游记

架构师训练营第一期-第一周学习总结

卖猪肉的大叔

架构师1期week01总结

FG佳

架构师训练营Week1 - 学习总结

极客大学架构师训练营

架构师训练营第一周命题作业

一马行千里

极客大学架构师训练营

合并两个单向链表

纯纯

微服务架构

纯纯

性能测试总结

纯纯

架构师训练营第一周作业 食堂就餐卡系统设计

帅到没朋友

极客大学架构师训练营

食堂就餐系统

focus

第八周总结

纯纯

食堂就餐卡系统设计

L

作业二:第一周学习情况总结

静海

【第一周】课后作业

云龙

极客大学架构师训练营

架构师训练营第一章作业一:就餐管理系统UML图

zenfery

极客大学架构师训练营

第一周命题作业

月殇

极客大学架构师训练营

Python+Appium运行简单的demo,你需要理解Appium运行原理!

清菡软件测试

食堂就餐卡系统设计

jizhi7

极客大学架构师训练营

架构方法

Eddy.何

极客大学架构师训练营 命题作业

【架构师训练营】第一周作业:画图

MindController

架构师

食堂就餐卡系统UML设计

Meow

极客大学架构师训练营

第一周 架构方法学习总结

L

第五周总结

纯纯

食堂就餐卡设计

Bear

极客大学架构师训练营

开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动_生成式 AI_飞桨PaddlePaddle_InfoQ精选文章