写点什么

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon 北京

  • 2025-03-21
    北京
  • 本文字数:1744 字

    阅读完需:约 6 分钟

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


阿里云高级算法工程师姚舰航、徐光伟已确认出席并发表题为《阿里云企业 AI 搜索大模型关键技术优化实践》的主题分享。随着人工智能和深度学习的迅猛发展,大模型(Large Language Model)在自然语言处理、计算机视觉等领域取得了突破性的成果。这些进步促使搜索技术迎来了新的变革。传统搜索主要依赖于关键词匹配和预定义的规则,强调精确的相关性匹配。然而,AI 大模型的引入,使得搜索技术从关键词检索转向了语义理解,从单一模态走向了多模态融合,从确定性检索演变为基于相似度的智能检索。


本次演讲将聚焦于 AI 搜索大模型的关键技术应用,涵盖文本向量化、降维、重排序、NL2Search(自然语言到搜索)、文档解析与切片、问答大模型评测与微调、 Agentic RAG(检索增强生成)及客户专属大模型的最新进展。具体将结合实际业务场景和案例(如智能问答系统、文档搜索、人工智能助手等),深入阐述这些技术如何提升搜索的质量和效率,以及在实践中如何克服各种技术挑战。


姚舰航是浙江大学自动化控制专业硕士,毕业后一直从事搜广推算法研究与应用工作。涉及信息流推荐、商业化广告定向 DMP、OCPX 深度转化模型优化以及云上智能推荐等领域,具备丰富的 C 端和 B 端算法优化和实践经验。目前专注于企业级 AI 搜索方向,负责搜索专属大模型训练以及 Agentic RAG 能力建设。


徐光伟在搜索技术和 NLP 算法方向有十年以上的经验,共有 20 篇以上的顶会论文发表和 50 篇以上的专利,拿到 MS MARCO 和 TREC 2022 文档检索的冠军、NL2SQL 任务 BIRD 榜单的冠军。在 to B 业务方向有八年的经验,搜索云服务业务上推动了行业版算法效果超越竞品,创新地提出轻量化客户定制与多模态检索的产品功能持续迭代,赢得多个标杆客户的认可。


本次大会,两位讲师分享的详细演讲内容如下:


演讲提纲

  • AI 大模型在搜索领域的背景与趋势

  • 文本向量化与降维

  • 搜索结果的重排序模型

  • NL2Search:从自然语言到搜索

  • 基于大模型的语义切片

  • 大模型问答质量评测与微调

  • Agentic RAG 实践

  • 客户专属大模型训练探索

您认为,这样的技术在实践过程中有哪些痛点?

  • 文本向量化与降维:向量化可能导致高维数据难以处理,而降维可能导致信息丢失,影响搜索效果

  • 重排序算法:需要高效的算法以确保实时性,尤其是在大规模数据集上,但计算复杂度可能成为瓶颈

  • NL2Search(自然语言到搜索):构建高质量的自然语言处理模型需要大量标注数据,且模型的准确性对于搜索体验非常关键

  • 基于大模型的语义切片:切片语义完整度直接影响搜索结果的相关性

  • 大模型问答质量评测与微调:大模型问答缺乏全面且高精度的质量评测体系,大模型在 AI 搜索场景中仍存在幻觉、回答不完整、回答冗余等问题

  • Agentic RAG 实践:单轮 RAG 难以解答复杂问题(如多跳问题、聚合问题等)

  • 客户专属大模型训练:由于大模型缺乏客户专有域知识,对客户场景特有问题的理解不足,回答不专业

演讲亮点

  • 实际业务场景结合:通过智能问答系统和文档搜索案例,展示 AI 搜索技术如何在现实中应用,增强观众理解

  • 前沿技术进展:介绍 Agentic RAG 的最新进展,帮助听众了解技术的未来发展趋势

  • 技术问题与解决方案:不仅指出各项技术的实际痛点,还提供了相应的解决策略,使内容更加实用

  • 综合性讨论:涵盖从文本向量化到问答大模型的多个技术层面,提供全方位的知识视角

听众收益

  • 深入了解 AI 搜索大模型的核心技术和应用场景,掌握最新的行业动态和技术趋势

  • 学习如何将大模型技术应用于实际业务中,解决传统搜索难以应对的问题,提升系统的智能化水平

  • 开拓新的思路和方法,了解如何结合传统技术和大数据处理,实现高效的搜索解决方案

  • 了解当前领域的技术挑战,为未来在 AI 搜索领域的研究和实践提供指引


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-21 17:045272

评论

发布
暂无评论
发现更多内容

OneFlow源码解析:自动微分机制

OneFlow

人工智能 深度学习 框架学习

动不动问原理,面试官你来讲讲Spring的原理?讲出来我给你开25K

钟奕礼

Java 程序员 java面试 java编程

PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]

汀丶人工智能

神经网络 图神经网络 12月日更 11月月更 12月月更

GaussDB(for Cassandra)新特性发布:支持Lucene二级索引,让复杂查询更智能

秃头也爱科技

编译器优化丨Cache优化

华为云开发者联盟

后端 开发 华为云 12 月 PK 榜

TiDB在科捷物流神州金库核心系统的应用与实践

TiDB 社区干货传送门

迁移 实践案例 HTAP 场景实践 OLTP 场景实践

App 长登录思考与实现part2

石君

App 信息安全 认证

如何通过C#/VB.NET将PDF转为Word

在下毛毛雨

C# PDF word 转换

低代码领域:发展路径、市场规模及未来趋势洞察!

优秀

低代码

手把手教你成为荣耀开发者:账户结算操作指南

荣耀开发者服务平台

android 开发者 手机 荣耀 honor

HA高可用软件大致有哪些?大众用的哪款?

行云管家

高可用 ha 高可用软件

更改 HIVE 表字段数据类型有哪些注意事项?

明哥的IT随笔

hadoop hive

iOS SIGKILL 信号量崩溃抓取以及优化实践

百度Geek说

ios 12 月 PK 榜 崩溃日志

阿里P8面试官总结的《2023最新java面试题》,搞定90%以上的技术面

钟奕礼

Java 程序员 java面试 java编程

非结构化数据暴增,企业如何稳定高效的支撑日均百亿级访问

秃头也爱科技

【JUC】交换器Exchanger详解

JAVA旭阳

Java JUC

java培训怎么学习才好?

小谷哥

奇点云DataSimba R4.5发布关键更新,做到“可大可小可观测”

奇点云

基于分发与计算的GRTN全球实时传输网络

阿里云CloudImagine

互联网 科技 GRTN 全球实时网络传播 分发与计算

前端培训没有基础应该怎么学习

小谷哥

白嫖GitHub Pages,轻松搭建个人博客

LigaAI

Hexo GitHub Pages 个人博客 个人网站 12 月 PK 榜

云小课|基于华为云WAF的日志运维分析,构筑设备安全的城墙

华为云开发者联盟

后端 华为云 waf 12 月 PK 榜

直播预告|PostgreSQL 技术内幕(四)执行引擎之Portal

酷克数据HashData

React 之元素与组件的区别

冴羽

JavaScript react.js 前端 前端框架 React

腾讯云数据库SaaS服务2022再升级 全面助力企业提升数据库运维能力

科技热闻

龙蜥社区 11 月运营大事件回顾

OpenAnolis小助手

活动 生态 龙蜥社区 11月 运营月报

并发编程详解:十三个工具类,十大设计模式,从理论基础到案例实战

钟奕礼

Java 程序员 java面试 java编程

架构实战营模块1第1课 - 什么是架构,你理解对了么

净意

架构实战营

别再被小程序全页变灰给坑了

FE情报局

小程序 前端

堡垒机可以试用吗?哪款堡垒机可以?咨询电话多少?

行云管家

网络安全 信息安全 数据安全 堡垒机

GitHub狂飙30K+star面试现场,专为程序员面试打造,现已开源可下载

钟奕礼

Java 程序员 java面试 java编程

阿里云企业 AI 搜索大模型关键技术优化实践 |QCon北京_阿里巴巴_QCon全球软件开发大会_InfoQ精选文章