AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

基于 Elasticsearch 创建企业 AI 搜索应用实践 |QCon 北京

  • 2025-03-23
    北京
  • 本文字数:1458 字

    阅读完需:约 5 分钟

基于 Elasticsearch 创建企业 AI 搜索应用实践 |QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


Elastic 中国社区首席布道师刘晓国已确认出席并发表题为《基于 Elasticsearch 创建企业 AI 搜索应用实践》的主题分享。传统的词汇搜索不能满足当今时代的需求,特别是在这个智能的时代。当代企业针对搜索提出语义搜索,也就是根据文字的语义来进行搜索,而不是简单的词汇匹配。另外,我们也需要针对其它的数据类型,比如图片,语音及视频来进行搜索。


Elasticsearch 自 8.0 开始提供向量搜索(密集向量,稀疏向量)。它可以完美地解决文字语义搜索及多媒体数据的搜索。此外,向量搜索也并非完美,特别是针对文字搜索。我们可以使用混合搜索(词汇搜索,向量搜索)进行多路召回并对最终结果进行排名,这种方法可以提高搜索的精度及召回率。在人工智能发展的今天,结合大模型,使用 GenAI 可以让我们得到唯一的搜索答案,而不是传统的搜索引擎提供的多页面的搜索结果。由于企业数据或私有数据在每时每刻都在生成。大模型在缺乏上下文的情况下使用大模型来进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成)。本次演讲将详细介绍 Elasticsearch 的向量搜索技术及如何使用它进行 RAG 的应用开发。


刘晓国是新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过嵌入式软件开发,电脑设计,手机软件设计,汽车电子,计算机操作系统,通信,云实时事件处理等行业。他在本次会议的详细演讲内容如下:


演讲提纲

1. 智能时代的搜索需求

  • 对语义搜索的需求,而不是简单的词汇匹配

  • 对多媒体数据的搜索,比如图片,声音及视频

  • 非结构化数据的搜索

  • 向量搜索带来的新的解决方案

2. Elasticsearch 向量搜索

  • 向量搜索原理

  • 向量搜索种类(密集向量,稀疏向量)

  • 混合搜索介绍(多路召回,综合评分)

3. RAG 实现

  • 如何使得大模型变得更聪明

  • RAG 的实现方法

4. Elasticsearch 在向量搜索上的最新进展

  • 硬件加速

  • 并行化

  • 标量量化

  • 搜索效率

  • 重新排名

  • Semantic text 字段

  • 推理 API

  • AI 生态

5. 使用 Elasticsearch 在企业搜索中的案例分享

  • 高级 RAG 案例分享


您认为,这样的技术在实践过程中有哪些痛点?

向量搜索需要大量的内存及计算能力,如果针对超大规模的数据进行向量搜索,存在成本上考虑。有时搜索的结果缺乏可解释性。如何结合传统的词汇搜索来实现更加精准的搜索的结果。如何使用大语言模型/人工智能来提高最终的搜索结果排名。在使用 GenAI 时,如何针对私有或者企业数据来规避幻觉。


演讲亮点

  • 使用 Elasticsearch 来针对企业进行大规模的商用、规避搜索幻觉

  • 结合大模型,使用混合搜索来得到更加精准的搜索结果


听众收益

  • 了解如何运行 Elasticsearch 来进行语义搜索

  • 了解如何结合大模型,针对企业数据进行 GenAI 搜索


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-23 09:034254

评论

发布
暂无评论

ppt美化ai软件有哪些?这5款AI工具一键生成PPT!

彭宏豪95

人工智能 PPT AIGC 效率软件 AI生成PPT

ByteSRC奖励再升级,单个重大漏洞提升至10万元

极客天地

即时通讯技术文集(第35期):IM群聊技术合集(Part2) [共12篇]

JackJiang

即时通讯;IM;网络编程

万字带你了解ChatGLM

华为云开发者联盟

人工智能 华为云 大模型 华为云开发者联盟

十分钟掌握分布式数据库开发:OpenMLDB 开发者镜像详解

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

基于 K8s 容器集群的容灾架构与方案

阿里巴巴云原生

阿里云 Kubernetes 云原生

面试八股文,自有其道理

老张

面试 专业能力

提升地理空间分析效率,火山引擎ByteHouse上线GIS能力

字节跳动数据平台

数据库 大数据

数据“隐领”未来!【隐私计算实训营】限时免费招募!

隐语SecretFlow

数据分析 数据安全 隐私计算

超越基础设施:深度探讨平台工程的关键支柱

SEAL安全

架构 基础设施 平台工程

npm是如何处理多版本依赖的?

伤感汤姆布利柏

为了跳槽或提升自己,你会先学习哪一门编程语言?

小魏写代码

软件测试学习笔记丨服务端问题定位常用linux指令集合

测试人

Linux 软件测试

Tapjoy from Unity 推出“每日奖励”积分墙广告,以增强用户粘性并提升投放 ROAS

极客天地

【体验有奖】用 AI 画春天,函数计算搭建 Stable Diffusion WebUI

阿里巴巴云原生

阿里云 云原生 AIGC

「飞桨星河社区创作者激励计划」全新上线!丰富权益,等你领取~

飞桨PaddlePaddle

百度 开发者社区 百度飞桨 星河社区 飞桨星河社区

[自研开源] MyData v0.7.2 更新日志

LIEN

开源 数据集成 业务融合 API对接 mydata

代币开发:2024年代币开发主要因素

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

2024-03-13:用go语言,给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。 输入: root = [6,2,8,0,4,7,9,null,null,3,5], p = 2, q =

福大大架构师每日一题

福大大架构师每日一题

如何定期清理数据库中的无效数据?

NineData

数据清理 数据归档 NineData 无效数据 优化数据库

一个数据库死锁竟然被测试发现了,这你敢信

京东科技开发者

一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务

阿里巴巴云原生

阿里云 云原生 函数计算

编译GreatSQL with RocksDB引擎

GreatSQL

带你走进 HarmonyOS:前端如何迎接新技术的到来

京东科技开发者

得物布局构建耗时优化方案实践

得物技术

xml 前端

开放原子开源大赛—基于OpenHarmony的团结引擎应用开发赛正式启动!

OpenHarmony开发者

网络安全等级测评师考试培训可以参考哪些资料?

行云管家

等保 等级保护 等保测评师

等保测评与信息安全管理体系认证的区别

行云管家

等保 等级保护 等保测评

【一文读懂】基于Havenask向量检索+大模型,构建可靠的智能问答服务

阿里技术

向量检索 LLM 智能问答 Havenask 召回搜索引擎

代码精简执行过程

京东科技开发者

基于 Elasticsearch 创建企业 AI 搜索应用实践 |QCon北京_AI&大模型_QCon全球软件开发大会_InfoQ精选文章