写点什么

大模型时代,企业如何打造 AI 数据基础设施?

  • 2023-09-20
    北京
  • 本文字数:3051 字

    阅读完需:约 10 分钟

大小:1.64M时长:09:32
大模型时代,企业如何打造 AI 数据基础设施?

9 月 19 日,AI 基础设施公司 Fabarta 在北京举办首届产品与用户大会,本次大会以“数联世界 智见未来”为主题,汇聚前沿技术与商业洞见,来自学术界、投资界、以及 Fabarta 的客户、合作伙伴、各行业大咖共同分享  AI 赋能业务新范式的多种路径,探讨大模型时代企业如何打造 AI 数据基础设施,迈入真正的全面智能化时代。

构建面向智能应用的数据基础设施

 

当前 AIGC 技术快速发展,企业面临数字化转型和智能化升级的历史机遇。Fabarta 创始人兼 CEO 高雪峰在“数联世界、智见未来”的主题演讲中指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。

 

Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集。此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 AI Agents 打造核心的数据引擎。

 

Fabarta 创始人兼 CEO 高雪峰表示,Fabarta 不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI 时代可以自生长的有机数据记忆体。 

 

高雪峰强调,Fabarta 致力于打造的是这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施,从而更好,更方便,更加放心地将包括生成式人工智能技术在内的智能技术应用到企业决策智能领域,最终带来业务价值的巨大飞跃。抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。

 

Fabarta 联合创始人兼 CTO  杨成虎在演讲中深入探讨了企业智能发展的新引擎——多模态智能引擎 ArcNeural。他强调,在强人工智能的背景下,企业知识数据与大型模型之间的互补性,企业私有数据的潜在价值,以及将私有知识与智能应用紧密结合的必要性。

 

杨成虎还详细分享了 ArcNeural 存查算一体的数据管理能力,并结合大模型技术实现智能化、可追溯、可解释的数据洞察能力。ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。  最后,他还现场展示了多模态引擎 ArcNeural 结合 ArcFabric、ArcPilot,利用一体两翼范式在 Fabarta 企业内实施的一个 Copilot 系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。他表示:“计算 &存储是过去,推理 &记忆才是未来”。

 

Fabarta 联合创始人兼 CPO 仲光庆分享了产品矩阵的设计思路和出发点。Fabarta 经历了从 DB for AI 到大模型时代 AI 基础设施的演进过程。他表示:“当前大模型时代,企业面临从数据、模型到业务落地的全链路挑战,构建融合图数据库和向量数据库的新型数据基础设施,实现数据治理、知识管理和模型记忆,是应对大模型时代的关键。通过低代码平台加速场景化应用落地,企业更关注数据资产与业务价值的产出是智能化新范式,Fabarta 打造的‘一体两翼’产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。

AI 时代数据基础设施的学术研究与行业思考

 

会上,Fabarta 科学顾问,国家杰青和优青基金获得者,北京理工大学特聘教授、大数据研究院院长袁野做了“AI 时代数据基础设施新范式的研究与应用”的学术分享。

 

袁教授围绕 AI 视角、数据视角和案例分析三个角度展开讲解,他认为,在 AI 视角,连接主义是模型实现基础,符号系统是高层能力特征,两种基础范式的结合是人工智能发展的必经之路,可以通过图知识增强大模型。 在数据视角,神经符号化的融合方式实现一体化数据管理。通过三个案例分析 —多模态图谱查询、视频数据分析和神经符号数据库,给出 AI 时代数据基础设施新范式的案例参考。

 

随着 AI 时代的技术演进,数据基础设施也在持续更新和迭代中。中国信通院云计算与大数据研究所大数据与区块链部副主任马鹏玮指出,AI 和数据基础设施正在双向奔赴,AI 赋能数据基础设施升级,数据基础设施助力 AI 产业发展。

 

马鹏玮认为,AI 赋能数据基础设施升级,通过数据存算+AI,诞生自治数据库;通过数据管理+AI,诞生智能数据管理工具;通过数据分析+AI :诞生增强型数据分析工具。数据基础设施助力 AI 产业,通过隐私计算、防篡改数据库、全密态数据库和多模态数据编织实现“汇数”,通过向量数据库实现“炼模”,通过图、向量和大模型相结合的技术,实现“用模”。

Fabarta 如何助力企业实现数智化转型?

 

当前,Fabarta 已经通过“一体两翼”产品矩阵帮助金融、制造、医疗等多个行业客户解决业务中的问题,并且成功实施落地。

 

泰康养老作为保险行业头部企业,利用 Fabarta 产品进行数据资产项目落地。 泰康养老数据基建部总经理吴坚平提到,金融保险行业数据资产管理工作中,数据量级爆炸性增长、数据类型多种多样、数据质量需求、数据合规性要求严,数字化建设过程中对于数据资产工具的需求越来越高,亟需智能化工具和产品可以解决以上痛点和问题。

 

通过 Fabarta ArcFabric 产品以及图和 AI 的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。在数据资源纳管阶段,实现元数据主动采集,利用 ArcGraph 进行血缘分析;利用 AI 技术实现元数据智能补齐、资产智能分类,构建数据资产大图;结合资产运营、资产评估,通过对话式数据看板等方式提供一站式数据资产服务。泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。

 

大树科技是专注于智能企服及供应链数字技术的高新技术企业,利用产业链场景数据丰富小微客户画像,通过智能风控手段对客户实现精准的风险分层,实现风险可控的同时为特定产业内的上下游小微客户提供便利的普惠金融服务。大树科技风控和大数据负责人申宇峰带来“图解复杂,洞察价值 图智能助力业务创新”的分享。申宇峰指出,图数据库和图算法的应用已成为金融风控的新趋势,可以通过多跳复杂关系发现隐藏在孤立统计信息背后的关系和价值。

 

申宇峰表示,大树科技利用 ArcGraph 和 ArcPilot 产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。在落地实践中,可以利用 ArcPilot 的图计算能力、灵活可配置画布功能以及行业模版提升图应用开发速度,沉淀图分析场景数据资产。大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。

 

亨通数科是一个面向全球工业装备提供从平台建设、数据应用到知识服务的全栈式产品服务商。亨通数科产品总监董晓健带来 “新一代设备全生命周期管理 — 多模态智能引擎,红海突围的利器”的分享。

 

董晓健指出,“在产品开发中,需要深挖市场需求和设备管理痛点。亨通数科利用 Fabarta ArcNeural 多模态智能引擎,打造新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。”

2023-09-20 17:175655

评论

发布
暂无评论
发现更多内容

Kyligence 成功签约阿斯利康,助力提升商业洞察质量和决策效率

Kyligence

数据分析 指标中台

特定领域知识图谱(DKG)融合方案:技术知识前置【一】-文本匹配算法、知识融合学术界方案、知识融合业界落地方案、算法测评KG生产质量保障

汀丶人工智能

自然语言处理 知识图谱 实体对齐

理想问鼎销冠,数据库能帮助新能源车企赢得下半场么?

YMatrix 超融合数据库

案例分享 新能源汽车 造车新势力 超融合数据库 YMatrix

阿里云云边一体容器架构创新论文被云计算顶会 ACM SoCC 录用

阿里巴巴云原生

阿里云 容器 云原生

服务网格领域的百花齐放,是否存在一个更优解?

API7.ai 技术团队

Service Mesh 服务网格 APISIX

OpenHarmony如何切换横竖屏?

OpenHarmony开发者

OpenHarmony

北邮一号卫星搭载 IoTDB 成功发射!高效轻量数据管理,助力航天观测分析

Apache IoTDB

数据库 时序数据库 国产数据库

【提升团队运营效率】交易履约之订单中心实践

京东科技开发者

平台搭建 平台赋能 数智创新 效能提升 企业号 1 月 PK 榜

一个 go-sql-driver 的离奇 bug

SOFAStack

Databend v0.9.0 版本发布

Databend

安卓影像飞升时刻:vivo X90 Pro+打通HDR任督二脉

脑极体

Vivo 蔡司影像

IoTDB 可实现的基本操作 : 数据导入、基本查询、聚合查询 | 小白教程文档(三)

Apache IoTDB

国产时序数据库

利用 IoTDB 替换 Druid.io 服务太极股份电厂、军工制造类项目,采集精度达纳秒级

Apache IoTDB

时序数据库 国产数据库

技术型创业公司如何把握发展与管理的节奏感?

石云升

极客时间 1月月更 技术领导力实战笔记

企业内部沟通,即时通讯软件要怎么选?

BeeWorks

被面试官问住了,MySQL两阶段提交是什么鬼?

程序员拾山

MySQL 面试

WorkPlus移动办公平台,助力企业随时随地“指尖办公”

BeeWorks

KubeVela 再升级:交付管理一体化的云原生应用平台

阿里巴巴云原生

阿里云 开源 云原生 KubeVela

适配 Laravel 多版本的开源项目版本号规划

ModStart

玖章算术CEO叶正盛:程序员必须掌握的数据库原理

NineData

数据库 程序员 开发 dba 数据库技术

位运算在数据库中的实际应用

领创集团Advance Intelligence Group

数据库 位计算

如何利用极狐GitLab 轻松管理NPM依赖发布与更新?

极狐GitLab

node.js DevOps npm 依赖 极狐GitLab

maven pom 中有用的两个配置

JefferLiu

IoTDB 可实现的基本操作 —— 数据写入、删除、导出、元数据管理、时区设置 | 小白教程文档(四)

Apache IoTDB

时序数据库 国产数据库

CuPL 利用大规模的语言模型,更高效地生成提示

Zilliz

小场景解决大问题|明道云在京东方的落地实践

明道云

MySQL性能优化浅析及线上案例

京东科技开发者

MySQL 性能优化 索引性能 数据库· 企业号 1 月 PK 榜

Cloud Kernel SIG月度动态:建立社区第三方驱动研发流程、发布ANCK 4.19-027版本 | 龙蜥 SIG

OpenAnolis小助手

内核 龙蜥社区 sig 版本发布 anck

一次偶然机会发现的MySQL“负优化”

骑牛上青山

MySQL 数据库 索引

21世纪啤酒与尿布的故事

Marvin

广告 流媒体 啤酒与尿布

大模型时代,企业如何打造 AI 数据基础设施?_生成式 AI_凌敏_InfoQ精选文章