NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

大模型时代,企业如何打造 AI 数据基础设施?

  • 2023-09-20
    北京
  • 本文字数:3051 字

    阅读完需:约 10 分钟

大小:1.64M时长:09:32
大模型时代,企业如何打造 AI 数据基础设施?

9 月 19 日,AI 基础设施公司 Fabarta 在北京举办首届产品与用户大会,本次大会以“数联世界 智见未来”为主题,汇聚前沿技术与商业洞见,来自学术界、投资界、以及 Fabarta 的客户、合作伙伴、各行业大咖共同分享  AI 赋能业务新范式的多种路径,探讨大模型时代企业如何打造 AI 数据基础设施,迈入真正的全面智能化时代。

构建面向智能应用的数据基础设施

 

当前 AIGC 技术快速发展,企业面临数字化转型和智能化升级的历史机遇。Fabarta 创始人兼 CEO 高雪峰在“数联世界、智见未来”的主题演讲中指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。

 

Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集。此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 AI Agents 打造核心的数据引擎。

 

Fabarta 创始人兼 CEO 高雪峰表示,Fabarta 不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI 时代可以自生长的有机数据记忆体。 

 

高雪峰强调,Fabarta 致力于打造的是这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施,从而更好,更方便,更加放心地将包括生成式人工智能技术在内的智能技术应用到企业决策智能领域,最终带来业务价值的巨大飞跃。抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。

 

Fabarta 联合创始人兼 CTO  杨成虎在演讲中深入探讨了企业智能发展的新引擎——多模态智能引擎 ArcNeural。他强调,在强人工智能的背景下,企业知识数据与大型模型之间的互补性,企业私有数据的潜在价值,以及将私有知识与智能应用紧密结合的必要性。

 

杨成虎还详细分享了 ArcNeural 存查算一体的数据管理能力,并结合大模型技术实现智能化、可追溯、可解释的数据洞察能力。ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。  最后,他还现场展示了多模态引擎 ArcNeural 结合 ArcFabric、ArcPilot,利用一体两翼范式在 Fabarta 企业内实施的一个 Copilot 系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。他表示:“计算 &存储是过去,推理 &记忆才是未来”。

 

Fabarta 联合创始人兼 CPO 仲光庆分享了产品矩阵的设计思路和出发点。Fabarta 经历了从 DB for AI 到大模型时代 AI 基础设施的演进过程。他表示:“当前大模型时代,企业面临从数据、模型到业务落地的全链路挑战,构建融合图数据库和向量数据库的新型数据基础设施,实现数据治理、知识管理和模型记忆,是应对大模型时代的关键。通过低代码平台加速场景化应用落地,企业更关注数据资产与业务价值的产出是智能化新范式,Fabarta 打造的‘一体两翼’产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。

AI 时代数据基础设施的学术研究与行业思考

 

会上,Fabarta 科学顾问,国家杰青和优青基金获得者,北京理工大学特聘教授、大数据研究院院长袁野做了“AI 时代数据基础设施新范式的研究与应用”的学术分享。

 

袁教授围绕 AI 视角、数据视角和案例分析三个角度展开讲解,他认为,在 AI 视角,连接主义是模型实现基础,符号系统是高层能力特征,两种基础范式的结合是人工智能发展的必经之路,可以通过图知识增强大模型。 在数据视角,神经符号化的融合方式实现一体化数据管理。通过三个案例分析 —多模态图谱查询、视频数据分析和神经符号数据库,给出 AI 时代数据基础设施新范式的案例参考。

 

随着 AI 时代的技术演进,数据基础设施也在持续更新和迭代中。中国信通院云计算与大数据研究所大数据与区块链部副主任马鹏玮指出,AI 和数据基础设施正在双向奔赴,AI 赋能数据基础设施升级,数据基础设施助力 AI 产业发展。

 

马鹏玮认为,AI 赋能数据基础设施升级,通过数据存算+AI,诞生自治数据库;通过数据管理+AI,诞生智能数据管理工具;通过数据分析+AI :诞生增强型数据分析工具。数据基础设施助力 AI 产业,通过隐私计算、防篡改数据库、全密态数据库和多模态数据编织实现“汇数”,通过向量数据库实现“炼模”,通过图、向量和大模型相结合的技术,实现“用模”。

Fabarta 如何助力企业实现数智化转型?

 

当前,Fabarta 已经通过“一体两翼”产品矩阵帮助金融、制造、医疗等多个行业客户解决业务中的问题,并且成功实施落地。

 

泰康养老作为保险行业头部企业,利用 Fabarta 产品进行数据资产项目落地。 泰康养老数据基建部总经理吴坚平提到,金融保险行业数据资产管理工作中,数据量级爆炸性增长、数据类型多种多样、数据质量需求、数据合规性要求严,数字化建设过程中对于数据资产工具的需求越来越高,亟需智能化工具和产品可以解决以上痛点和问题。

 

通过 Fabarta ArcFabric 产品以及图和 AI 的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。在数据资源纳管阶段,实现元数据主动采集,利用 ArcGraph 进行血缘分析;利用 AI 技术实现元数据智能补齐、资产智能分类,构建数据资产大图;结合资产运营、资产评估,通过对话式数据看板等方式提供一站式数据资产服务。泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。

 

大树科技是专注于智能企服及供应链数字技术的高新技术企业,利用产业链场景数据丰富小微客户画像,通过智能风控手段对客户实现精准的风险分层,实现风险可控的同时为特定产业内的上下游小微客户提供便利的普惠金融服务。大树科技风控和大数据负责人申宇峰带来“图解复杂,洞察价值 图智能助力业务创新”的分享。申宇峰指出,图数据库和图算法的应用已成为金融风控的新趋势,可以通过多跳复杂关系发现隐藏在孤立统计信息背后的关系和价值。

 

申宇峰表示,大树科技利用 ArcGraph 和 ArcPilot 产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。在落地实践中,可以利用 ArcPilot 的图计算能力、灵活可配置画布功能以及行业模版提升图应用开发速度,沉淀图分析场景数据资产。大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。

 

亨通数科是一个面向全球工业装备提供从平台建设、数据应用到知识服务的全栈式产品服务商。亨通数科产品总监董晓健带来 “新一代设备全生命周期管理 — 多模态智能引擎,红海突围的利器”的分享。

 

董晓健指出,“在产品开发中,需要深挖市场需求和设备管理痛点。亨通数科利用 Fabarta ArcNeural 多模态智能引擎,打造新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。”

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-20 17:174300

评论

发布
暂无评论
发现更多内容

如何提升企业在全面预算中管理组织水平?

用友BIP

全面预算

四行代码开启流计算之旅

吴英骏

数据库 开源 流计算 云原生 存储

KaiwuDB 受邀出席大型企业数字化转型峰会暨工赋山东济南峰会并发表演讲

KaiwuDB

KaiwuDB 数字化转型峰会

低代码赋能数字化转型的5种方式

这我可不懂

低代码 数字化转型 JNPF

国外服务器助力你的网站实现全球业务拓展!

一只扑棱蛾子

国外服务器

用好支付宝小程序云云开发,告别繁琐的小程序开发流程

TRaaS

小程序 支付宝小程序

数智人力:如何通过搭建全球人才供应链帮助企业海外扩张?

用友BIP

人力资源 数智人力

软件测试 | 性能测试的种类有哪些?

测吧(北京)科技有限公司

测试

软件测试 | 性能测试误区(二)

测吧(北京)科技有限公司

测试

JMeter笔记12 | JMeter集合点

测试 单元测试 Jmeter 性能测试 接口测试

冠军!天翼云在国际AI顶会大模型挑战赛中拔得头筹!

天翼云开发者社区

人工智能

中国农发行的全面预算管理新举措

用友BIP

全面预算

API网关-APISIX简介

天翼云开发者社区

云原生 API

沉浸式下载Niconico视频到手机相册,手残党们快快跟上!

frank

软件测试 | 性能测试的误区(一)

测吧(北京)科技有限公司

测试

JMeter笔记11 | JMeter事务

测试 Jmeter 性能测试 自动化测试 接口测试

70+页实战经验分享,《研发效能红宝书》重磅发布 | 附下载

思码逸研发效能

研发效能

快速掌握 Axios 请求库的基本用法

Liam

程序员 开发 HTTP API axios

软件测试—性能测试的专业术语1

测吧(北京)科技有限公司

测试

社交泛娱乐全球化,看融云出海如何助力玩法创新催生长线黑马?

融云 RongCloud

音视频 融云 泛娱乐 出海 通讯

4 个月、2 万颗星,1 个恒纪元

Zilliz

非结构化数据 Milvus 大模型时代 向量数据库 zillizcloud

霍格沃兹测试开发学社线下班开班啦!无offer返学费哦!

测吧(北京)科技有限公司

测试

数字底座的连接集成加速数智企业互联互通

用友BIP

数智底座 数字底座 连接集成

基于OpenHarmony开发的玻璃拟态天气应用(1)项目介绍及项目的初始搭建

路北路陈

前端 HarmonyOS OpenHarmony应用开发 6 月 优质更文活动

openEuler+Linaro合作成果展示|2023开放原子全球开源峰会

openEuler

Linux 开源 操作系统 openEuler linaro

软件测试—性能测试的专业术语2

测吧(北京)科技有限公司

合约交易所系统开发搭建流程

薇電13242772558

系统开发

SCADA系统架构的类型

2D3D前端可视化开发

物联网 web组态 工业自动化 SCADA 工业组态

TRUNCATE 语句到底因何而慢?

爱可生开源社区

MySQL 源码 innodb TRUNCATE

一文读懂火山引擎A/B测试的实验类型(2)——可视化实验

字节跳动数据平台

A/B 测试

OpenHarmony社区运营报告(2023年5月)

OpenHarmony开发者

OpenHarmony

大模型时代,企业如何打造 AI 数据基础设施?_生成式 AI_凌敏_InfoQ精选文章