写点什么

大模型时代,企业如何打造 AI 数据基础设施?

  • 2023-09-20
    北京
  • 本文字数:3051 字

    阅读完需:约 10 分钟

大小:1.64M时长:09:32
大模型时代,企业如何打造 AI 数据基础设施?

9 月 19 日,AI 基础设施公司 Fabarta 在北京举办首届产品与用户大会,本次大会以“数联世界 智见未来”为主题,汇聚前沿技术与商业洞见,来自学术界、投资界、以及 Fabarta 的客户、合作伙伴、各行业大咖共同分享  AI 赋能业务新范式的多种路径,探讨大模型时代企业如何打造 AI 数据基础设施,迈入真正的全面智能化时代。

构建面向智能应用的数据基础设施

 

当前 AIGC 技术快速发展,企业面临数字化转型和智能化升级的历史机遇。Fabarta 创始人兼 CEO 高雪峰在“数联世界、智见未来”的主题演讲中指出,构建面向智能应用的数据基础设施,是助力企业实现决策智能化的关键所在。

 

Fabarta 构筑了以数据为中心的 AIGC 落地架构范式,围绕着数据以及数据之间的关系(图和向量融合)所代表的企业数据,可以帮助大模型进行推理增强,减少模型的幻觉,实现数据的安全可控,并为其提供长效记忆能力。同时,也可以为其本地数据的 fine-tune 及预训练提供结构化的数据集。此外,作为本地知识库可以不断地进行知识的沉淀,提供可解释的智能,并为 AI Agents 打造核心的数据引擎。

 

Fabarta 创始人兼 CEO 高雪峰表示,Fabarta 不止将数据和数据之间显性、确定的关系记录在数据引擎中,通过向量的距离计算,还可以找到数据之间的丰富的隐含关系,成为了真正 AI 时代可以自生长的有机数据记忆体。 

 

高雪峰强调,Fabarta 致力于打造的是这个时代创新的数据基础设施,希望 Fabarta 的产品,可以帮助万千企业打造核心的面向智能应用的数据基础设施,从而更好,更方便,更加放心地将包括生成式人工智能技术在内的智能技术应用到企业决策智能领域,最终带来业务价值的巨大飞跃。抓住机遇,以数据为核心,构建支持智能化的架构,将是产业变革和发展的关键路径。

 

Fabarta 联合创始人兼 CTO  杨成虎在演讲中深入探讨了企业智能发展的新引擎——多模态智能引擎 ArcNeural。他强调,在强人工智能的背景下,企业知识数据与大型模型之间的互补性,企业私有数据的潜在价值,以及将私有知识与智能应用紧密结合的必要性。

 

杨成虎还详细分享了 ArcNeural 存查算一体的数据管理能力,并结合大模型技术实现智能化、可追溯、可解释的数据洞察能力。ArcNeural 架构面向云原生,并同时支持图与向量的同表管理。此外,在数据计算分析能力基础之上,利用大模型的智能化生成多模态查询计划,以此支持严谨的企业级多模态数据洞察。  最后,他还现场展示了多模态引擎 ArcNeural 结合 ArcFabric、ArcPilot,利用一体两翼范式在 Fabarta 企业内实施的一个 Copilot 系统--Arc42,Arc42 集成了代码、文档、组织关系等多模态数据,协同大模型显著提升企业效能。他表示:“计算 &存储是过去,推理 &记忆才是未来”。

 

Fabarta 联合创始人兼 CPO 仲光庆分享了产品矩阵的设计思路和出发点。Fabarta 经历了从 DB for AI 到大模型时代 AI 基础设施的演进过程。他表示:“当前大模型时代,企业面临从数据、模型到业务落地的全链路挑战,构建融合图数据库和向量数据库的新型数据基础设施,实现数据治理、知识管理和模型记忆,是应对大模型时代的关键。通过低代码平台加速场景化应用落地,企业更关注数据资产与业务价值的产出是智能化新范式,Fabarta 打造的‘一体两翼’产品矩阵,以多模态引擎为基础,数据与 AI 平台为双翼,为企业提供全链路支持,助力企业实现决策智能化”。

AI 时代数据基础设施的学术研究与行业思考

 

会上,Fabarta 科学顾问,国家杰青和优青基金获得者,北京理工大学特聘教授、大数据研究院院长袁野做了“AI 时代数据基础设施新范式的研究与应用”的学术分享。

 

袁教授围绕 AI 视角、数据视角和案例分析三个角度展开讲解,他认为,在 AI 视角,连接主义是模型实现基础,符号系统是高层能力特征,两种基础范式的结合是人工智能发展的必经之路,可以通过图知识增强大模型。 在数据视角,神经符号化的融合方式实现一体化数据管理。通过三个案例分析 —多模态图谱查询、视频数据分析和神经符号数据库,给出 AI 时代数据基础设施新范式的案例参考。

 

随着 AI 时代的技术演进,数据基础设施也在持续更新和迭代中。中国信通院云计算与大数据研究所大数据与区块链部副主任马鹏玮指出,AI 和数据基础设施正在双向奔赴,AI 赋能数据基础设施升级,数据基础设施助力 AI 产业发展。

 

马鹏玮认为,AI 赋能数据基础设施升级,通过数据存算+AI,诞生自治数据库;通过数据管理+AI,诞生智能数据管理工具;通过数据分析+AI :诞生增强型数据分析工具。数据基础设施助力 AI 产业,通过隐私计算、防篡改数据库、全密态数据库和多模态数据编织实现“汇数”,通过向量数据库实现“炼模”,通过图、向量和大模型相结合的技术,实现“用模”。

Fabarta 如何助力企业实现数智化转型?

 

当前,Fabarta 已经通过“一体两翼”产品矩阵帮助金融、制造、医疗等多个行业客户解决业务中的问题,并且成功实施落地。

 

泰康养老作为保险行业头部企业,利用 Fabarta 产品进行数据资产项目落地。 泰康养老数据基建部总经理吴坚平提到,金融保险行业数据资产管理工作中,数据量级爆炸性增长、数据类型多种多样、数据质量需求、数据合规性要求严,数字化建设过程中对于数据资产工具的需求越来越高,亟需智能化工具和产品可以解决以上痛点和问题。

 

通过 Fabarta ArcFabric 产品以及图和 AI 的能力,泰康养老已经构建从数据到资产、从资产到服务的全链路。在数据资源纳管阶段,实现元数据主动采集,利用 ArcGraph 进行血缘分析;利用 AI 技术实现元数据智能补齐、资产智能分类,构建数据资产大图;结合资产运营、资产评估,通过对话式数据看板等方式提供一站式数据资产服务。泰康养老已实现数据资产管理、数据治理与数据研发的协同以及治研一体的管理落地,未来会与 Fabarta 进行数据编织领域更深入的探索和落地。

 

大树科技是专注于智能企服及供应链数字技术的高新技术企业,利用产业链场景数据丰富小微客户画像,通过智能风控手段对客户实现精准的风险分层,实现风险可控的同时为特定产业内的上下游小微客户提供便利的普惠金融服务。大树科技风控和大数据负责人申宇峰带来“图解复杂,洞察价值 图智能助力业务创新”的分享。申宇峰指出,图数据库和图算法的应用已成为金融风控的新趋势,可以通过多跳复杂关系发现隐藏在孤立统计信息背后的关系和价值。

 

申宇峰表示,大树科技利用 ArcGraph 和 ArcPilot 产品,结合海量企业数据和交易数据,构建企业图谱和交易图谱,开展企业图谱业务分析、交易流水分析以及团伙欺诈分析,及时发现关联风险从而有效避免损失。在落地实践中,可以利用 ArcPilot 的图计算能力、灵活可配置画布功能以及行业模版提升图应用开发速度,沉淀图分析场景数据资产。大树科技期待与 Fabarta 进行更多合作和共创,从图智能扩展到大模型与图融合等更多领域。

 

亨通数科是一个面向全球工业装备提供从平台建设、数据应用到知识服务的全栈式产品服务商。亨通数科产品总监董晓健带来 “新一代设备全生命周期管理 — 多模态智能引擎,红海突围的利器”的分享。

 

董晓健指出,“在产品开发中,需要深挖市场需求和设备管理痛点。亨通数科利用 Fabarta ArcNeural 多模态智能引擎,打造新一代设备全生命周期管理软件。多模态智能引擎提供图、向量和大模型融合能力,可以为设备管理从工单录入与生成、设备故障与维修推荐、设备维修知识总结、设备技改方向选择等各环节提供支撑;同时可以利用向量代表的模糊性知识到图代表的确定性知识的转换,实现知识迁移和衍生,已经沉淀的知识可以在不同工厂复制,也可以在不同行业衍生。”

2023-09-20 17:175631

评论

发布
暂无评论
发现更多内容

破壁OLTP与OLAP:TiDB如何用“双引擎”与“异步魔法”重塑数据库架构!

TiDB 社区干货传送门

OLAP 金融 OLTP HTAP 国产化替代

开源能源管理系统的标杆之作——深度解析MyEMS的技术优势与应用价值

开源能源管理系统

开源 能源管理系统

达能×火山引擎:用AI升级消费者洞察

字节跳动数据平台

Web3 软件的开发框架

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

亿级O2O(智能设备)系统架构笔记【原创】

车江毅

架构规划 技术战略规划 百万设备在线 亿级订单 o2o

算电协同,商汤大装置为AI基础设施“降碳提智”提供新范式

Lily

喜报 | 隐语社区 SCQL Maintainer 荣获中国信通院 2025 年度 OSCAR“开源+人物”奖

隐语SecretFlow

LED屏幕样品可提供吗?

Dylan

产品 LED LED display LED显示屏 LED屏幕

1688商品评论API:轻松挑选优质商品的利器

Datafox(数据狐)

1688商品评论API 1688评论API 1688评论数据 1688评论采集

五款远程控制软件盘点排名:我们应该选择哪一款?

科技经济

第四期共读《斯坦福大学人生设计课》

ShineScrum

读书感悟 读书方式 #读书

MyEMS:智能化能源管理的创新实践者

开源能源管理系统

开源 能源管理系统

PCTA认证-101课程学习笔记

TiDB 社区干货传送门

学习&认证&课程

区块链Web3 系统的开发技术

北京木奇移动技术有限公司

区块链技术 软件外包公司 web3开发

企业必读:等保测评的几个误区——你的信息真的安全吗?

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

企业的“数字安全基建”——等保测评,为未来“扫雷”

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

数字孪生项目开发框架与特点

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

TiDB v7.1.8 多语法兼容MySQL 多场景验证

TiDB 社区干货传送门

测试 数据库迁移 国产化替代 7.x 实践 平凯数据库敏捷模式

面试官狂问的 27 个 RAG 问题全解析:从基础到架构优化,一次讲透!

测试人

软件测试

基于 Code 开源版二次开发流程:DDD 架构落地用户模型管理全流程

王中阳Go

DDD

智源具身框架Thor开源:迈向类人级全身控制,让机器人在强对抗中“站稳脚跟”

智源研究院

TiDB 企业版敏捷模式试用:政企实战场景体验

TiDB 社区干货传送门

社区活动 TEM 试用 平凯数据库敏捷模式

人工智能AI在行业的应用和技术方案

金陵老街

人工智能 AI 大模型

数字孪生项目开发技术栈

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

1688图片搜索API秘籍!轻松获取相似商品数据

Datafox(数据狐)

1688图片搜索接口 1688图片识别接口 1688图搜API 1688拍立淘api 1688按图搜索接口

BeeWorks企业即时通讯软件怎么样?

BeeWorks

即时通讯 IM 私有化部署

让 ETL 更懂语义:DataWorks 支持数据集成 AI 辅助处理能力

阿里云大数据AI技术

人工智能 阿里云 AI辅助 Dataworks

ClkLog埋点分析系统:快速实现用户行为数据采集与分析

ClkLog

开源 数据分析 埋点 sdk 画像

2025新规:歇业、整改、罚款!——只因忽略一件事

等保测评

网络安全 信息安全 数据安全 黑龙江等保测评 哈尔滨等保测评

如何利用境外舆情网站分析与应对公关事件

沃观Wovision

舆情监测 舆情监测系统 海外舆情监测 舆情监测网站

数字孪生项目的开发

北京木奇移动技术有限公司

数字孪生 软件外包公司 webgl开发

大模型时代,企业如何打造 AI 数据基础设施?_生成式 AI_凌敏_InfoQ精选文章