2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

数据库 +AI 是如何预测未来的?

  • 2019-10-29
  • 本文字数:1274 字

    阅读完需:约 4 分钟

数据库+AI是如何预测未来的?

我们生活中很多数据是有时间维度的。比如说天气或者股票价格。对于这种带有时序的数据,有一种基于时间序列的预测模型—Prophet。


这里是项目的地址,需要的小伙伴可以去上面一看究竟。而我主要做的是通过该模型来预测腾讯云数据库存储量变化的未来趋势。下来就来看看 Prophet 的强大之处吧。


前面说到 Prophet 是基于时间序列的模型,所以说时间是里面最重要的一个维度(如果您需要预测自己的数据,那么必须是 pandas 固定的时间格式)。现在就开始直接看下结果吧。



纵轴是腾讯云某类型数据库的购买总量,可以看到随着时间的增长,数据库的购买总量还是在不断增长的。而 Prophet 所要做的就是根据数据的历史表现来估计数据未来的走势。


实验中我选取了 2018 年 1 月到 6 月的数据作为测试集。黑点为真实值,蓝色区域为模型预测的估计值,可以看到随着时间的推移,总体估计容量的趋势是增长的,但是随着时间的推移,不确定性区域越来越大(图中蓝色区域),也可以认为是随着时间的推移,不确定性越来越大。下面来看看真实值与模型预测值是否准确:



图中 6 月份以后的数值是对模型的测试集,红色区域就是模型未见过的数值与估计值的相对情况。可以明显的看到,该模型估计还是相当准确的呀。可能有很多小伙伴要问了,为啥 4 月末会出现一个阶段式的跳跃呢?就是我们腾讯云的一个大客户拼多多最近有比较大的手笔。


当然该模型不仅仅可以估计进几个月,也可以估计更长的时间,但是随着时间的推移,可能就更不准确了。


重点来了!!!这东西就是预测一个容量那么简单么?当然不是了。。主要分两大方面:


1.可以为我们自己提供服务:


(1)可以为我们提供潜在客户的估计。(比如明显可以看到某个公司近几个月飞速购买数据库服务,但是该公司不是我们的大客户。所以很难通过简单的容量排行榜找到他。但是 Prophet 可以估计出谁可能在后面变成大客户,这样就可以告诉架构师谁是我们的潜在客户。)


(2)还可以通过对我们数据库的总量或者单个客户的数据库总量进行估计,告诉大概什么时候客户需要扩容了,让我们对自己的服务有更好的准备。


2.也可以为我们的客户服务:


(1)客户可以通过对自习所选的维度进行分析,相当于一个 saas 服务。


(2)客户还可以对自己所买的 CVM 相关的用量进行分析,以便选择最合理的配置。


最后简单说下模型内部结构。


Prophet 是一个累加回归模型(additiveregressionmodel)模型的整体构建如下:


y(t) = g(t)+s(t)+h(t)+et
复制代码


主要有三部分组成:growth(增长趋势)、seasonality(季节趋势)以及 holidays(节假日对预测值的影响)。其中 g(t)表示增长函数,用来拟合时间序列中预测值的非周期变化。用分段线性或逻辑增长曲线拟合的趋势成分。Prophet 会从数据中找出转折点,自动检测趋势变化 s(t)用来表示周期性变化,比如每周、每年中的季节等。用傅里叶级数建模的季节成分,以年为单位。用虚拟变量表示的季节成分,以周为单位 h(t)表示时间序列中那些潜在的具有非固定周期的节假日对预测值造成的影响。et 为噪声项。


本文转载自公众号云加社区(ID:QcloudCommunity)。


原文链接:


https://mp.weixin.qq.com/s/NLVo9IF6Kfu1X7Pz-RvwdQ


2019-10-29 19:221044

评论

发布
暂无评论
发现更多内容

数据可视化系列教程之组件构成

云智慧AIOps社区

前端 低代码 开源项目 数据可视化 可视化大屏

测试需求平台3-登录打通和产品列表功能实现

MegaQi

测试平台开发教程 9月月更

华为云快成长GaussDB(for Redis)

IT资讯搬运工

【CSS·清除浮动】Clearing floats:clear、clearfix、overflow、flow-root

翼同学

CSS 前端 9月月更

万物皆可集成系列:低代码对接企企云实现数据集成

葡萄城技术团队

k8s自定义controller三部曲之一:创建CRD(Custom Resource Definition)

程序员欣宸

Kubernetes k8s 9月月更

玖章算术受邀参加红杉Talk「创新的复利」科技专场,共同探讨云计算的前世今生

数据库 数据复制 数据管理 数据备份 玖章算术

【CSS】:正常布局流(normal flow)、有趣的浮动(float)

翼同学

CSS 前端 9月月更

深耕隐私计算技术,瓴羊DataTrust团队喜获殊荣

瓴羊企业智能服务

maven入门

楠羽

maven 笔记 9月月更

# 靠谱:开源IM项目OpenIM压测程序介绍-自己动手压测性能和稳定性

Geek_1ef48b

关于链路追踪所需要了解的知识

穿过生命散发芬芳

链路追踪 9月月更

数据中心网络架构的需求原则及策略

阿泽🧸

数据中心 9月月更

跟着卷卷龙一起学Camera--黑电平Blacklevel

卷卷龙

ISP camera 9月月更

C++学习------cassert头文件的作用与源码学习

桑榆

c++ 9月月更

【CSS·显示类型】 block、inline以及inline-block

翼同学

CSS 前端 9月月更

华为云WeLink直播助力高校毕业典礼:这届毕业生,我们云上嗨

科技云未来

新书上市 | 连载 5 年,千万读者追更,这本书讲透了通信背后的故事!

图灵社区

通信技术 科技史

Predicate

急需上岸的小谢

9月月更

高级产品经理必备素养

产品海豚湾

产品经理 职业发展 商业化 9月月更 产品价值

实践分享!GitLab CI/CD 快速入门

北京好雨科技有限公司

企业号九月金秋榜 Kuberetes

Web3大行其道,为何说Zebec值得投资人期待?

BlockChain先知

以数字技术赋能产业金融生态能力建设,破解银行的场景焦虑

易观分析

金融 银行 数字科技

基于 xbot 实现微信关键词自动回复

Hanson

微信 微信机器人 自动回复

从用户到开发者是一种思维进化过程 | 访 StarRocks Committer 周威

StarRocks

Nacos 安装教程(史上最详细保姆级教程)

nacos SpringCloud 9月月更

高并发场景下,6种方案,保证缓存和数据库的最终一致性!

C++后台开发

数据库 缓存 高并发 后端开发 C++开发

Linux面试最高频的5个基本问题

千锋IT教育

leetcode 206. Reverse Linked List 反转链表(简单)

okokabcd

LeetCode 数据结构与算法

2022-09-01:字符串的 波动 定义为子字符串中出现次数 最多 的字符次数与出现次数 最少 的字符次数之差。 给你一个字符串 s ,它只包含小写英文字母。请你返回 s 里所有 子字符串的 最大波

福大大架构师每日一题

算法 rust语言 福大大

南阳蓝天燃气携手WeLink共创数字蓝天

科技云未来

数据库+AI是如何预测未来的?_数据库_邵宗文_InfoQ精选文章