写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331353

评论

发布
暂无评论
发现更多内容

向工程腐化开炮 | 治理思路全解

阿里巴巴终端技术

Java android 腐化治理 工程腐化

利用 IoTDB 替换 OpenTSDB,服务大唐集团60家电厂,减少95%运维成本

Apache IoTDB

Apache IoTDB

小程序开发入门教程

CRMEB

OpenHarmony标准设备应用开发(三)——分布式数据管理

OpenHarmony开发者

OpenHarmony 分布式数据

从二十年开源经历出发,70 后大龄程序员谈成长、困境与突围

TDengine

数据库 tdengine 开源

Microchip推出模拟嵌入式SuperFlash技术解决边缘语音处理难题

极客天地

教你VUE中的filters过滤器2种用法

华为云开发者联盟

Vue 过滤器 filters过滤器 组件过滤器 全局过滤器

Tapdata 肖贝贝:实时数据引擎系列(六)-从 PostgreSQL 实时数据集成看增量数据缓存层的必要性

tapdata

数据库 实时数据

龙蜥开发者说:聊一聊我技术生涯的“三次迭代” | 第 3 期

OpenAnolis小助手

技术分享 开发者故事 龙蜥开发者说 突出贡献奖

后端开发—一文详解网络IO模型

Linux服务器开发

reactor 后端开发 Linux服务器开发 网络io 网络模型

适合 Kubernetes 初学者的一些实战练习 (三)

汪子熙

云原生 集群 Kubernetes 集群 Kubernetes, 云原生, eBPF 3月月更

Git教程-帮助开发人员更好的运用Git | 云效

阿里云云效

git 云计算 阿里云 DevOps 开发者

叮咚!参与微服务免费试用,有机会获得腾讯内推资格!

InfoQ写作社区官方

腾讯云 微服务 热门活动

软件定义存储厂商大道云行加入龙蜥社区

OpenAnolis小助手

生态 存储技术 龙蜥社区 大道云行 CLA

墨天轮访谈 | 华为云温云博:从客户视角出发,GaussDB(for Redis)究竟“香”在哪里?

墨天轮

数据库 redis 华为云 国产数据库 键值数据库

一文带你了解 Python 中的迭代器

踏雪痕

Python 3月程序媛福利 3月月更

week4作业

Asha

汉化版postman

Liam

Jmeter Postman 接口测试 API swagger

深入垂直业务场景,SaaS版供应商业务协同管理系统促进企业与供应商高效协同

数商云

数字化转型 供应链系统

《LeetCode 刷题报告》题解内容Ⅱ

謓泽

3月月更

Facebook 开源 Golang 实体框架 Ent 现已支持 TiDB

极客天地

昇思MindSpore行至2022,开源社区成就生态共赢

这不科技

华为 昇思MindSpore

产品FAQ(常见问题)文档模版

小炮

产品 FAQ

外部数据的合规引入助力银行用户营销系统冷启动

易观分析

隐私计算

Rust Cell 与RefCell,有啥区别?

非凸科技

华为云GaussDB专家走进课堂,跟莘莘学子聊聊数据库

华为云数据库小助手

GaussDB GaussDB(for openGauss) GaussDB(for MySQL)

如何快速实现持续交付

阿里云云效

云计算 阿里云 软件开发 CI/CD 持续交付

明天直播:如何测试硬件设备与龙蜥操作系统的兼容性?

OpenAnolis小助手

硬件 直播 开源社区 sig 兼容性

下拉推荐在 Shopee Chatbot 中的探索和实践

Shopee技术团队

算法 chatbot 推荐算法

春暖花开,等你而来!4月月更挑战开始啦!

InfoQ写作社区官方

热门活动 4月月更

云时代,租电脑还是初创型企业最好的选择吗?

阿里云弹性计算

远程办公 无影云电脑 初创型企业

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章