AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331019

评论

发布
暂无评论
发现更多内容

建立的知识库的7个步骤

Geek_da0866

乘势而上,OceanBase推动数字支付精益增长

OceanBase 数据库

NFTScan 与 Atem Network 在 NFT 数据领域达成战略合作

NFT Research

NFT NFTScan

利用Python浅尝算法分析

迷彩

算法复杂度 7月月更 算法分析

思维导图学《On Java》基础卷

Yano

Java

为什么知识库很重要?这是我听过最好的答案

Geek_da0866

创建企业wiki,你需要知道这些

Geek_da0866

Dao智能合约Dapp系统开发技术

薇電13242772558

智能合约 dapp DAO

时代潮头,华为将风帆对准数字金融的风与海

脑极体

AWS使用EC2降低DeepRacer的训练成本DeepRacer-for-cloud的实践操作

指剑

AWS Amazon EC2 deepracer

【愚公系列】2022年07月 Java教学课程 07-变量和数据类型

愚公搬代码

7月月更

网络安全之ARP欺骗防护

网络安全学海

网络安全 安全 信息安全 渗透测试 漏洞挖掘

Java基础 ——入坑必读

攻城狮杰森

Java 7月月更

区块链开发:如何从 Solidity 智能合约中发送和取款

devpoint

区块链 Solidity 7月月更

Flink数据源拆解分析(WikipediaEditsSource)

程序员欣宸

Java flink 7月月更

编写一个具有搜索提示的搜索框

空城机

JavaScript 7月月更

华为云AI院长峰会在黔举行 推动人工智能产学研创新发展

Geek_2d6073

wallys/PD-60 802.3AT Input Output 802.3AT/AT 85% Efficiency 10/100/1000M GE Surge Protection

wallys-wifi6

MT7915/MT7975/IPQ6000

百度搜索打击盗版网文站点:互联网内容侵权现象为何屡禁不止

石头IT视角

构建知识库时,如何避免最常见的几个错误?

Geek_da0866

快速支持客户知识库的核心优势是什么?

Geek_da0866

AIRIOT答疑第5期|如何使用低代码业务流引擎?

AIRIOT

物联网

如何优雅的改变this指向

bo

JavaScript 前端 7月月更

冲刺金九银十!熬夜爆肝半个月汇集大厂Java岗1600道面试真题

了不起的程序猿

Java java程序员 java面试 java编程

硕果累累,再获认可!「报告、标准、评测」洞见科技走在前沿

洞见科技

隐私计算

如何为您的企业设置内部Wiki?

Geek_da0866

图像处理解决方案 veImageX 技术演进之路

字节跳动视频云技术团队

计算机视觉 图像处理 图像压缩 图像增强算法

小海豚“变身”全新智能调度引擎,深入浅出在DDS的实践开发应用

白鲸开源

大数据 工作流调度 调度任务 分布式调度引擎 大数据调度

千亿营收之后,阿里云生态有了新打法

B Impact

【刷题记录】18. 四数之和

WangNing

7月月更

主题域模型

奔向架构师

数据仓库 7月月更

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章