写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331307

评论

发布
暂无评论
发现更多内容

一文看懂!大模型、超大模型和 Foundation Model 有何区别?

Techinsight

#大模型

日志易SPL高效进阶:语法编辑器的妙用

日志易

编辑器 日志易SPL

NocoBase vs OutSystems:低代码平台,开源还是闭源?

NocoBase

开源 开发者 低代码 开发工具 无代码

故障测试——微软工程手册

FunTester

ChatGPT 与 AGI:人工智能的当下与未来走向全解析

Techinsight

网易伏羲人工智能实验室技术创新再突破!前馈捏脸等3篇论文入选CVPR 2025

网易伏羲

人工智能 论文 网易伏羲

场景题:线上接口响应慢,应该如何排查问题?

卷福同学

Java 面试 接口 场景题

IEC新增滤波器材料透过率标准,三安方案推动全球产业链工艺革新

财见

SD-WAN:为企业打造低成本高性能组网

Ogcloud

SD-WAN 企业组网 SD-WAN组网 sd-wan专线 SD-WAN厂家

95后程序员靠飞算JavaAI副业月入过万:他的接单秘籍全公开

飞算JavaAI开发助手

SelectDB 实时分析性能突出,宝舵成本锐减与性能显著提升的双赢之旅

SelectDB

大数据 数据仓库 数据分析 电商 实时分析

AI搜索,难分胜负

趣解商业

百度 科技 AI搜索 腾讯元宝

直播预告:慢热的 MCP 终于火了;什么是 MCP,以及智能体通信协议的未来丨RTE Dev Talk

声网

macOS Sequoia 15.3.2 (24D81) Boot ISO 原版可引导镜像下载

sysin

macos

[大厂实践] Pinterest Ray 基础设施实践

俞凡

人工智能 大厂实践

人工智能引发就业变革:热门职业面临淘汰危机!

Techinsight

人工智能

区块链资产交易所开发:从零到一构建币币交易平台

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

SpringBoot + 微服务开发太难?AI 工具自动生成脚手架代码!

飞算JavaAI开发助手

[大厂实践] Pinterest 基于 Ray 的机器学习数据处理

俞凡

人工智能 大厂实践

Java 开发者必备工具清单:提升效率的 10 款神器

飞算JavaAI开发助手

【限时福利】参与炫技赛,免费解锁AI工具高级版!速领→

飞算JavaAI开发助手

AI 时代必备技能:如何巧用大模型实现工作效率与质量的双重飞跃?

Techinsight

流程自动化 #大模型 RPA Agent Agent智能体

大模型叙事下的百度智能云:比创新更重要的,是创新的扩散

Alter

SvelteKit 最新中文文档教程(1)—— 入门指南

冴羽

vue.js 前端 React Svelte SvelteKit

【技术实战】会员商城任务成就系统:从需求分析到代码实现的完整指南

飞算JavaAI开发助手

ETL与ELT核心技术解析:如何选择最优数据集成方案

RestCloud

数字化转型 ETL ELT 数据集成工具

.NET Core 中如何实现缓存的预热?

不在线第一只蜗牛

.net spring 缓存

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章