2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

神策数据 CEO 桑文锋:精准采集数据,走向智能化分析

  • 2017-02-19
  • 本文字数:1453 字

    阅读完需:约 5 分钟

数据分析类的产品随着企业数据信息化的建设,势必会融合加强,慢慢演变成门户化,更人性化,且可视化技术将成为亮点,和交互式分析形成助推。虽然看起来很遥远,但现在有些数据分析服务已经开始意识到这些,并把数据分析管理进行门户化,拥有更强的模型支持能力,结合不同的应用场景需求,整合了搜索技术,极度简化信息的获取,融合工作流,满足业务流程式的分析需求,支持展现结果的二次分析。

不久前,神策数据 CEO 桑文锋在一次访谈中回顾,他在百度工作了八年,对数据很敏感。最初负责建立百度用户数据仓库基础,从 0 到 1 把各个业务线的数据统一到一起,建成统一的数据仓库,这其中就包括数据的采集、传输、建模、存储、差异分析、数据可视化等环节。通过对产品的性能分析,用数据所呈现的结果来对产品功能做调整和优化,一切都用数据说话。再到后来,自己创业做神策数据过程中,也秉承着“用数据帮助客户做最有价值的分析”的理念。

对于数据业务,简单将其分为三块:数据沉淀、挖掘和可视化,每一块分别对应不同的模式及产品或服务。数据挖掘业务又被细分为分析、理解及存储。桑文锋回忆建立百度用户数据仓库基础的最大心得,那就是对数据源的重视。所以他坚信,神策数据最有价值的分析结果,也离不开对精准数据源的采集。

数据沉淀就是数据采集,其途径有很多种,包括网络爬虫,用 Python 及 Go 等开发爬虫平台来获得信息;Wi-Fi 接入获得用户数据提供一些图像方面的 API,进行图片搜索及人脸搜索等。桑文锋说,神策的产品会记录多种数据源,不同终端(Web、App、H5、桌面软件)的用户行为,后端系统日志(Web server Log),业务数据(DB)等等。同时对前端、后端、第三方数据库、业务数据等全面采集,来保证数据源的准确和全面性,更好的进行数据分析,给业务带来新的增长价值。

基于上面所采集到的数据做统计分析、用户及品牌理解、用户画像等等,在分析能力上,支持多维事件分析、漏斗分析、留存分析、用户分群、行为轨迹分析和回访分析,不同分析模型帮助揭示数据背后的含义,了解产品的性能和优化方向。

为了将数据利用到极致,给客户带来更大的价值,神策数据在产品功能上下了很多功夫,具体概括为三大特点:

  1. 第一个特点就是提供私有化部署,将分析能力嵌入到客户的业务环境里,不去接触客户的数据,在一定程度上保证了客户的数据安全,而且对于金融领域的客户,这一点非常重要。
  2. 其次就是全端数据接入,随着数据分析越来越深入,越来越精细化,尤其是 O2O、金融类等客户,要考虑线上线下的数据结合,这样才能提供精准的分析。通过提供可视化埋点,SDK、工具导入等方式,帮助客户全方位细致的解决数据痛点。
  3. 最后一个特点是PaaS+SaaS 平台的结合。行业不同,需求各异,所以分析服务也要因人而异。PaaS 平台将底层数据和查询接口开放给客户,在此基础上进行二次开发,满足客户独有的分析需求和系统。

在商业化道路上,桑文锋坦诚的说这不是一个新市场,和同行不一样的地方的在于,神策数据提供灵活多维度交叉分析,任意维度进行交叉分析等精细化功能。在未来神策数据也将朝着产品智能化的方向前进。

我的原则和价值观

后来,桑文锋提到了在给客户提供服务之后,如果客户后期因为各种原因而没有坚持用完,神策数据也会主动将费用退还。宗旨就是希望神策数据的数据分析能力可以给客户带来价值,给双方带来价值。

有人问桑文锋,最在意的是什么?他说,最在意客户的满意度以及 NPS。其实他所在意的这些完全取决于产品的质量。只有质量过关,才能取得客户的信任,客户才会把神策数据推荐给其他用户,从而建立更广泛的合作。

2017-02-19 04:331556

评论

发布
暂无评论
发现更多内容

本地盘的价格,云磁盘的弹性:百度智能云弹性临时盘来了

Baidu AICLOUD

块存储 #云存储 云磁盘

压缩指针:64位系统下,Java虚拟机是如何“偷”回4字节内存的?

poemyang

Java虚拟机 java对象

PDF/epub一键转思维导图,AI帮你10分钟搞定全书精华

阿星AI工作室

产品 AI 工具 电子书

ESP32 + MCP over MQTT:从 0 到 1 打造情感陪伴智能体之「硬件设备能力封装」

EMQ映云科技

OpenRouter vs. SightAI:统一入口,还是统一“智能体验”?

SightAI

大模型 API 开发者体验 api Token

运维服务方案,运维管理办法

金陵老街

运维

ESP32 + MCP over MQTT:通过大模型控制智能硬件设备

EMQ映云科技

OpenTiny HUICharts——RankProcessChart 排名进度图上手指南

OpenTiny社区

开源 前端 图表库 OpenTiny

大数据-137 ClickHouse MergeTree 实战指南|分区、稀疏索引与合并机制 存储结构 一级索引 跳数索引

武子康

nosql 大数据 flink 分布式 Clickhouse

C#/.NET/.NET Core技术前沿周刊 | 第 59 期(2025年10.20-10.26)

追逐时光者

C# .net

解决 Nginx 路径前缀问题:从 /serviceA 到 /special/serviceA 的平滑迁移

玄兴梦影

nginx 代理 nginx反向代理 Nginx 代理

大会回顾:不止于 “智能”!详解Data+AI 如何赋能企业决策与效率升级

袋鼠云数栈

数据治理 发布会 Data + AI 袋鼠云 数据筑基

企业选择IM即时通讯软件,为何更注重私有化部署?

BeeWorks

即时通讯 IM 私有化部署

怎样通过Abaqus代理商思茂信息采购软件?-Abaqus采购流程

思茂信息

仿真 几何图形 abaqus

告别数据无序:得物数据研发与管理平台的破局之路

得物技术

技术实践:在基于 RISC-V 的 ESP32 上运行 MQTT over QUIC

EMQ映云科技

单图高精度6D位姿估计方法开源,让机器人“一眼看懂”陌生物体

智源研究院

橱窗用LED显示屏,店铺“亮”起来

Dylan

品牌 LED LED display LED显示屏 LED屏幕

告别“信息孤岛”,BeeWorks 如何为制造业数智化转型搭好“底座”?

BeeWorks

即时通讯 IM 私有化部署

GPT-4o 新增说话人分割模型 Transcribe-Diarize;巨人网络开源方言模型 DiaMoE-TTS 丨日报

声网

第五届新能源与电力工程国际学术会议(ICNEPE 2025)

搞科研的小刘

新能源 国际学术会议 电力工程

AWS CloudTrail 可观测最佳实践

观测云

aws cloudtrail

传帮带 人才梯队建设经验总结(15)

万里无云万里天

人才培养 工业 工厂运维

C#线性查找算法

追逐时光者

C#

跨区域协同,破局AI落地痛点!「AI共创 三生万物」司马阅2025企业AI落地应用峰会苏州站完美收官

司马阅

AI赋能“一带一路”:司马阅入选《“一带一路”人工智能应用场景案例集(2025)》

司马阅

不仅仅是代码助手:用 Plugins 将 Claude Code 打造成你的专属工具链 - 概念篇(1/4)

Robin Min

LLM plugins vibe coding Claude-Code Coding Agent

哈尔滨 2025 等保测评实操:流程规范与企业核心应对策略

等保测评

2025 哈尔滨等保测评指南:标准调整与落地执行方向

等保测评

2025年人工智能与可持续发展国际学术会议

搞科研的小刘

人工智能 上海 可持续发展 国际学术会议

神策数据CEO桑文锋:精准采集数据,走向智能化分析_语言 & 开发_Lucien_InfoQ精选文章