陆丹峰:数学常被用来解释数据之间的关系

  • 包研

2014 年 6 月 24 日

话题:数据库DevOps大数据语言 & 开发架构AI

大数据竞争,已经从海量数据获取与存储、入门级的分布式统计演变为实时流式数据处理以及深度数据挖掘。数据收集、存储、分析与可视化完成了大数据价值链的闭环。毫无疑问数据分析与可视化是大数据价值链上的重要一环。

ArchSummit 全球架构师峰会前夕,InfoQ 采访了 BestMinr 的 CEO 与联合创始人陆丹峰。他评价自己学数学 7 年,仍只得皮毛;长期致力于架构、算法、大数据、复杂问题的数学解决方案研究。陆丹峰同时是“大数据,光大是不行的”专题出品人。以下为采访全文:

InfoQ:陆丹峰你好,向 InfoQ 的读者和 ArchSummit 的听众介绍下自己吧。

陆丹峰:大家好,我是陆丹峰。我现在在经营自己的创业公司百思科技(BestMinr.com),我有一帮神奇的小伙伴,现在工作和生活都非常满意。

InfoQ:你在本科和研究生都在北大数学专业,数学是你的特长吗?你是什么时候发现自己在数学方面的优势?这种感觉是不是对数学的研究让你对生活、工作和对事物的判断有什么影响?

陆丹峰:如果说数学也是一种特长的话,勉强算是吧。(有数学特长生一说么?=.=)什么时候发现的很难说,只是我从小我爷爷就没事给我出各种算术题,比如有一次他问我八千八百加八千八百是多少,我想了想回答 16 千 16 百。当时忘记是几岁了,总之没有学过进位,于是自己想办法把这数分解了再加。

所学到的这些入门级数据知识,让我在思考和看问题的时候能更好的建模吧。

InfoQ:从 AdMaster 到 BestMinr,你更喜欢哪一个自己?

陆丹峰:我喜欢永远在路上的自己。好像回答的有点高大上哈哈。其实是这样的,我很喜欢现在的状态,我们的投资人很好,我们的团队也很给力,我们按照自己喜欢的方式和节奏做大家都认可的事情,没有比这个更好的事情了。

InfoQ:数据可以帮助我们更准确的描述和了解这个世界,而数学可以让数据更精准,是这样吗?这也是你现在的工作吧?

陆丹峰:前半句对的,后半句这样说比较合适:数学常被用来解释数据之间的关系,或者用来生成新的数据。目前我们的大部分工作是围绕这个主题来展开的。

InfoQ:在 BestMinr,你们遇到了哪些技术难点?是怎么解决的?是底层基础设施的难度大,还是数据挖掘、分析算法难度大?

陆丹峰:我们现在遇到的技术难点还是在语义分析层面的,这个算是业界的难点了。我们目前采用一些取巧或者局部可行的方案,同时时刻关注了业界的进展。

目前对我们来说,数据挖掘和分析算法的难度要大于基础设施这块的难度。

InfoQ:你们怎么处理数据安全与用户隐私?

陆丹峰:数据隐私是玩数据的人永远要面对的事情。我们会尽量想办法保护用户隐私,实际上我们采集和处理的数据都是公开数据,大家都可以看到。另外我们提供的产品和服务会尽量考虑从统计层面出发,尽量避免提及个体信息。

此专题详细信息,请见专题页面。关于此次 ArchSummit 全球架构师峰会其他专题的详细信息,请移步至大会官网

6 月 30 日前报名参加可享受 9 折优惠。团体购票(5 人及以上)将享有更多优惠。详请咨询 arch【at】cn.infoq.com,或直接致电 010-89880682。报名请点击报名页面

数据库DevOps大数据语言 & 开发架构AI