百度技术沙龙第44期回顾:大数据面面观

大数据对我们来说已经不再是一个陌生的话题,但它依旧是一个抽象的名词,多大的规模才是大数据?大数据对于技术人员有哪些要求?数据存储、索引等需要哪些技术?各家都有自己的看法,因此Gartner的调查报告才说「Everyone's Doing It, No One Knows Why」。大数据更像是一种场景的统称,不同场景出来的解决方案也是不同的。在这一期的技术沙龙中,我们将会带您从特定的业务场景出发来面面观大数据。

本期讲师介绍

  • 韩哲

    基于大数据的质量应用和产品改进 - 随着大数据基础架构技术的发展,百度也涌现出很多大数据应用。在过去的一年,百度质量部也在数据质量和产品问题决绝方向上引入了很多大数据技术。如今百度 质量部通过大数据技术在LBS POI数据改进、搜索Badcase、用户满意度和情感分析、App Crash分析等领域取得了很大的突破。本次主题通过真实的大数据应用案例讲述大数据技术在质量决策中的技术实现。

  • 谭建龙

    如何高效的保证移动互联网应用的质量 - 从大数据中速度快和平均价值低的角度,介绍大数据分析中数据流的过滤技术及应用,主要介绍大数据流应用背景,大数据流过滤技术和大数据流在网络内容安全中 的应用。大数据流过滤技术介绍中包括多关键词过滤技术,正则表达式匹配技术,基于硬件的数据流过滤设备,基于大数据流计算的网络内容安全平台。


内容回顾

    • @mrkid:大数据通过过滤才更有价值!信工所近期的研究成果多正则表达式引擎解决了这样一个问题,包含大规模精确串匹配,复杂正则表达式匹配,高速硬件匹配等算法硬件方面的优化,为将来更高效地研究大数据(从流式处理方面)奠定了基础。

    • @gameboy120谭老师这是要逆天啊,要充分挖掘单机计算能力,并从算法以及硬件层面进行创新,不愧是研究院的牛人啊。

    • @海饼干er:数据存储的保障,稳定的数据源,同时熟悉算法及大数据原理,好的大数据创意是应用大数据创业的四个要素

    • @弯眼角笑的猫:idea first 对行业深入的理解才能孵化出商业价值,最后依靠大数据的技术工程化。


现场图片展示

  • 获得大奖Cherry键盘
  • 沙龙进行的同时微博大屏幕也不闲着

  • Open space激烈讨论中