2012.3.13 微博热报:Google 搜索算法例会;Redis V.S. Memcached;HBase Coprocessor 前世今生

  • 金鑫

2012 年 3 月 13 日

话题:Google语言 & 开发架构文化 & 方法

Google 搜索算法讨论例会如何开

@36 氪发布了一条含有视频链接的微博:

Google 搜索算法讨论例会,一窥大牛们怎样聚在一起解决问题 | Google 的搜索首页看起来很简洁干净,但要完成海量内容的瞬时搜索,后面需要极其复杂的搜索算法支撑。近日 Google 发布一则每周搜索算法讨论例会的视频,让我们有机会掀开神秘面纱的一角。 http://t.cn/zOIhb3W by @AbnerTsang

KIIS_FM的评论是:

作为一直强调创新的谷歌,该办公室的魅力就在于思路可以最有效率地碰撞,可以作为“改变世界的力量”的讨论参考模式。

Google 谷歌(注:这是非官方账号)的评论是:

在视频中,Google 工程师对搜索产品可能的改进进行讨论并做出决定。他们讨论的是一个看似很小的问题,即在超过十个条件的搜索查询中如何进行拼写检查。但结果证明,即使是很小的变化也会给系统带来无数的问题。

邓侃的评论是:

老实说,感觉参与会议的人数太多。人太多,会议就没效率了。最有效率的会议应该多少人参加?这个问题说不清。个人体会,3 个人讨论最有创意,10 人左右比较全面,5 人左右比较均衡。

i 土豆小王子的评论是:

我之前 intern 的小公司,老板是做 energy 专业的,他说不要看你在 google 搜索只点击那么一下,就那么一下,几十毫秒的搜索,所耗费的能量,足够煮开一杯茶。。。。。搜索背后的人力物力智力动力,根本不是 google 首页看起来的那么简单。

萍踪遐想回复@i 土豆小王子

Google 一个月的搜索量是近 120 亿,一天 4 亿,假设一杯水 250 克,室温 20 度,每天能耗是 8000 亿卡的热量,你信么?

i 土豆小王子回复@萍踪遐想

查到一个文章是说有人指责 google 太耗能,a typical search uses "half the energy as boiling a kettle of water" and produces 7 grams of CO2. 然后 google 反驳说不可能,说了一大堆,基本结论是困难的搜索耗能较多,但平均下来,一个搜索耗能 1000 焦,0.2 克 CO2。1000 焦貌似很少

新东方创始人@徐小平的评论是:

这种场景令人肃然起敬——他们的工作,提高了全人类获取知识与信息的水平,提升了人类文明程度。中国何时出现类似能影响世界的奉献?

Redis V.S. Memcached

@nosqlfan一条微博引发大家关注:

这两年 Redis 火得可以,Redis 也常常被当作 Memcached 的挑战者被提到桌面上来。关于 Redis 与 Memcached 的比较更是比比皆是。然而,#Redis# 真的在功能、性能以及内存使用效率上都超越了 #Memcached# 吗?看看 Redis 作者怎么说 http://t.cn/zOfdbDm

哥哥本善良认为:

后起之秀本身就会在很多方面占据优势,业务场景决定系统选择,简单的 KV 缓存 memcached 足以应付

RogerXia

很多时候选择一种技术是因为他在解决某一个问题时比其他技术更适合我们,而不是他们谁的功能多,性能高。redis 数据结构丰富,支持数据持久化和同步

HDiVi认为:

不同应用场景的时候,不好评价! 各有个的好处

戴书文提到:

性能和业务支持应该是两方面的,看实际需要取舍

SE7V7EN认为:

redis 的 hash 确实不错

upup006指出:

能用的优化招术大家都用,性能上差的肯定不多,剩下的就是拼体验了。

马明歌说:

Redis 对复杂数据结构的支持、持久化功能比 memcached 强悍多了。Redis 是向快速 No-SQL 方向发展的。

HBase coprocessor 前世今生

@nosqlfan 发布的另一条关于 HBase Coprocessor 的微博也值得注意:

HBase Coprocessor 的分析 - 本文来自于淘宝@庄庄 2049 ,他在淘宝从事 Hadoop 及 HBase 相关的应用和优化。对 Hadoop、HBase 都有深入的了解,本文就是他对 #HBase Coprocessor# 的一些分析,分享给大家 http://t.cn/zOfuORX

大数据技术摘录的是:

hbase coprocessor 的实现分为 observer 与 endpoint。observer 可以实现权限管理、优先级设置、监控、ddl 控制、二级索引等功能,而 endpoint 可以实现 min、max、avg、sum 等功能。

_ 微博卢的评论是:

这是 nosql 在向 sql 招手吗?

今日微博推荐

庄庄 2049

推荐理由:工作于淘宝的海量数据处理方面大牛,关注互联网后端技术、分布式系统、hadoop 生态圈,也思考互联网产品,做过数据仓库 / 运维 / 数据库 / 海量数据同步,目前关注在线存储产品,关注 HBase 一年。他的博客地址是:http://walkoven.com/


欢迎读者关注 @InfoQ,推荐热门话题,可私信 @InfoQ,同时请您说明推荐理由。

Google语言 & 开发架构文化 & 方法