收录了 排列顺序 频道下的 50 篇内容
本文介绍MySQL索引。
提高沟通或汇报水平速成的方法论。
本文介绍 APP 启动时 PageFault 的性能分析以及静态库插桩重排方案的技术原理。
在Santa Clara举行的Velocity 2013上,Google的Brett Slatkin介绍了一种视觉回归测试方法——Perceptual Diff,它将新发布Web页面的截图与之前版本进行对比,而且能够检测并剔除像素层面的微小变更,从而填补了自动化测试在持续部署方面的重要空白。该软件在GitHub上发布了一份开源版本。
越来越多的JavaScript替代方案可供开发人员选择。
微信订阅号这次真的要迎来智能排序了,不过微信管它叫“阅读效率优化”。
本文介绍搜索引擎中的 web 数据挖掘。
**编者按**:本文节选自方巍著《Python数据挖掘与机器学习实战》一书中的部分章节。
Max Grigorev最近写了一篇文章,题目是《What every software engineer should know about search》,这篇文章里指出了现在一些软件工程师的问题,他们认为开发一个搜索引擎功能就是搭建一个ElasticSearch集群,而没有深究背后的技术,以及技术发展趋势。Max认为,除了搜索引擎自身的搜索问题解决、人类使用方式等之外,也需要解决索引、分词、权限控制、国际化等等的技术点,看了他的文章,勾起了我多年前的想法。 很多年前,我曾经想过自己实现一个搜索引擎,作为自己的研究生论文课题,后来琢磨半天没有想出新的技术突破点(相较于已发表的文章),所以切换到了大数据相关的技术点。当时没有写出来,心中有点小遗憾,毕竟凭借搜索引擎崛起的谷歌是我内心渴望的公司。今天我就想结合自己的一些积累,聊聊作为一名软件工程师,您需要了解的搜索引擎知识。
相比人类,大多数的神经网络完全无法适应感官的替换。
从数组的类型、值的表示和构造、常见的操作等几个方面去详细地了解一下数组这种容器。
本文将主要介绍排序 (Sort) 和聚合 (Aggregate) 的实现。为什么要把这两个算子放在一起说呢?因为它们之间有很多的共同点,比如都是 Blocking 的算子,即需要得到所有的输入 tuple,才能完成计算后输出,这就使得它们会遇到同样的困难。
极客邦科技联合百家企业共同发起“抗击疫情企业联合行动”,向社会各界提供公益支持。
本文展示笔者写代码的思维。
本文希望能为读者理清Amazon Redshift表设计的一些基本原则,分享一些最佳实践,让读者能最大限度地发挥Amazon Redshift的潜力
在Amazon SageMaker上以管道模式使用Horovod的多GPU或分布式训练方法,能够为数据集的各个分片创建独立的训练通道并在数据通道内访问对应分片,借此实现大规模模型训练。这种方式能够缩短在实际训练开始之前将数据集传输至训练实例所占用的时间,因此特别适用于具有大规模训练数据集的Amazon SageMaker训练场景。
本文将介绍多模态召回比赛亚军的技术方案,以及在美团搜索业务中的应用与实践,希望能给从事相关工作的同学带来一些帮助或者启发。
在这篇文章中,Hugo Messer分享了分布式团队面临的五大挑战以及一些可行的解决方法。这些基于他的六本书、许多演讲和十几年的实践经验。五大挑战是:1、我们区分“我们”与“他们”;2、让团队处于一无所知的状态;3、文化是一个谜;4、我们停止沟通;5、黑匣子。
由于微处理器的速度如此之快,计算机架构设计已经发展到需要在计算单元和主存储器之间添加各种级别的高速缓存,以掩盖将 bit 带入“大脑”的延迟。但是,这里有个关键见解是,这些高速缓存在 CPU 之间是部分共享的,这意味着不可能对共同托管的容器实现完美的性能隔离。
写了多年的 Java 程序,即使在转投 Node 之后,仍然对 Spring 框架的 IoC 、Declarative XXX 记忆犹新,于是在 Node 项目中要用到缓存时,自然地想起了 Declarative caching,就有了山寨一把的想法。