写点什么

在社交网络上刷粉刷量,技术上是如何实现的?

  • 2019-04-24
  • 本文字数:2728 字

    阅读完需:约 9 分钟

在社交网络上刷粉刷量,技术上是如何实现的?

有时候你看到高转发的微博,超多 10W+的文章,超高的粉丝关注,但好像留言互动却少的可怜。本文带你看看技术内的灰色产业。


我们都知道很多社交网络可以刷粉,也可以刷阅读量。所以,我们经常会看到很多记者报道过这样的灰色产业链的新闻。


你也许很好奇,这些技术都是怎么实现的?



在这个流程里,需要有下面三个准备:


1、多个手机号


尽管早期注册只需要邮箱就可以,但现在账号注册都是需要绑定手机号的,所以手机号是必备的。


2、多个 IP


因为很多社交网站都会有反垃圾的措施。共用同一个 IP,一定会被封号。


3、模拟操作


因为我们的需求是个性化的。所以在这一步,可以封装出一些基本的操作,比如关注、发布动态、转发、阅读文章等。

那么多手机号从哪弄?

于是问题来了,从哪里弄这么多手机号?比如说 1 万个!

虚拟手机号:被歧视的号码段

我首先想到了虚拟手机号,因为虚拟卡号不限数量,其他号码段都需要绑定身份证。不过虚拟卡号有个最大的问题,就是“会被歧视”。在社交网络里,虚拟手机号注册的账号被封的概率远超其他账号,比如说以“170”开头的手机号。

阿里小号:一个看似可行的解决方案

既然虚拟手机号容易被封,那怎样才能找到既不会被封,还便宜的号码呢?阿里小号是个选择。阿里小号的价格比较亲民,5 元/月。可以自己选择号码段,这些号码段很多都不是 170 号码段的。但是阿里小号有个问题,就是需要用身份证来绑定。

国外号码,贵但价值明显

那有没有既不会被封,又不用绑定身份证的办法呢?国外的手机号是可以的,但最大的问题就是贵,差不多 5 美金一个月,相当于一个账号就要 35 元。


我调查了一下,其实国外也有类似的刷量刷粉的操作,比如刷 Facebook、twiter、Youtube 等。这些网站刷粉、刷量的收费更高,所以相比之下,手机号带来的成本其实不算什么。


一般的做法都是先从高价值的网站开始刷,最后剩余的再刷国内的 APP,有任务的话,7X24 小时从不间断。


这些号码各有特点,根据实际情况,不同人手里用到的号码是不同的。我总结了一下。



如何自动切换 IP?

在解决多个手机号的情况后,那下个问题就来了,如何自动切换 IP 呢?这是一个自动化运营绕不开的问题。


有三种方式可以选择。


  1. IP 代理;

  2. 飞行模式;

  3. 小区宽带。

IP 代理:所有人都能想到,但并不靠谱的方案

IP 代理应该是很多人首先想到的解决方案,因为在编写 Python 爬虫的时候,是可以使用代理机制的。网上就有很多做 IP 代理的。但这里有两个认知,你需要注意:


  1. IP 代理没有你想得那么便宜。以不重复的 100 万 IP 为例,单日价格在 2700 元,相当于 1 万 IP=27 元。所以你会有这样一个疑惑:那些刷网站流量的,1 万流量只需要几元的是怎么做到的?

  2. 免费 IP 比你想象得要好用。实际上,有很多免费 IP 代理可以使用,它们主要的问题在于数量比较少。


所以在量少的情况下,IP 代理是可以使用的。在量大的情况下,IP 代理就没那么好用了,因为成本太高,并不是一个靠谱的方案。

飞行模式,一个让人飞起来的 idea!

当你发现,购买 IP 代理的价格比淘宝上售卖流量的还要贵的时候,你就知道他们用的根本不是 IP 代理。换个思维,有没有免费的 IP 呢?这里我想到了手机的飞行模式,它和路由器断开重连一样完美!


这是为什么呢?


当我们的手机采用飞行模式后再关闭,你会发现手机的 IP 发生了变化。同样,当你断开路由器后,再进行重连,IP 也自动发生了变化。这个就是我们想要的动态 IP!

WIFI 和 MIFI

那么问题来了,怎样写程序来控制手机呢?这里你可以使用 MIFI 设备,MIFI 其实就是 Mobile WIFI 的意思。MIFI 设备最大的好处,就是脱离了手机,你不需要一台手机,而只需要一台 MIFI 设备和一张 SIM 卡。


MIFI 设备集成了路由器和调制解调器的功能,使用的流量还是 SIM 卡的流量。所以当我们断开 MIFI 设备重连的时候,就相当于自动换了 IP。当然,这个过程需要定制 MIFI 设备,也就是多一个网线接口,把数据传输出来,这样就可以自动进行控制了。

MIFI 可能存在的问题

MIFI 可以说是个很方便的解决方案,但是依然存在一个问题,就是当流量大的时候,手机的流量费是很高的。那这样的话,就不能采用 MIFI 的方式了,可以考虑使用小区宽带。小区宽带最大的好处,就是不限流量。


当然除了控制 MIFI 设备外,还需要控制交换器,才能做到自动切换 IP。所以在流量较小的情况下,MIFI 是个好的解决方案。流量大的情况,比如要访问视频,小区宽带是更好的方案。


在自由切换 IP 这个部分,我整理了以下的 3 种方案,一般来说手机飞行适合轻度的并发访问,而重度的流量访问方式还需要采用小区宽带的方案。


如何模拟操作,是一个技术活

模拟操作,就是文章开头中,我提到的流程中的最后一步。


所有的流程,如果想要实现机器自动化,就需要一个利器。这里 Python 最适合不过。那么该怎么做呢?


首先这里需要用到 Python 的几个工具。在做自动化运营的过程中,会经常使用这些工具,我简单给你介绍下:


Selenium:用于 Web 测试的工具,支持多种浏览器和自动化测试。


lxml:网页解析利器,支持 HTML、XML、XPath 解析,而且解析效率很高。


Scrapy:强大的爬虫框架,提升开发效率。


Phantomjs:基于 webkit 的无头浏览器,无头就是没有 UI 界面的意思。同时 Phantomjs 提供了 JavaScript API 接口,可以直接与 Webkit 内容交互。通过它,你可以完成无界面的自动化测试、网页截屏等。通过网页截屏,就可以帮水军做结案报告。



通过以上的工具,我们就可以达到实时抓取,实时刷量的目的。当然这些工具只是表象,更重要的是模块化的思维。也就是如何使用这些工具,具体都做哪些事。一般来说,我们可以把自动化运营拆解成不同的模块。


下图是我以微信、微博为例,整理的自动化运营所需模块的全景图,这些模块都需要编写相应的代码来实现,从而打造整个社交网络上自动化运营的机器人团队。



虽然这篇文章给你讲了这个灰色地带,但我还是想强调一下,我只想通过这篇文章让你直观地体验数据思维是什么样的以及实现的方式是什么,这样才能更好地帮助你解决工作或者生活中遇到的问题。


作为技术出身的从业人员,我倡导不作恶的理念(Do not be evil)。所以我不建议你去购买这么多的手机号和 MIFI 设备,我希望你把重点放到如何掌握 Python 中数据分析的工具上,以及慢慢培养你的数据化思维。


我是一个数据分析爱好者,总是被各种问题吸引,带着好奇心,脑海中提出各种问题,然后通过思考一步一步进行解决。


所以,我希望你能在实际工作中,和我一样具有数据思维,以及数据分析的解决能力,因此我制作了《数据分析实战45讲》这个专栏。


因为你学了这个专栏,完全可以找一个不错的和数据相关的工作,不论是产品经理,运营人员,还是技术开发人员。


希望你成功。


欢迎订阅,已有 10000 人加入学习,手把手带你入门数据分析!


内容来自:极客时间《数据分析实战45讲》


2019-04-24 17:575881

评论 3 条评论

发布
用户头像
想知道画图工具是啥? 挺好看的
2019-04-25 14:40
回复
XMind
2020-02-22 10:50
回复
用户头像
IBM,悲情的蓝色巨人……
2019-04-25 14:15
回复
没有更多了
发现更多内容

To B产品经理需要哪些能力呢?

博文视点Broadview

来自农村的大学生开发者,用技术改变自己的家乡

华为云开发者联盟

开发者 物联网 IoT 华为云 智慧大棚

基于GES图数据库的大规模数据追溯服务优化

华为云开发者联盟

数据 华为云 图数据库 数据追溯 华为云GES

从根上理解高性能、高并发(七):深入操作系统,一文读懂进程、线程、协程

JackJiang

第五周

Jove

云计算、大数据已经过时?不,正是因为它们RPA才能大流行

王吉伟频道

人工智能 云计算 大数据 RPA 自动化

一文详解什么是可解释AI

华为云开发者联盟

AI mindspore Gradient GradCAM RISE

区块链助力山东文化旅游整体行业解决方案

源中瑞-龙先生

力扣(LeetCode)刷题,简单+中等题(第28期)

不脱发的程序猿

面试 LeetCode 编程之路 28天写作 算法面经

在云中应用自动化的5种方法

浪潮云

云计算

滚动加载的网页只需点 10 下鼠标即可抓取,无编码学爬虫之四

梦想橡皮擦

Python 28天写作 3月日更

可视化表单编辑器

day day up

JVM 分析工具

insight

JVM 3月日更

MySQL异常问题经验贴

华为云开发者联盟

MySQL 数据库 时区 SSL 连接

产品经理如何帮助减少技术债务 ?

禅道项目管理

产品 代码规范 技术债

Linux 多线程详解 —— 线程创建、终止、等待、分离

赖猫

Linux 多线程与高并发 服务器开发 Linux服务器开发 Linux线程

Pgbouncer最佳实践:系列三

PostgreSQLChina

数据库 postgresql 软件 开源社区

Elasticsearch search scroll 游标查询

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

数仓GaussDB(DWS)全量备份总结

华为云开发者联盟

数据安全 GaussDB 备份 Roach 数据备份

Atlassian Data Center 如何优化企业中新员工的远程入职流程

Atlassian

HR Atlassian 远程工作

如何实现在直播中播放音频文件

anyRTC开发者

音视频 WebRTC 直播 RTC 音频

一个100%省力的,让城市管廊运维变得轻松的秘诀

一只数据鲸鱼

物联网 数据可视化 智慧城市 3D可视化 智慧管廊

字节跳动技术总监自爆:Android项目开发如何设计整体架构?建议收藏

欢喜学安卓

android 程序员 面试 移动开发

玩家永远是对的——认知失调

Justin

心理学 28天写作 游戏设计

一文帮你搞懂 Android 文件描述符

vivo互联网技术

android 文件 文件系统

ICDAR2021首届文档图像与自然语言处理研讨会征稿开始

爱极客侠

【万字好文】一文看懂持续部署按需发布!DevOps部署和发布方法大全

京东科技开发者

DevOps SaaS

产品更新 | 阿里云CDN边缘图像处理功能开放内测

阿里云Edge Plus

CDN 边缘计算 图像处理

力扣(LeetCode)刷题,简单+中等题(第29期)

不脱发的程序猿

面试 LeetCode 编程之路 28天写作 算法面经

【LeetCode】比特位计数Java题解

Albert

算法 LeetCode 28天写作

字节跳动Android面试:来一份全面的面试宝典练练手,不吃透都对不起自己

欢喜学安卓

android 程序员 面试 移动开发

  • 扫码加入 InfoQ 开发者交流群
在社交网络上刷粉刷量,技术上是如何实现的?_技术管理_陈旸_InfoQ精选文章