做 网络爬虫 时,一般对 代理IP 的需求量比较大。因为在爬取网站信息的过程中,很多网站做了反爬虫策略,可能会对每个IP做频次控制。这样我们在爬取网站时就需要很多代理IP。
代理IP的获取,可以从以下几个途径得到:
从免费的网站上获取,质量很低,能用的IP极少
购买收费的代理服务,质量高很多
自己搭建 代理服务器 ,稳定,但需要大量的服务器资源。
本文的代理IP池是通过爬虫事先从多个免费网站上获取代理IP之后,再做检查判断IP是否可用,可用的话就存放到MongoDB中,最后展示到前端的页面上。
694
147
上一篇:重启路由器可以换IP吗