因个人兴趣需要,经常要采集一些数据做分析,为了提高采集效率经常要用到代理。国内的 IP 代理池可用性不高,要自己请求 IP,处理重试,如果碰到需要 JS 渲染才能采集的数据,还得自己上 Headless 浏览器,不是很方便。
国外 scrapingbee 和 scraperAPI 这种服务挺好,但是费用太高,访问国内网站速度也不快。于是干脆就自己参考 scrapingbee 搭建了智能代理服务:五号代理
主要功能特点
- 每次请求自动切换 IP
- 每次动态切换 User-Agent
- 自动重试
- 支持 JS 渲染
基本上可以直接绕过绝大部分的反爬策略。当然价格也比国外的服务便宜,注册就有免费额度,欢迎大家试用。
有问题和意见可以直接或提工单反馈给我。再次感谢。