• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ericgui
V2EX  ›  程序员

请教分布式爬虫的思路

  •  
  •   ericgui · Oct 21, 2017 · 4001 views
    This topic created in 3156 days ago, the information mentioned may be changed or developed.

    分布式爬虫是要共享一个 URL 池的么?

    多台服务器的话,可以分布在全世界么?比如各地都买 vps

    目前一般用什么语言写分布式爬虫? PHP 能行么(一直都用 php 爬的,但都是小爬虫)?谢谢

    有没有一个综合性的思路,谢谢

    6 replies    2017-10-23 09:42:17 +08:00
    yrj
        1
    yrj  
       Oct 21, 2017 via iPad
    参考 pyspider
    t1518968889
        2
    t1518968889  
       Oct 21, 2017 via Android
    puppeteer
    xielemon
        3
    xielemon  
       Oct 21, 2017
    scrapy-redis
    hcnhcn012
        4
    hcnhcn012  
       Oct 22, 2017 via iPhone
    scrapy-redis +1
    SlipStupig
        5
    SlipStupig  
       Oct 23, 2017
    scrapy+etcd
    rainnus
        6
    rainnus  
       Oct 23, 2017
    scrapy-redis + 2
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1240 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 17:46 · PVG 01:46 · LAX 10:46 · JFK 13:46
    ♥ Do have faith in what you're doing.