GPU
V2EX  ›  问与答

有什么工具可以文本输出中处理 javascript 获取处理后的页面结果

  •  
  •   GPU · Jun 5, 2014 · 2617 views
    This topic created in 4406 days ago, the information mentioned may be changed or developed.
    有人明白我的意思吗?

    一个页面 他的页面结果是通过javascript 生成的内容 , 然后怎么通过 php 或者 shell 等等方式获取我要的内容 .


    也就是通过各种程序语言 , 抓取到浏览器生成的内容. 输出到txt
    5 replies    2014-06-06 21:29:33 +08:00
    rannnn
        1
    rannnn  
       Jun 5, 2014
    PhantomJS
    imn1
        2
    imn1  
       Jun 5, 2014
    凡是有js引擎的都可以,v8(php有这个),nodejs……
    caomu
        3
    caomu  
       Jun 5, 2014
    除了用js引擎模拟,也可以看看js具体了做什么,比如它是ajax从后端拉来了数据,就模拟请求然后本地解析处理,如果是对当前dom处理输出,就扒了页面html然后本地解析处理。一个想法,不一定对。
    jerray
        4
    jerray  
       Jun 6, 2014
    参见 seleniumhq http://docs.seleniumhq.org/

    实际上这东西就是开个浏览器,给开发者提供了操作浏览器的接口。
    GPU
        5
    GPU  
    OP
       Jun 6, 2014
    @rannnn
    @imn1
    @caomu
    @jerray
    各位谢谢啦 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   896 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 22:35 · PVG 06:35 · LAX 15:35 · JFK 18:35
    ♥ Do have faith in what you're doing.