PHPer233
V2EX  ›  PHP

PHP 如何将 html 文件解析成 dom 树?

  •  
  •   PHPer233 · Jun 7, 2018 via iPhone · 3497 views
    This topic created in 2923 days ago, the information mentioned may be changed or developed.
    有一个 html 文件,为了提取文件里的某些内容,我一般是利用正则表达式,但这样做太累了,提取不同的内容要写很多正则表达式。我想把 html 文件解析成 dom 树,这样就方便提取任意元素的内容了。不知道 php 有没有方便的途径实现这样的功能?
    10 replies    2018-06-08 16:20:15 +08:00
    yangqi
        1
    yangqi  
       Jun 7, 2018
    直接用 DOMDocument 啊
    SoulGem
        2
    SoulGem  
       Jun 7, 2018 via iPhone
    PHPer233
        3
    PHPer233  
    OP
       Jun 7, 2018 via iPhone
    @yangqi 感谢提示,我一直没有注意到这个扩展。
    Herobs
        4
    Herobs  
       Jun 8, 2018 via Android
    xpath 了解一下
    anewg
        5
    anewg  
       Jun 8, 2018
    symfony 的 DomCrawler 组件,总之别用正则。。。
    jingrui
        6
    jingrui  
       Jun 8, 2018 via iPhone
    phpquery 了解下
    zarte
        7
    zarte  
       Jun 8, 2018
    xpath,chrome 右键就可以得到公式,你应该是弄爬虫吧,注意下 js 渲染的网页你也要渲染下再提取,要不然复制出来的公式会取不到东西。
    VgV
        8
    VgV  
       Jun 8, 2018
    @zarte 怎么渲染再提取?
    zarte
        9
    zarte  
       Jun 8, 2018   ❤️ 1
    @VgV phantomjs 或者看网页源码手动写公式
    han8gui
        10
    han8gui  
       Jun 8, 2018
    phpquery 啊,或者有个开源工具 querylist

    python 建议使用 xpath
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1625 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 16:24 · PVG 00:24 · LAX 09:24 · JFK 12:24
    ♥ Do have faith in what you're doing.