有一个 html 文件,为了提取文件里的某些内容,我一般是利用正则表达式,但这样做太累了,提取不同的内容要写很多正则表达式。我想把 html 文件解析成 dom 树,这样就方便提取任意元素的内容了。不知道 php 有没有方便的途径实现这样的功能?
1
yangqi Jun 7, 2018
直接用 DOMDocument 啊
|
2
SoulGem Jun 7, 2018 via iPhone
|
4
Herobs Jun 8, 2018 via Android
xpath 了解一下
|
5
anewg Jun 8, 2018
symfony 的 DomCrawler 组件,总之别用正则。。。
|
6
jingrui Jun 8, 2018 via iPhone
phpquery 了解下
|
7
zarte Jun 8, 2018
xpath,chrome 右键就可以得到公式,你应该是弄爬虫吧,注意下 js 渲染的网页你也要渲染下再提取,要不然复制出来的公式会取不到东西。
|
10
han8gui Jun 8, 2018
phpquery 啊,或者有个开源工具 querylist
python 建议使用 xpath |