聚合网站,有很多来自与站外的图片链接,我既不想保存,但是又不想有出站链接。
有没有办法将图片全部变成本站链接,但是又不保存图片呢?
代码正则替换呢?还是js层面替换?爬虫会检测到?
求思路,求指点。
有没有办法将图片全部变成本站链接,但是又不保存图片呢?
代码正则替换呢?还是js层面替换?爬虫会检测到?
求思路,求指点。
1
zorceta Jun 19, 2013 example.com/go/{base64encoded}
|
2
lichao Jun 19, 2013
爬虫无视 js,1 楼方法可以
|
3
takwai Jun 19, 2013
代码里面替换似乎好一些,不过得加一层代理,替换过的链接经代理读回远程的图片数据再返回给客户端?
|
4
cloudzen Jun 19, 2013
这样做的目的是什么呢?
|
5
takwai Jun 19, 2013
额,不对,犯傻了,代理不需要。
就如一楼说的那方法,解码得出真实地址后,直接在代码里面来一句 Redirect 到真实地址就好了。 |
6
kaifazhe Jun 19, 2013
图片都转base64,html不是会变的超级臃肿,爬虫更不会喜欢
|
7
orzcc Jun 20, 2013
图片地址加密赋值给img的某一个属性xx(非src),用lazy load的原理将xx值解密,然后赋值给src。
|