最近我一个网站被别人扒了,未避免广告嫌疑url就不贴了,不知道有什么有效的方法可以防止爬虫呢?
我想到的几个方法:
1、限制IP访问频率(无效,后台看不到有异常ip访问,我猜想爬虫大约五六分钟来一次)
2、用js动态加载数据内容(无效,爬虫支持js,且网站不利于seo)
3、抛出js异常,部分爬虫会无法解析(仅仅只是部分)
感觉爬虫和正常访问没啥区别,不知道有没有有效防止爬虫的方法
做爬虫的法律风险都有啥?感觉好像不太容易举证,求解答
我想到的几个方法:
1、限制IP访问频率(无效,后台看不到有异常ip访问,我猜想爬虫大约五六分钟来一次)
2、用js动态加载数据内容(无效,爬虫支持js,且网站不利于seo)
3、抛出js异常,部分爬虫会无法解析(仅仅只是部分)
感觉爬虫和正常访问没啥区别,不知道有没有有效防止爬虫的方法
做爬虫的法律风险都有啥?感觉好像不太容易举证,求解答

