libasten
V2EX  ›  问与答

求助,个人博客被像素级克隆了,怎么办?

  •  
  •   libasten · Feb 18, 2020 · 4168 views
    This topic created in 2302 days ago, the information mentioned may be changed or developed.

    这么多年还是第一次看到。 我刚才打开百度统计的后台看,有异常,来源那边很多都是一个网站过来的,我起初还是以为是哪个网友用我之前做的那个主题的原因呢,因为我的那个主题有加友链到我站点。 打开一看,震惊了,以为我眼花了,一模一样一个站点...... 话说我的博客也没有什么亮点,百度指数啥的也不高,不知道怎么被看上了。 估计是哪位站长用软件自动克隆的吧,我想在服务器上禁止了那个域名的 ip,可是查了一下,他这个域名还用了 cloudflare 的 cdn,这也就说,我这暂时还不能知道他的 ip ? 针对这种情况,怎么办呢?

    Supplement 1  ·  Feb 18, 2020
    虚惊一场,刚才看了一下,网站没有被整体克隆走,只是这个哥么域名解析到我的 ip 上了。
    话说现在用的腾讯云的主机,能换 ip 吗?
    在网上搜一个方法,nginx 里面配置里面禁止 ip 访问后,没问题了,不过我看那个恶意域名又跳转到另外一个网友的博客上去, 这个就真奇怪了。
    我在腾讯云主机的 ip 应该是独立的吧?这个机器上只挂了我一个人的博客,现在我刚在我这边禁止了域名访问网站后,那个域名马上又指向另外一个博客了,这个应该 cf 的问题吧,域名无法访问了,随意返回一个网站给用户看?
    我看上面有 Cloudflare 一段话:

    This page ( http://ncbqh.top/) is currently offline. However, because the site uses Cloudflare's Always Online™ technology you can continue to surf a snapshot of the site. We will keep checking in the background and, as soon as the site comes back, you will automatically be served the live version. Always Online™ is powered by Cloudflare | Hide this Alert
    25 replies    2020-02-20 19:31:58 +08:00
    Whsiqi
        1
    Whsiqi  
       Feb 18, 2020 via Android
    引用一个回复:维权成本极大
    另一个回复:针对性放一些不合法内容,然后举报之
    opengps
        2
    opengps  
       Feb 18, 2020 via Android
    他可能是动态爬虫,你可以从你服务器上调出来他服务端 ip,然后封锁 ip
    ThirdFlame
        3
    ThirdFlame  
       Feb 18, 2020
    是不是应该弄个人眼不可见的连接。 让机器人去点, 不就知道 iP 了
    cxh116
        4
    cxh116  
       Feb 18, 2020 via Android
    也许只是反代挂域名而已。
    Ericcccccccc
        5
    Ericcccccccc  
       Feb 18, 2020
    1 楼做法是可行的, 放不合法的内容然后上工信部举报它
    leavic
        6
    leavic  
       Feb 18, 2020
    基本上就是反代了估计,解决方法,参考 github 当年被 D 的做法,插一段 js 弹窗,检测域名后跳转回你的域名。
    tyzrj766
        7
    tyzrj766  
       Feb 18, 2020
    我的小博客被菠菜站镜像过,有源 IP 不知道哪家的,毕竟一个机房的 IP 不知道谁家再用,CDN 和 nginx 屏蔽完全没效果,无解了= =
    bgm004
        8
    bgm004  
       Feb 18, 2020 via Android
    我也发现我友链里有 2 个人的博客被克隆了。。自己的就没办法找
    alect
        9
    alect  
       Feb 18, 2020
    如果是用的反代,那访问假网站的时候会向原始网站请求数据,
    你在自己网站上放一个大文件。然后去访问假网站的这个链接,
    本机检测这时哪个 IP 的流量瞬间变大,把对方整个儿 IP 段封了。
    实时流量查看工具我比较常用的是 iftop,你一直开着监测就行。
    vzev
        10
    vzev  
       Feb 18, 2020
    你的博客基本都是原创内容,稍微优化一下就能有关键词排名,流量上去了就有收益。
    之前我的站就被复制并超越......
    mikulch
        11
    mikulch  
       Feb 18, 2020 via iPhone
    @vzev 被超越,听起来好悲剧
    dototototo
        12
    dototototo  
       Feb 18, 2020 via Android
    来个 reffer 判断?直接来自该网站的请求全部 ban 了。
    keepeye
        13
    keepeye  
       Feb 18, 2020
    是不是别人的域名解析到你的服务器上了,而你服务器没有禁止非绑定域名访问?
    ntdll
        14
    ntdll  
       Feb 18, 2020
    你也上 cloudflare,并且 cf 支持双向 SSL 认证,开启并配置此功能,就可以确保只有 CF 的 CDN 才可以访问你的原站。
    libasten
        15
    libasten  
    OP
       Feb 18, 2020
    @leavic 在页面加载时候判断当前域名,如果是哪个山寨的,就执行 location 到我自己的?这个前提是他也把我的这段 js 也复制过吧?
    libasten
        16
    libasten  
    OP
       Feb 18, 2020
    @tyzrj766
    @Track13
    等于说无解了?
    different
        17
    different  
       Feb 18, 2020
    @gam2046 那我郁闷了,难道我正常访问和反向代理或者其他方式爬你网站的话,不也是通过也是经过 cf 的 cdn 嘛?
    different
        18
    different  
       Feb 18, 2020
    如果是被反代了,就动态弄一个些 js (防止被有针对的过滤掉),判断是否为当前域名,然后跳回你网站即可。如果是被爬虫爬了,弄一些反爬虫机制,感觉方法也是有的。
    different
        19
    different  
       Feb 18, 2020
    @different “当前域名”,改为“你的域名”
    ntdll
        20
    ntdll  
       Feb 18, 2020
    @different #17 是这样的。双向认证确保流量一定要经过 CF,而不能直接访问源站,因为源站双向 SSL 认证不通过,不会返回内容。

    如果你的网站本身访问量不大,可以尝试在 CF 中开启 under attack 或者限制客户端请求频率,应该 CF 可以帮你把一些疑似请求给过滤掉。限制请求频率后,如果对方是简单的反向代理,那么其访问你的服务器 IP 是单一的。但正常用户,IP 是完全不同的。

    另外可以在你的网站上,返回内容时,通过 js 动态获取,而不是服务端渲染,获取内容时,接入 recaptcha,v3 版本的可以对用户无打扰,这个可以帮助你抵御爬虫。recaptcha 通过 .net 域名可以直接在国内使用。

    最后通过 JavaScript 判断一下域名,可以一定程度上阻止对方的无脑反向代理。
    different
        21
    different  
       Feb 18, 2020
    @gam2046 感谢!
    libasten
        22
    libasten  
    OP
       Feb 18, 2020
    @gam2046 js 返回网站数据,对 seo 不友好吧?
    ntdll
        23
    ntdll  
       Feb 18, 2020
    @libasten #22 如果担心 SEO,可以尝试对 Google Spider 做单独处理,由服务端渲染,同时为了防止别人伪造成 Google Spider,别忘了检查 Spider 的真实性。

    https://support.google.com/webmasters/answer/80553?hl=en

    其他搜索引擎的话,可以查阅相关方面提供的文档,如何检查请求确实来自于搜索引擎,而非第三方伪造。
    J0G57faC6uPo75W0
        24
    J0G57faC6uPo75W0  
       Feb 20, 2020 via Android
    在主界面内嵌一段 js,判断当前地址,然后 跳转到你的域名。
    GreyYang
        25
    GreyYang  
       Feb 20, 2020
    弱弱的问下,克隆了别人的博客对他有啥好处?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1028 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 109ms · UTC 19:23 · PVG 03:23 · LAX 12:23 · JFK 15:23
    ♥ Do have faith in what you're doing.