java nslookup反查IP验证google、百度、bing蜘蛛爬虫IP真假

作者： ʘᴗʘ发布时间：2021-11-22 14:29 浏览量：127 点赞：94 售价：0元

需求简介

互联网上有很多恶意扫描工具，会冒充常见搜索引擎的user-agent来扫描目标网站的漏洞。同时，作为站长往往害怕屏蔽恶意IP的时候“误杀”搜索引擎IP。本站随着建站时间逐渐增长，恶意扫描也变得越来越多，所以急需一个方案能够识别那些假冒搜索引擎user-agent的恶意扫描IP。

技术原理

技术很简单，就是利用nslookup等命令，检查携带搜索引擎user-agent的IP，是否真的是搜索引擎的官方IP。百度官方的相关文档：通过反查IP验证百度蜘蛛IP真假

Java验证爬虫IP代码

一、引入所需Jar包

因为在不同的操作系统上，反查IP的命令是不同的，所以最简单的办法是引入一个成熟的Java dns库，这里我们推荐dnsjava，maven引入代码如下：

<dependency>
    <groupId>dnsjava</groupId>
    <artifactId>dnsjava</artifactId>
    <version>3.4.2</version>
</dependency>

二、java nslookup反查IP

引入dnsjava后，我们只需一行代码，即可反查IP对应的name。直接上代码：

public static void main(String[] args) throws Exception {

    //真实百度蜘蛛IP
    String hostName = Address.getHostName(InetAddress.getByName("220.181.108.75"));
    System.out.println(hostName);

    //虚假百度蜘蛛IP
    hostName = Address.getHostName(InetAddress.getByName("183.188.169.224"));
    System.out.println(hostName);
}

上面的代码运行结果如下：

https://baiduspider-220-181-108-75.crawl.baidu.com./
https://224.169.188.183.adsl-pool.sx.cn./

观察结果我们可以发现，真正的百度蜘蛛爬虫的IP，反查结果是可以看到百度的域名的。所以，通过该方法，每当有携带搜索引擎user-agent的ip访问我们的网站时，都可以通过上述办法反查IP，验证IP是否合法。

考虑到反查IP的耗时相对较长，所以如果要在项目中使用该功能，建议做成异步执行的，避免影响网站响应时间。

原文链接：https://www.coderbbb.com/articles/42

其它推荐：

【手把手教你】win10 java jdk8、JDK11下载安装配置环境变量新手教程
本文详细介绍了如何快速安装配置Oracle JDK8、Oracle JDK11到win10系统中，文章提供了各个常见版本的JDK下载地址（均为Oracle官方下载地址），并介绍了环境变量的配置、测试方法。
Java Springboot使用OkHttp实现微信支付API-V3签名、证书的管理和使用
新版的微信支付API-V3中，最让人头疼的就是各种安全措施。各种凌乱的概念让人摸不着头脑。比如微信平台证书、商户证书、API KEY等等概念。本文从零开始，引导读者一步一步实现了整个微信支付的安全验证，通过本文可以快速完成微信支付的安全开发。
【亲测有效】解决win10 git文件状态图标不显示的问题
本文解决了win10系统下Git文件状态图标不显示的问题，并详细讲解了问题的根本原因。如果你也遇到了类似win10系统overplay icon图标不显示的问题，请参考本文解决。
vue+websocket配合Springboot+netty实现基于web浏览器的IM即时通讯系统
使用vue+websocket前端配合springboot+netty的后端来实现简单的web im即时通讯系统。支持websocket使用SSL证书加密。详细介绍了netty如何最简实现websocket的支持、WEB前端如何最简实现websocket。
使用IntelliJ创建第一个简单的Springboot项目
本文详细介绍了如何使用IntelliJ开发第一个Springboot项目，并打包成jar文件部署到生产环境。内容包括：IntelliJ的常用操作、Springboot多环境配置等常用操作介绍。
【过来人推荐】Netty报错：LEAK: ByteBuf.release() was not called before it's garbage-collected
netty报错：ByteBuf.release() was not called before it's garbage-collected的完美解决方案！过来人经过N次该报错后总结的经验，不长篇大论讲理论，真金白银给你解决方案。
Springboot使用redis的setnx和getset实现并发锁、分布式锁
本文介绍如何使用redis的setnx和getset实现可用于分布式环境的redis并发锁，解决高并发、高可靠性的业务环境下，常见的原子性操作需求。代码久经验证，可放心使用。
解决win10无法打开Microsoft Store
本文解决了Windows10系统无法正常打开Microsoft Store页面的问题。通过设置Internet的TLS1.2选项，完美解决该问题。
IntelliJ IDEA设置中文界面实现汉化（适用于Jetbrains全家桶中的任意IDE）
本文介绍了如果通过Jetbrains官方中文语言包，实现IntelliJ IDEA等Jetbrains全家桶软件的汉化工作，配置实现Intellij等软件的中文界面。
【就缺个程序员系列】创业公司技术科普
【就缺个程序员系列】是IT行业多年工作经验的总结，使用大白话给非技术出身的你一些踏踏实实的干货。如果你正在创业，请阅读它！

ʘᴗʘ

评级：

77: 文章数

74985: 浏览量

57626: 获赞数

67.80: 总收入

本文目录

本文为付费文章

点击图片购买本文后，全文代码即可变为文本，可复制。还可与本文作者在线沟通哦！

本文售价：0.10元

java nslookup反查IP验证google、百度、bing蜘蛛爬虫IP真假

需求简介

技术原理

Java验证爬虫IP代码

一、引入所需Jar包

二、java nslookup反查IP

【手把手教你】win10 java jdk8、JDK11下载安装配置环境变量新手教程

Java Springboot使用OkHttp实现微信支付API-V3签名、证书的管理和使用

【亲测有效】解决win10 git文件状态图标不显示的问题

vue+websocket配合Springboot+netty实现基于web浏览器的IM即时通讯系统

使用IntelliJ创建第一个简单的Springboot项目

【过来人推荐】Netty报错：LEAK: ByteBuf.release() was not called before it's garbage-collected

Springboot使用redis的setnx和getset实现并发锁、分布式锁

解决win10无法打开Microsoft Store

IntelliJ IDEA设置中文界面实现汉化（适用于Jetbrains全家桶中的任意IDE）

【就缺个程序员系列】创业公司技术科普