IP地址库解析——读取IP地址获得实际地理位置信息的java源码实现
说明:IP地址库来自QQwry.dat数据库文件,通过解析地址库当中的ip,已经细化最后获取的信息:获取ip地址对应的:国家 / 省 / 市 / 运营商ISP信息。
解析主要用到三个类:
(1) IPSeeker.java:通过IP地址查询解析相关信息
(2) SplitAddress.java:IPSeeker解析出的完整信息做进一步切分,划分为0级地址(国家/省)、1级地址(市级)、2级地址(区)、运营商ISP信息。
(3) IPEntity.java:定义的实体字段,包括nation、province、city、region.
-----------------------------------------------------------------------------------------------------------------------------
(1) IPSeeker.java
import java.io.File;
import java.io.IOException;
import java.io.RandomAccessFile;
import java.io.UnsupportedEncodingException;
import java.nio.ByteOrder;
import java.nio.MappedByteBuffer;
import java.nio.channels.FileChannel;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory; public class IPSeeker{
private Log log = LogFactory.getLog(IPSeeker.class);
//:::::::::::: Class IPLocation ::::::::::::::::::::://
public class IPLocation{
//:::::::::::: Fields :::::::::::::://
private String country; //完全地址:省/市/区
private String isp; //使用的网络(运营商ISP) //:::::::::::: Province ::::::::::::://
public String getCountry() {
return country;
}
public void setCountry(String country) {
this.country = country;
} public String getIsp(){
if("CZ88.NET".equals(isp)){isp = ""; }
return isp;
}
public void setIsp(String isp){
this.isp = isp;
} //::::::::: Class Constructor ::::::::::::://
public IPLocation(){
isp = "";
country = "";
} public IPLocation getCopy(){
IPLocation ret = new IPLocation();
ret.country = country;
ret.isp = isp;
return ret;
}
} //:::::::::::: Class IPEntry ::::::::::::::::::::://
public class IPEntry{
public String beginIp;
public String endIp;
public String country;
public String isp; public IPEntry(){
beginIp = endIp = country = isp = "";
} @Override
public String toString(){
return this.isp+" "+this.country+"IP范围:"+this.beginIp+"-"+this.endIp;
}
}
//一些固定常量,比如记录长度等
private static final int IP_RECORD_LENGTH = 7;
private static final byte isp_FOLLOWED = 0x01;
private static final byte NO_isp = 0x2;
// 用来做为cache,查询一个ip时首先查看cache,以减少不必要的重复查找
private MappedByteBuffer mbb;
// 随机文件访问类
private RandomAccessFile ipFile;
// 内存映射文件
private HashMap<String, IPLocation> ipCache;
// 起始地区的开始和结束的绝对偏移
private int ipBegin, ipEnd; public IPSeeker(File ipFile) throws Exception{
this.ipFile = new RandomAccessFile(ipFile, "r");
ipCache = new HashMap<String, IPLocation>();
FileChannel fc = this.ipFile.getChannel();
mbb = fc.map(FileChannel.MapMode.READ_ONLY, 0, ipFile.length());
mbb.order(ByteOrder.LITTLE_ENDIAN);
ipBegin = readInt(0);
ipEnd = readInt(4);
if(ipBegin==-1 || ipEnd==-1){
throw new IOException("IP地址信息文件格式有错误,IP显示功能将无法使用");
}
log.debug("使用IP地址库:"+ipFile.getAbsolutePath());
} /**
* 给定一个ip 得到一个 ip地址信息
* @param ip
* @return
*/
public String getAddress(String ip){
return getCountry(ip) + " " + getIsp(ip);
} /**
* 根据IP得到国家名
* @param ip IP的字符串形式
* @return 国家名字符串
*/
public String getCountry(String ip){
IPLocation cache = getIpLocation(ip);
return cache.getCountry();
} /**
* 根据IP得到地区名
* @param ip IP的字符串形式
* @return 地区名字符串
*/
public String getIsp(String ip){
IPLocation cache = getIpLocation(ip);
return cache.getIsp();
} public IPLocation getIpLocation(String ip){
IPLocation ipLocation = null;
try {
if(ipCache.get(ip)!=null){
return ipCache.get(ip);
}
ipLocation = getIPLocation(getIpByteArrayFromString(ip));
if(ipLocation!=null){
ipCache.put(ip, ipLocation);
}
} catch (Exception e) {
log.error(e);
}
if(ipLocation==null){
ipLocation = new IPLocation();
ipLocation.setCountry("未知国家");
ipLocation.setIsp("未知地区");
}
return ipLocation;
} /**
* 给定一个地点的不完全名字,得到一系列包含s子串的IP范围记录
* @param s 地点子串
* @return 包含IPEntry类型的List
*/
public List<IPEntry> getIPEngries(String s){
List<IPEntry> ret = new ArrayList<IPEntry>();
byte[] b4=new byte[4];
int endOffset = ipEnd + 4;
for(int offset=ipBegin+4; offset<=endOffset; offset+=IP_RECORD_LENGTH){
//读取结束IP偏移
int temp = readInt3(offset);
// 如果temp不等于-1,读取IP的地点信息
if(temp!=-1){
IPLocation loc = getIPLocation(temp);
// 判断是否这个地点里面包含了s子串,如果包含了,添加这个记录到List中,如果没有,继续
if (loc.country.indexOf(s) != -1 || loc.isp.indexOf(s) != -1) {
IPEntry entry = new IPEntry();
entry.country = loc.country;
entry.isp = loc.isp;
// 得到起始IP
readIP(offset - 4, b4);
entry.beginIp = getIpStringFromBytes(b4);
// 得到结束IP
readIP(temp, b4);
entry.endIp = getIpStringFromBytes(b4);
// 添加该记录
ret.add(entry);
}
}
}
return ret;
} /**
* 根据ip搜索ip信息文件,得到IPLocation结构,所搜索的ip参数从类成员ip中得到
* @param ip 要查询的IP
* @return IPLocation结构
*/
private IPLocation getIPLocation(byte[] ip){
IPLocation info = null;
int offset = locateIP(ip);
if (offset != -1) {
info = getIPLocation(offset);
}
return info;
} //---------以下为内部方法-------------//
/**
* 读取4个字节
* @param offset
* @return
*/
private int readInt(int offset) {
mbb.position(offset);
return mbb.getInt();
} private int readInt3(int offset) {
mbb.position(offset);
return mbb.getInt() & 0x00FFFFFF;
} /**
* 从内存映射文件的offset位置得到一个0结尾字符串
* @param offset
* @return
*/
private String readString(int offset) {
try {
byte[] buf=new byte[100];
mbb.position(offset);
int i;
for (i = 0, buf[i] = mbb.get(); buf[i] != 0; buf[++i] = mbb.get()) {
}
if (i != 0) {
return getString(buf, 0, i, "GBK");
}
}catch (IllegalArgumentException e){
log.error(e);
}
return "";
} /**
* 从offset位置读取四个字节的ip地址放入ip数组中,读取后的ip为big-endian格式,但是
* 文件中是little-endian形式,将会进行转换
* @param offset
* @param ip
*/
private void readIP(int offset, byte[] ip) {
mbb.position(offset);
mbb.get(ip);
byte temp = ip[0];
ip[0] = ip[3];
ip[3] = temp;
temp = ip[1];
ip[1] = ip[2];
ip[2] = temp;
} /**
* 把类成员ip和beginIp比较,注意这个beginIp是big-endian的
* @param ip 要查询的IP
* @param beginIp 和被查询IP相比较的IP
* @return 相等返回0,ip大于beginIp则返回1,小于返回-1。
*/
private int compareIP(byte[] ip, byte[] beginIp) {
for (int i = 0; i < 4; i++) {
int r = compareByte(ip[i], beginIp[i]);
if (r != 0){
return r;
}
}
return 0;
} /**
* 把两个byte当作无符号数进行比较
* @param b1
* @param b2
* @return 若b1大于b2则返回1,相等返回0,小于返回-1
*/
private int compareByte(byte b1, byte b2) {
if ((b1 & 0xFF) > (b2 & 0xFF)){ //比较是否大于
return 1;
}
else if((b1^b2)==0){ //判断是否相等
return 0;
}
else{
return -1;
}
} /**
* 这个方法将根据ip的内容,定位到包含这个ip国家地区的记录处,返回一个绝对偏移
* 方法使用二分法查找。
* @param ip 要查询的IP
* @return 如果找到了,返回结束IP的偏移,如果没有找到,返回-1
*/
private int locateIP(byte[] ip) {
int m = 0;
int r;
byte[] b4=new byte[4];
// 比较第一个ip项
readIP(ipBegin, b4);
r = compareIP(ip, b4);
if (r == 0) {
return ipBegin;
} else if (r < 0) {
return -1;
}
// 开始二分搜索
for (int i = ipBegin, j = ipEnd; i < j;) {
m = getMiddleOffset(i, j);
readIP(m, b4);
r = compareIP(ip, b4);
// log.debug(Utils.getIpStringFromBytes(b));
if (r > 0) {
i = m;
} else if (r < 0) {
if (m == j) {
j -= IP_RECORD_LENGTH;
m = j;
} else {
j = m;
}
} else {
return readInt3(m + 4);
}
}
// 如果循环结束了,那么i和j必定是相等的,这个记录为最可能的记录,但是并非
// 肯定就是,还要检查一下,如果是,就返回结束地址区的绝对偏移
m = readInt3(m + 4);
readIP(m, b4);
r = compareIP(ip, b4);
if (r <= 0) {
return m;
} else {
return -1;
}
} /**
* 得到begin偏移和end偏移中间位置记录的偏移
* @param begin
* @param end
* @return
*/
private int getMiddleOffset(int begin, int end) {
int records = (end - begin) / IP_RECORD_LENGTH;
records >>= 1;
if (records == 0) {
records = 1;
}
return begin + records * IP_RECORD_LENGTH;
} /**
* @param offset
* @return
*/
private IPLocation getIPLocation(int offset) {
IPLocation loc = new IPLocation();
// 跳过4字节ip
mbb.position(offset + 4);
// 跳过4字节ip
byte b = mbb.get();
if (b == isp_FOLLOWED) {
// 读取国家偏移
int countryOffset = readInt3();
// 跳转至偏移处
mbb.position(countryOffset);
// 再检查一次标志字节,因为这个时候这个地方仍然可能是个重定向
b = mbb.get();
if (b == NO_isp) {
loc.country = readString(readInt3());
mbb.position(countryOffset + 4);
} else {
loc.country = readString(countryOffset);
}
// 读取地区标志
loc.isp = readisp(mbb.position());
} else if (b == NO_isp) {
loc.country = readString(readInt3());
loc.isp = readisp(offset + 8);
} else {
loc.country = readString(mbb.position() - 1);
loc.isp = readisp(mbb.position());
}
return loc;
} /**
* @param offset
* @return
*/
private String readisp(int offset) {
mbb.position(offset);
byte b = mbb.get();
if (b == 0x01 || b == 0x02){
int ispOffset = readInt3();
if(ispOffset == 0){
return "未知地区";
}
else{
return readString(ispOffset);
}
}
else{
return readString(offset);
}
} /**
* 从内存映射文件的当前位置开始的3个字节读取一个int
* @return
*/
private int readInt3(){
return mbb.getInt() & 0x00FFFFFF;
} /**
* 从ip的字符串形式得到字节数组形式:字符串序列化为二进制文件
* @param ip 字符串形式的ip
* @return 字节数组形式的ip
*/
private static byte[] getIpByteArrayFromString(String ip) throws Exception{
byte[] ret = new byte[4];
java.util.StringTokenizer st = new java.util.StringTokenizer(ip, ".");
try{
ret[0] = (byte)(Integer.parseInt(st.nextToken()) & 0xFF);
ret[1] = (byte)(Integer.parseInt(st.nextToken()) & 0xFF);
ret[2] = (byte)(Integer.parseInt(st.nextToken()) & 0xFF);
ret[3] = (byte)(Integer.parseInt(st.nextToken()) & 0xFF);
}catch(Exception e){
throw e;
}
return ret;
} /**
* 根据某种编码方式将字节数组转换成字符串
* @param b 字节数组
* @param offset 要转换的起始位置
* @param len 要转换的长度
* @param encoding 编码方式
* @return 如果encoding不支持,返回一个缺省编码的字符串
*/
private static String getString(byte[] b, int offset, int len, String encoding) {
try {
return new String(b, offset, len, encoding);
}catch(UnsupportedEncodingException e){
return new String(b, offset, len);
}
} /**
* @param ip ip的字节数组形式
* @return 字符串形式的ip
*/
private static String getIpStringFromBytes(byte[] ip) {
StringBuffer sb = new StringBuffer();
sb.append(ip[0] & 0xFF);
sb.append('.');
sb.append(ip[1] & 0xFF);
sb.append('.');
sb.append(ip[2] & 0xFF);
sb.append('.');
sb.append(ip[3] & 0xFF);
return sb.toString();
} }
(2)SplitAddress.java
import java.io.File; /**
* @Note 地址切分____将全域地址切分为: 0级地址:国家或省
* 1级地址:市
* 2级地址:区
*
* 调用时直接调用IPseeker类:eg. ipseeker.getAddress("xxx.xxx.xxx.xxx");
* ipseeker.getCountry("xxx.xxx.xxx.xxx");
* ipseeker.getIsp("xxx.xxx.xxx.xxx");
* 由于ipentity.nation,province,city,region是作的切分,故 ipentity.getNation()等没有输入参数,调用直接输出
* ipentity.getNation();
* ipentity.getProvince();
* ipentity.getCity();
* ipentity.getRegion();
* 测试ip:202.112.110.0 -----北京市 北京邮电大学
* 27.184.95.146 ------河北省石家庄市 电信
* 219.136.134.157 -----广东省广州市越秀区 电信ADSL
* 59.45.1.151 --------辽宁省盘锦市双台子区 胜星网吧(辽河北路与城北路交汇)
* 61.128.101.255 -----新疆乌鲁木齐市 电信
* 220.182.50.226 -----西藏拉萨市 波斯湾网络会所(宇拓路30号)
* 210.136.134.157 -----日本 CZ88.NET
* 207.46.13.93 -----美国 Microsoft公司
* 27.122.12.0 ------香港 智通(Pacswitch)环球电讯
*
*/
public class SplitAddress {
public static void main(String[] args){
try {
IPSeeker ipseeker = new IPSeeker(new File("e:/aleiye/data/QQWry.dat"));
IPEntity ipentity = new IPEntity();
String ipaddress = "27.122.12.0";
SplitAddress splitaddress = new SplitAddress();
splitaddress.SplitAddressAction(ipaddress, ipseeker, ipentity); //切分获得多级地址 System.out.println("完整ip信息:"+ipseeker.getAddress(ipaddress));
System.out.println("完全地址:省/市/区:"+ipseeker.getCountry(ipaddress));
System.out.println("nation:"+ipentity.getNation());
System.out.println("province:"+ipentity.getProvince());
System.out.println("city:"+ipentity.getCity());
System.out.println("region:"+ipentity.getRegion());
System.out.println("使用的网络(运营商ISP):"+ipseeker.getIsp(ipaddress));
} catch (Exception e) {
e.printStackTrace();
} } public void SplitAddressAction(String ipaddress, IPSeeker ipseeker, IPEntity ipentity){
try {
String alladdress = ipseeker.getCountry(ipaddress);
String[] part;
//全国省市里唯一没有"市"字样的只有这4个省,直接作逗号","切分
if(alladdress.startsWith("新疆")){
ipentity.setProvince("新疆");
alladdress = alladdress.replace("新疆", "新疆,");
}
else if(alladdress.startsWith("西藏")){
ipentity.setProvince("西藏");
alladdress = alladdress.replace("西藏", "西藏,");
}
else if(alladdress.startsWith("内蒙古")){
ipentity.setProvince("内蒙古");
alladdress = alladdress.replace("内蒙古", "内蒙古,");
}
else if(alladdress.startsWith("宁夏")){
ipentity.setProvince("宁夏");
alladdress = alladdress.replace("宁夏", "宁夏,");
}
alladdress = alladdress.replaceAll("省", "省,").replaceAll("市", "市,"); //最多切成3段:辽宁省,盘锦市,双台子区;
part = alladdress.split(","); if(part.length==1){
//只有1级地址
ipentity.setNation(part[0]);
ipentity.setProvince(part[0]);
}
else if(part.length==2){
//有2级地址
ipentity.setProvince(part[0]);
ipentity.setCity(part[1]);
}
else if(part.length==3){
//有3级地址
ipentity.setProvince(part[0]);
ipentity.setCity(part[1]);
ipentity.setRegion(part[2]);
} } catch (Exception e) {
e.printStackTrace();
}
} }
(3) IPEntity.java
public class IPEntity {
String nation; //国家:0级地址
String province; //省:0级地址
String city; //市:1级地址
String region; //区:2级地址 public String getNation() {
return nation;
}
public void setNation(String nation) {
this.nation = nation;
}
public String getProvince() {
return province;
}
public void setProvince(String province) {
this.province = province;
}
public String getCity() {
return city;
}
public void setCity(String city) {
this.city = city;
}
public String getRegion() {
return region;
}
public void setRegion(String region) {
this.region = region;
} public IPEntity(){ } }
IP地址库解析——读取IP地址获得实际地理位置信息的java源码实现的更多相关文章
- Jsp调用淘宝IP地址库获取来访IP详细信息
Jsp调用淘宝IP地址库获取来访IP详细信息 示例网页点击:www.trembler.cn/ipinfo/ipinfo(服务器有其他用处,页面已失效) String ip = request.ge ...
- Tika结合Tesseract-OCR 实现光学汉字识别(简体、宋体的识别率百分之百)—附Java源码、测试数据和训练集下载地址
OCR(Optical character recognition) —— 光学字符识别,是图像处理的一个重要分支,中文的识别具有一定挑战性,特别是手写体和草书的识别,是重要和热门的科学研究方向.可 ...
- 2018-09-15 Java源码英翻中库以及服务原型
服务很简单, 只为演示这个库, 源码在: program-in-chinese/code_translator_service. 在Postman测试效果: 演示服务地址: 74.91.17.250: ...
- 使用JDT.AST解析java源码
在做java源码的静态代码审计时,最基础的就是对java文件进行解析,从而获取到此java文件的相关信息: 在java文件中所存在的东西很多,很复杂,难以用相关的正则表达式去一一匹配.但是,eclip ...
- [java源码解析]对HashMap源码的分析(二)
上文我们讲了HashMap那骚骚的逻辑结构,这一篇我们来吹吹它的实现思想,也就是算法层面.有兴趣看下或者回顾上一篇HashMap逻辑层面的,可以看下HashMap源码解析(一).使用了哈希表得“拉链法 ...
- java源码解析
String深入解析 String具有不变性的原因: String被final修饰,它不可能被继承,也就是任何对String的操作方法,都不会被继承覆写 String中保存数据的是一个char数组的v ...
- java源码解析之String类(一)
String是我们接触最多的类,无论是学习中还是工作中,基本每天都会和字符串打交道,从字符串本身的各种拼接.切片.变形,再到和其他基本数据类型的转换,几乎无时无刻都在使用它,今天就让我们揭开Strin ...
- Java源码解析|String源码与常用方法
String源码与常用方法 1.栗子 代码: public class JavaStringClass { public static void main(String[] args) { Strin ...
- JAVA源码剖析(容器篇)HashMap解析(JDK7)
Map集合: HashMap底层结构示意图: HashMap是一个“链表散列”,其底层是一个数组,数组里面的每一项都是一条单链表. 数组和链表中每一项存的都是一“Entry对象”,该对象内部拥有key ...
随机推荐
- Android多线程下载大文件解析
1.多线程介绍 用过迅雷的同学都知道.迅雷有个功能叫做多线程.另一个叫离线下载,我们这里重点介绍一下多线程下载.多线程,顾名思义就是非常多歌线程同一时候在执行,为什么要提出多线程这个概念呢?由于有时候 ...
- C结构体对齐
函数模板针对仅参数类型不同的函数? http://blog.csdn.net/renrenhappy/article/details/5931457 计算结构体的大小就要考虑数据对齐问题. ...
- 通过代码实现自动判断是手机端还是PC端跳转
<!-- 2017/09/13 跳转手机页面 start by 小鬼PSer --> <meta name="mobile-agent" content=&quo ...
- 02 http协议之方法与状态码
一:HTTP请求信息和响应信息的格式 请求: ()请求行 ()请求头信息 ()请求主体信息(可以没有) () 头信息结束后和主体信息之间要空一行 请求行又分3部分 请求方法 请求路径 所用的协议 请求 ...
- ORACLE 36进制和10进制,互相转换函数
第一部分 --36转10进制 create or replace function f_36to10 (str varchar) return int is returnValue int; s ...
- error LNK1112: module machine type 'X86' conflicts with target machine type 'x64'
1 这个error是什么原因造成的 cmake默认选择的是x86,即32位的生成子. 2 怎么解决这个error 在cmake ..的时候,在后面加上“-G "Visual Studio 1 ...
- python自动化运维九:Playbook
playbook:playbook 由一个或多个 ‘plays’ 组成.它的内容是一个以 ‘plays’ 为元素的列表.在 play 之中,一组机器被映射为定义好的角色.在 ansible 中,pla ...
- 项目中一个普通的Java类如何获取serviceimpl实现类(二)
HbOnLineConfigServiceImpl hbOnlineService=(HbOnLineConfigServiceImpl) WebContextFactoryUtil.getBean( ...
- 【Effective C++】设计与声明
条款18:让接口容易被正确使用,不易被误用 1,好的接口很容易被正确使用,不容易被误用.你应该在你的所有接口中努力达成这些性质. 2,“促进正使用”的办法包括接口的一致性,以及与内置类型的行为兼容. ...
- Redis学习笔记(1):Redis的说明与安装
Redis学习笔记(1):Redis说明的安装 说明 什么是Redis REmote DIctionary Server(Redis) 是一个由Salvatore Sanfilippo写的key-va ...