原博客地址:http://blog.csdn.net/xyz_lmn/article/details/8057270

最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没有找到Java版的短网址(ShortUrl)的算法,很是郁闷。同时还发现有不少网友在发帖求助,怎么实现Java版的短网址(ShortUrl)的算法。干脆一不做,二不休,参考了一下网上比较流行的PHP版短网址(ShortUrl)算法:

再根据自己的理解,用Java实现了该短网址(ShortUrl)的算法。(\(^o^)/YES!我还真厉害!)

先来废话一下,是在别人的帖子上看到的,主要是让大家了解一下短网址(ShortUrl)。

时下,短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新郎的t.cn等。

我们在新浪微博上发布网址的时候,微博会自动判别网址,并将其转换,例如:http://t.cn/hrYnr0。为什么要这样做的,原因我想有这样几点:

1、微博限制字数为140字一条,那么如果我们需要发一些连接上去,但是这个连接非常的长,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短网址应运而生了。

2、短网址可以在我们项目里可以很好的对开放级URL进行管理。有一部分网址可以会涵盖性、暴力、广告等信息,这样我们可以通过用户的举报,完全管理这个连接将不出现在我们的应用中,应为同样的URL通过加密算法之后,得到的地址是一样的。

3、我们可以对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点,这样有利于我们对项目的后续工作更好的作出决策。

其实以上三点纯属个人观点,因为在我接下来的部分项目中会应用到,所以就了解了一下,下面先来看看短网址映射算法的理论(网上找到的资料):

① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;

② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作,超过30位的忽略处理;

③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;

④ 这样一个md5字符串可以获得4个6位串,取里面的任意一个就可作为这个长url的短url地址。

很简单的理论,我们并不一定说得到的URL是唯一的,但是我们能够取出4组URL,这样几乎不会出现太大的重复。

首先,请大家了解在Java中如何用MD5来加密字符串得到32位的加密后的字符串,下面是我已经封装好的Java MD5算法:

  1. private final static String[] hexDigits = {
  2. "0", "1", "2", "3", "4", "5", "6", "7",
  3. "8", "9", "a", "b", "c", "d", "e", "f"};
  4. public static String byteArrayToHexString(byte[] b){
  5. StringBuffer resultSb = new StringBuffer();
  6. for (int i = 0; i < b.length; i++){
  7. resultSb.append(byteToHexString(b[i]));
  8. }
  9. return resultSb.toString();
  10. }
  11. private static String byteToHexString(byte b){
  12. int n = b;
  13. if (n < 0)
  14. n = 256 + n;
  15. int d1 = n / 16;
  16. int d2 = n % 16;
  17. return hexDigits[d1] + hexDigits[d2];
  18. }
  19. public static String MD5Encode(String origin){
  20. String resultString = null;
  21. try {
  22. resultString=new String(origin);
  23. MessageDigest md = MessageDigest.getInstance("MD5");
  24. resultString.trim();
  25. resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));
  26. }catch (Exception ex){}
  27. return resultString;
  28. }
  29. public static void main(String[] args)
  30. {
  31. String data = "189022881112011111118:09sz0000123456789987654321";
  32. System.out.println(MD5Encode(data));
  33. }
  1. public class ShortUrl {
  2. public static void main(String[] args) {
  3. String url = "http://www.sunchis.com";
  4. for (String string : ShortText(url)) {
  5. print(string);
  6. }
  7. }
  8. public static String[] ShortText(String string){
  9. String key = "XuLiang";                 //自定义生成MD5加密字符串前的混合KEY
  10. String[] chars = new String[]{          //要使用生成URL的字符
  11. "a","b","c","d","e","f","g","h",
  12. "i","j","k","l","m","n","o","p",
  13. "q","r","s","t","u","v","w","x",
  14. "y","z","0","1","2","3","4","5",
  15. "6","7","8","9","A","B","C","D",
  16. "E","F","G","H","I","J","K","L",
  17. "M","N","O","P","Q","R","S","T",
  18. "U","V","W","X","Y","Z"
  19. };
  20. String hex = MD5Encode(key + string);
  21. int hexLen = hex.length();
  22. int subHexLen = hexLen / 8;
  23. String[] ShortStr = new String[4];
  24. for (int i = 0; i < subHexLen; i++) {
  25. String outChars = "";
  26. int j = i + 1;
  27. String subHex = hex.substring(i * 8, j * 8);
  28. long idx = Long.valueOf("3FFFFFFF", 16) & Long.valueOf(subHex, 16);
  29. for (int k = 0; k < 6; k++) {
  30. int index = (int) (Long.valueOf("0000003D", 16) & idx);
  31. outChars += chars[index];
  32. idx = idx >> 5;
  33. }
  34. ShortStr[i] = outChars;
  35. }
  36. return ShortStr;
  37. }
  38. private static void print(Object messagr){
  39. System.out.println(messagr);
  40. }
  41. }

下面来看看程序部分:现在可以直接使用ShortText(url)方法,可以等到下面四组值:

    1. ShortText("http://www.sunchis.com")[0];  //得到值:Jzyqma
    2. ShortText("http://www.sunchis.com")[1];  //得到值:QBrMzm
    3. ShortText("http://www.sunchis.com")[2];  //得到值:bQreM3
    4. ShortText("http://www.sunchis.com")[3];  //得到值:VNBRna

URL短地址压缩算法 微博短地址原理解析 (Java实现)的更多相关文章

  1. 【转】URL短地址压缩算法 微博短地址原理解析 (Java实现)

    转自: URL短地址压缩算法 微博短地址原理解析 (Java实现) 最近,项目中需要用到短网址(ShortUrl)的算法,于是在网上搜索一番,发现有C#的算法,有.Net的算法,有PHP的算法,就是没 ...

  2. 【转】C# URL短地址压缩算法及短网址原理解析

    这篇文章主要介绍了C# URL短地址压缩算法及短网址原理解析,本文重点给出了算法代码,需要的朋友可以参考下 短网址应用已经在全国各大微博上开始流行了起来.例如QQ微博的url.cn,新郎的sinaur ...

  3. C#如何实现url短地址?C#短网址压缩算法与短网址原理入门

    c# url短地址压缩算法与短网址原理的例子,详细介绍了短网址的映射算法,将长网址md5生成32位签名串,分为4段,每段8个字节,然后生成短网址,具体见文本实例. 短网址映射算法: 将长网址md5生成 ...

  4. 秋色园QBlog技术原理解析:性能优化篇:缓存总有失效时,构造持续的缓存方案(十四)

    转载自:http://www.cyqdata.com/qblog/article-detail-38993 文章回顾: 1: 秋色园QBlog技术原理解析:开篇:整体认识(一) --介绍整体文件夹和文 ...

  5. 如何做系列(4)-微博URL短网址生成算法原理(java版、php版实现实例)

    短网址(Short URL),顾名思义就是在形式上比较短的网址.通常用的是asp或者php转向,在Web 2.0的今天,不得不说,这是一个潮流.目前已经有许多类似服务,借助短网址您可以用简短的网址替代 ...

  6. ios开发——实用技术篇Swift篇&地址薄、短信、邮件

    //返回按钮事件 @IBAction func backButtonClick() { self.navigationController?.popViewControllerAnimated(tru ...

  7. 【面试题】如何去掉vue的url地址中的#号?及其原理?

    如何去掉vue的url地址中的#号?及其原理? 点击打开视频讲解更加详细 如何去掉vue的url地址中的#号? import Vue from 'vue'; import VueRouter from ...

  8. 腾讯短链接url生成接口/腾讯短网址在线生成/新浪微博短链接生成器的分享

    在通常情况下,URL是由系统生成的,通常包括URI路径,多个查询参数,可以对参数进行加密和解密. 当人们要分享某个URL,比如短信,邮件,社交媒体,这就需要短URL.而短网址,顾名思义就是在长度上比较 ...

  9. java清除所有微博短链接 Java问题通用解决代码

    java实现微博短链接清除,利用正则,目前只支持微博短链接格式为"http://域名/字母或数字8位以内"的链接格式,现在基本通用 如果链接有多个,返回结果中会有多出的空格,请注意 ...

随机推荐

  1. javascript进阶课程--第一章--函数

    javascript进阶课程--第一章--函数 学习要点 了解内存管理 掌握全局函数的使用 知识点 基本类型和引用类型 基本类型值有:undefined,NUll,Boolean,Number和Str ...

  2. 面向对象 —— 对类(class)的理解

    类是成员变量和成员函数的封装,封装的一个重要功能就是可见性(继承除外,当然继承是面向对象的另外一个重要特性),所谓可见性,类内可见,类外不可见.可见性保证了类型安全(type-safe) 对类进行实例 ...

  3. vue --- 脚手架初始化项目中配置文件webpack.base.conf.js代码含义

    'use strict' //引入node path 中间件 可以获取到 path 路径的一些信息 const path = require('path') //引入utils工具模块 utils主要 ...

  4. 学习TF:《TensorFlow机器学习实战指南》中文PDF+英文PDF+代码

    从实战角度系统讲解TensorFlow基本概念及各种应用实践.真实的应用场景和数据,丰富的代码实例,详尽的操作步骤,带你由浅入深系统掌握TensorFlow机器学习算法及其实现. <Tensor ...

  5. USB摄像头驱动框架分析(五)

    一.USB摄像头驱动框架如下所示:1.构造一个usb_driver2.设置   probe:        2.1. 分配video_device:video_device_alloc        ...

  6. 关于结构体内存对齐方式的总结(#pragma pack()和alignas())

    最近闲来无事,翻阅msdn,在预编译指令中,翻阅到#pragma pack这个预处理指令,这个预处理指令为结构体内存对齐指令,偶然发现还有另外的内存对齐指令aligns(C++11),__declsp ...

  7. cogs 184. [USACO Oct08] 搭建篱笆

    184. [USACO Oct08] 搭建篱笆 ★★   输入文件:quad.in   输出文件:quad.out   简单对比时间限制:1 s   内存限制:128 MB 勤奋的农夫约翰想要修建一个 ...

  8. STM32的IO口的8种配置

    STM32的IO口的8种配置 1 STM32的输入输出管脚有以下8种可能的配置:(4输入+2输出+2复用输出) ① 浮空输入_IN_FLOATING ② 带上拉输入_IPU ③ 带下拉输入_IPD ④ ...

  9. HTTP服务器状态码定义

    HTTP服务器状态代码定义 1.1 消息1xx(Informational 1xx) 该类状态代码用于表示临时回应.临时回应由状态行(Status-Line)及可选标题组成, 由空行终止.HTTP/1 ...

  10. 2011年度十大杰出IT博客获奖感言

        2011年度十大杰出IT博客获奖感言 在各位评委.网友的支持下,我的博客从前50名中脱颖而出跻身10强,得到这个消息之后心中充满了喜悦.在这里要感谢51CTO为大家提供这样一个良好的展示平台. ...