转自:http://blog.csdn.net/hj7jay/article/details/51280405 

众所周知页面上的字符内容通常都需要进行HTML转义才能正确显示,尤其对于Input,Textarea提交的内容,更是要进行转义以防止javascript注入攻击。

  通常的HTML转义主要是针对内容中的"<",">","&",以及空格、单双引号等。但其实还有很多字符也需要进行转义。具体的可以参考这篇文章
** 1、HTML转义
  参考上面的提到的文章,基本上可以确定以下的转义的范围和方式。
  1)对"\""、"&"、"'"、"<"、">"、空格(0x20)、0x00到0x20、0x7F-0xFF
  以及0x0100-0x2700的字符进行转义,基本上就覆盖的比较全面了。
  
   用javascript的正则表达式可以写为:
   this.REGX_HTML_ENCODE = /"|&|'|<|>|[\x00-\x20]|[\x7F-\xFF]|[\u0100-\u2700]/g; 
  2)为保证转义结果对浏览器的无差别,转义编码为实体编号,而不用实体名称。
  
  3)空格(0x20)通常转义为“ ”也就是“ ”。
  转义的代码非常简单:
  
[javascript] view plain copy

  1. this.encodeHtml = function(s){
  2. return (typeof s != "string") ? s :
  3. s.replace(this.REGX_HTML_ENCODE,
  4. function($0){
  5. var c = $0.charCodeAt(0), r = ["&#"];
  6. c = (c == 0x20) ? 0xA0 : c;
  7. r.push(c); r.push(";");
  8. return r.join("");
  9. });
  10. };
** 2、反转义
  既然有转义,自然需要反转义。
  1) 对“&#num;”实体编号的转义,直接提取编号然后fromCharCode就可以得到字符。
  2) 对于诸如“<”,需要建立一张如下的表来查询。
   this.HTML_DECODE = {
        "<"  : "<", 
        ">"  : ">", 
        "&" : "&", 
        " ": " ", 
        """: "\"", 
        "©": "©"
        // Add more
   };
  由此我们可以有反转义的正则表达式:
  this.REGX_HTML_DECODE = /&\w+;|&#(\d+);/g;
  反转的代码也很简单,如下:
[javascript] view plain copy

  1. this.decodeHtml = function(s){
  2. return (typeof s != "string") ? s :
  3. s.replace(this.REGX_HTML_DECODE,
  4. function($0,$1){
  5. var c = this.HTML_ENCODE[$0]; // 尝试查表
  6. if(c === undefined){
  7. // Maybe is Entity Number
  8. if(!isNaN($1)){
  9. c = String.fromCharCode(($1 == 160) ? 32 : $1);
  10. }else{
  11. // Not Entity Number
  12. c = $0;
  13. }
  14. }
  15. return c;
  16. });
  17. };

** 3、一个有意思的认识
  其实在用正则表达式转义之前,我一直都是用遍历整个字符串,逐个比较字符的方式。直到有一天,看到一篇文章说,javascript正则表达式是C实现的,比自己用javascript遍历字符要快,于是我就试着改写成上面这种方式。虽然代码看起来的确显得神秘而又牛叉,但遗憾的是,在我的Chrome 11 (FreeBSD 64 9.0)上,遍历字符转义/反转的方式要比上面正则表达式的代码快2到3倍(字符串长度越长越明显)。其实,想想也能明白为什么。
** 4、完整版本的代码
[javascript] view plain copy

  1. $package("js.lang"); // 没有包管理时,也可简单写成 js = {lang:{}};
  2. js.lang.String = function(){
  3. this.REGX_HTML_ENCODE = /"|&|'|<|>|[\x00-\x20]|[\x7F-\xFF]|[\u0100-\u2700]/g;
  4. this.REGX_HTML_DECODE = /&\w+;|&#(\d+);/g;
  5. this.REGX_TRIM = /(^\s*)|(\s*$)/g;
  6. this.HTML_DECODE = {
  7. "<" : "<",
  8. ">" : ">",
  9. "&" : "&",
  10. " ": " ",
  11. """: "\"",
  12. "©": ""
  13. // Add more
  14. };
  15. this.encodeHtml = function(s){
  16. s = (s != undefined) ? s : this.toString();
  17. return (typeof s != "string") ? s :
  18. s.replace(this.REGX_HTML_ENCODE,
  19. function($0){
  20. var c = $0.charCodeAt(0), r = ["&#"];
  21. c = (c == 0x20) ? 0xA0 : c;
  22. r.push(c); r.push(";");
  23. return r.join("");
  24. });
  25. };
  26. this.decodeHtml = function(s){
  27. var HTML_DECODE = this.HTML_DECODE;
  28. s = (s != undefined) ? s : this.toString();
  29. return (typeof s != "string") ? s :
  30. s.replace(this.REGX_HTML_DECODE,
  31. function($0, $1){
  32. var c = HTML_DECODE[$0];
  33. if(c == undefined){
  34. // Maybe is Entity Number
  35. if(!isNaN($1)){
  36. c = String.fromCharCode(($1 == 160) ? 32:$1);
  37. }else{
  38. c = $0;
  39. }
  40. }
  41. return c;
  42. });
  43. };
  44. this.trim = function(s){
  45. s = (s != undefined) ? s : this.toString();
  46. return (typeof s != "string") ? s :
  47. s.replace(this.REGX_TRIM, "");
  48. };
  49. this.hashCode = function(){
  50. var hash = this.__hash__, _char;
  51. if(hash == undefined || hash == 0){
  52. hash = 0;
  53. for (var i = 0, len=this.length; i < len; i++) {
  54. _char = this.charCodeAt(i);
  55. hash = 31*hash + _char;
  56. hash = hash & hash; // Convert to 32bit integer
  57. }
  58. hash = hash & 0x7fffffff;
  59. }
  60. this.__hash__ = hash;
  61. return this.__hash__;
  62. };
  63. };
  64. js.lang.String.call(js.lang.String);

   在实际的使用中可以有两种方式:
  1)使用js.lang.String.encodeHtml(s)和js.lang.String.decodeHtml(s)。
  2)还可以直接扩展String的prototype
  
[javascript] view plain copy

  1. js.lang.String.call(String.prototype);
  2. // 那么
  3. var str = "&'\"中国abc def";
  4. var ec_str = str.encodeHtml();
  5. document.write(ec_str);
  6. document.write(""); // CU的博客在线编辑有bug,
  7. 放不上来!!!
  8. var dc_str = ec_str.decodeHtml();
  9. document.write(dc_str);

用Javascript(js)进行HTML转义工具(处理特殊字符显示)的更多相关文章

  1. Bootstrap入门(二十八)JS插件5:工具提醒

    Bootstrap入门(二十八)JS插件5:工具提醒 工具提示在使用过程中比较常见,但是实现起来有些麻烦,而bootstrap则很好地解决了这个问题. 我们来写一个简单的实例 先引入CSS文件和JS文 ...

  2. JS转换HTML转义符,编码及解码

    JS转换HTML转义符 //去掉html标签 function removeHtmlTab(tab) { return tab.replace(/<[^<>]+?>/g,'') ...

  3. 几种常见的JavaScript混淆和反混淆工具分析实战

    几种常见的JavaScript混淆和反混淆工具分析实战 xiaix2016-03-05+8共1195751人围观 ,发现 5 个不明物体WEB安全 信息安全常被描述成一场军备竞赛,白帽与黑帽,渗透测试 ...

  4. 2017最好的JavaScript框架、库和工具 — SitePoint

    与开发者数量相比,可能有更多的JavaScript框架.库和工具.截止到2017年5月,在GitHub上快速搜索能搜到超过110万的JavaScript项目. 在npmjs上有50万的可用包,并且这些 ...

  5. 前端Js框架汇总(工具多看)

    前端Js框架汇总(工具多看) 一.总结 一句话总结: 二.前端Js框架汇总 概述: 有些日子没有正襟危坐写博客了,互联网飞速发展的时代,技术更新迭代的速度也在加快.看着Java.Js.Swift在各领 ...

  6. 【JS】JS实现Html转义和反转义(html编码和解码)的方法总结

    1.JS实现html转义和反转义主要有两种方式: 1).利用用浏览器内部转换器实现html转义: 2).用正则表达式实现html转义: 2.封装的JS工具类: var HtmlUtil = { /*1 ...

  7. js正则表达式图形化工具-rline

    github地址:https://github.com/finance-sh/rline 在线demo: http://lihuazhai.com/demo/test.html 这是一个js正则表达式 ...

  8. JS转换HTML转义符

    JS转换HTML转义符 //去掉html标签 function removeHtmlTab(tab) { return tab.replace(/<[^<>]+?>/g,'') ...

  9. javascript(js)小数精度丢失的解决方案

    原因:js按照2进制来处理小数的加减乘除,在arg1的基础上 将arg2的精度进行扩展或逆扩展匹配,所以会出现如下情况. javascript(js)的小数点加减乘除问题,是一个js的bug如0.3* ...

  10. 【转】关于URL编码/javascript/js url 编码/url的三个js编码函数

    来源:http://www.cnblogs.com/huzi007/p/4174519.html 关于URL编码/javascript/js url 编码/url的三个js编码函数escape(),e ...

随机推荐

  1. sqlServer下展示某库中所有的表

  2. ognl

    一:什么是值栈 1:ValueStack:值栈.其本身的数据结构是一个栈,使用者可以把一些对象存入栈中.然后使用动态的表达式来读取bean的属性.由于值栈中可能有多个对象 值栈会按照对象出栈的顺序依次 ...

  3. 【ASP.NET实战教程】基于ASP.NET技术下多用户博客系统全程实战开发(NNblog)

    岁末主推:牛牛老师主讲,多用户博客系统,基于ASP.NET技术,年后将带来移动业务平台项目项目目标: 打造个性品牌Blogo,定制多用户博客 为每一个博客用户提供个性化的 blogo解决方案,打造精品 ...

  4. 给大家推荐一款高大上的代码高亮插件(sublime,github风格)——highlight.js

    经常在一些大神博客里面看到非常好看的高亮代码,有sublime风格,GitHub风格等等.毫无疑问,好的高亮代码插件可以不仅仅让你的博文显得更高大上,更重要的是舒适的阅读体验.经过我在网上的一番搜罗, ...

  5. WPF实现Twitter按钮效果

    最近上网看到这个CSS3实现的Twitter按钮,感觉很漂亮,于是想用WPF来实现下. 实现这个效果,参考了CSS3 原文地址:http://www.html5tricks.com/css3-twit ...

  6. Android开发自学笔记(Android Studio)—4.界面编程与View组件简单介绍

    一.引言 Android应用开发最重要的一份内容就是界面的开发,无论你程序包含的内容多么优秀,如若没有一个良好的用户交互界面,最终也只是会被用户所遗弃.Android SDK提供了大量功能丰富的UI组 ...

  7. Tarjan

    //求强连通分量 void uni(int x,int y){ if (rank[x]<rank[y]){ fa[x]=y; size[y]+=size[x]; }else{ rank[x]+= ...

  8. Asp.Net MVC<三> : ASP.NET MVC 基本原理及项目创建

    MVC之前的那点事儿系列 解读ASP.NET 5 & MVC6系列 MVC模拟(摘自ASP.NET MVC5框架揭秘) Asp.net中,通过HttpModule的形式定义拦截器,也就是路由表 ...

  9. CentOS 7.2 安装配置mysql主从服务器

    MySQL官方压缩包安装: 1:下载mysql官方版本,此处以目前最新版本5.7.14为例,下载的64位版本文件为: mysql-5.7.14-linux-glibc2.5-x86_64.tar 2: ...

  10. jsoup-处理html中的script数据

    /** * 价值在线数据-左边分类抓取 * http://www.valueonline.cn/laws/laws?typeid=96219074211635284 * @author hwaggLe ...