&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?

形如——

&#dddd;

&#xhhhh;

&#name;

——的一串字符是 HTML、XML 等 SGML 类语言的转义序列（escape sequence）。它们不是「编码」。

以 HTML 为例，这三种转义序列都称作 character reference：

前两种是 numeric character reference（NCR），数字取值为目标字符的 Unicode code point；以「&#」开头的后接十进制数字，以「&#x」开头的后接十六进制数字。
后一种是 character entity reference，后接预先定义的 entity 名称，而 entity 声明了自身指代的字符。

从 HTML 4 开始，NCR 以 Unicode 为准，与文档编码无关。

「中国」二字分别是 Unicode 字符 U+4E2D 和 U+56FD，十六进制表示的 code point 数值「4E2D」和「56FD」就是十进制的「20013」和「22269」。所以——

中国

中国

——这两种 NCR 写法都会在显示时转换为「中国」二字。

NCR 可以用于转义任何 Unicode 字符，而 character entity reference 很受限，参见 HTML 4 和 HTML5 中已有定义的字符列表：

http://www.zhihu.com/question/21390312

HtmlEncoder，中文转换成&#开头的编码(及HTML特殊字符解码)

如题： HtmlEncoder，中文转换成&#开头的编码(及HTML特殊字符解码)
代码如下：

package test.com.gjob.services;
import java.io.IOException;
import java.io.Writer;
public class HtmlEncoder {
public static void main(String args[]){
System.out.println(HtmlEncoder.encode("你好"));
}
/***
}

http://www.blogjava.net/jerry-zhaoj/archive/2009/03/24/261730.html

html, NCR, Numeric
Character Reference, Unicode

http://demon.tw/programming/numeric-character-reference.html
版权: 本博客的所有文章，都遵守“署名-非商业性使用-相同方式共享 2.5 中国大陆”协议条款。

telecomadmin+8位数字

根据常识判断，&#后面的数字应该是Unicode编码值，写个VBS验证：

25968)&ChrW(23383)

numeric character reference（NCR），直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#)，然后跟着这个字符的Unicode编码值，最后跟着一个分号组成的，就像上面的例子一样。

这篇文章发布于 2011年04月9日，星期六，21:43，归类于程序设计。您可以跟踪这篇文章的评论通过 RSS 2.0 feed。您可以留下评论，或者从您的站点trackback。

http://demon.tw/programming/numeric-character-reference.html

[字符编码]Numeric
Character Reference和HTML Entities

你是否在dreamweaver里编辑网页的时候看到Σ这样的东西，你曾使用过 这样的玩意吧，或者你在调试webservice的时候看到返回xml字符串中现γ这样的怪物呢？你看不懂他们可能用浏览器或者DW预览一下都是可以看到庐山真面目的，它是谁？

Σ这个是 Numeric
Character Reference

 这个是Character
entities references

从字面上观察，一个是用&#x+16进制+; 表达信息，一个是用&+字符串+; 突然让我想起了汇编语言里头的助记符跟实际二进制指令代码，带着这个猜测往下看吧！

Character
entities references

Character
entity references，也就是通常我们说得 html实体字符，一些字符在 HTML 中拥有特殊的含义，比如小于号 (<) 用于定义 HTML 标签的开始。如果我们希望浏览器正确地显示这些字符，我们必须在 HTML 源码中插入字符实体。

字符实体有三部分：一个和号 (&)，一个实体名称，或者 # 和一个实体编号，以及一个分号 (;)。要在 HTML 文档中显示小于号，我们需要这样写：< 或者 <

这里

NCR编码是由一个与号(&)跟着一个井号(#), 然后跟着这个字符的Unicode编码值, 最后跟着一个分号组成的, 如:

    &#nnnn;
    或者
    &#xhhhh

& //&
  //空格

1 <!ENTITY nbsp CDATA " " -- no-break space = non-breaking space,
2 U+00A0 ISOnum -->
3 <!ENTITY iexcl CDATA "¡" -- inverted exclamation mark, U+00A1 ISOnum -->
4 <!ENTITY cent CDATA "¢" -- cent sign, U+00A2 ISOnum -->
5 <!ENTITY pound CDATA "£" -- pound sign, U+00A3 ISOnum -->
6 <!ENTITY curren CDATA "¤" -- currency sign, U+00A4 ISOnum -->
7 <!ENTITY yen CDATA "¥" -- yen sign = yuan sign, U+00A5 ISOnum -->
8 <!ENTITY brvbar CDATA "¦" -- broken bar = broken vertical bar,
9 U+00A6 ISOnum -->

Å // Å
而:
å //

答：可以使用NCR的方式，先找到字符对应的UNICODE编码，以小于号为例，unicode编码16进制为3C（10进制为60），在html则可以使用&#x3C或&#60，跟上面的表格对照看是否相同，由此我们也可以知道，如果我们的html所采用的编码不支持一些字符（比如其他国家的字符），则可以通过NCR来引入我们的页面就不会乱码了。

有一天，我的一个好朋友在调试webservice时发现对方的接口返回类似&#xhhhh这样的东西，一时不知道如何处理，如何转换为我们想要的编码呢？下一篇文章将提供通用的转换程序，敬请期待！

最后感谢网络上无名的作者，是你们的博文让我学得更多，谢谢！如不小心引入您的博文内容而未带上出处，请告知我一声。

http://www.cnblogs.com/shishm/archive/2011/11/24/2261996.html

&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?的更多相关文章

你不知道的页面编码，浏览器选择编码，get，post各种乱码由来
原文:你不知道的页面编码,浏览器选择编码,get,post各种乱码由来 asp.net页面编码和浏览器的选择编码每个asp.net的朋友都知道,在新版本的visual studio,在没有任何设置 ...
&#x开头的是什么编码?
在 Node 层利用 cheerio 解析网页时,输出的中文内容都是以 &#x 开头的一堆像乱码一样的东西,尝试过各种编码都无效,而且神奇的是,将这一堆“乱码”保存成网页后,通过浏览器打开又可 ...
dedecms功能性函数封装(XSS过滤、编码、浏览器XSS hack、字符操作函数)
dedecms虽然有诸多漏洞,但不可否认确实是一个很不错的内容管理系统(cms),其他也不乏很多功能实用性的函数,以下就部分列举,持续更新,不作过多说明.使用时需部分修改,你懂的 1.XSS过滤. f ...
BOM / URL编码解码 / 浏览器存储
BOM 浏览器对象模型 BOM(Browser Object Model) 是指浏览器对象模型,是用于描述这种对象与对象之间层次关系的模型,浏览器对象模型提供了独立于内容的.可以与浏览器窗口进行互动的 ...
以&#开头的是什么编码？
今天遇到了一个网页时繁体的,它的title和meta信息在浏览器中显示正常,但是查看其源码是却是"最新發"这种. 在网上找了半天资料,终于搞明白了. 以在网页中&#开头的是 ...
WinForm开发浏览器，WebBrowser获取页面内容，如何解决中文乱码
WebBrowser的编码可以从文档对象中获得,将代码改为如下即可. System.IO.StreamReader getReader = new System.IO.StreamReader(thi ...
-moz、-ms、-webkit浏览器前缀解释（PS:后续在详细解释）
-moz-是Firefox Gecko内核,moz代表的是Firefox的开发商Mozill -ms代表ie浏览器私有属性 -webkit代表safari.chrome私有属性
css盒模型不同浏览器下解释不同解决办法
盒子模型是css中一个重要的概念,理解了盒子模型才能更好的排版.其实盒子模型有两种,分别是 ie 盒子模型和标准 w3c 盒子模型.他们对盒子模型的解释各不相同,先来看看我们熟知的标准盒子模型: 从上 ...
编码对象或者字串中包含Unicode字符怎样转换为中文
In [18]: c = '你好' In [20]: d = c.encode('unicode_escape') In [21]: d Out[21]: b'\\u4f60\\u597d' In [ ...

随机推荐

python数字图像处理（11）：图像自动阈值分割
图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标区域与其背景在灰度特性上的差异,把图像看作具有不同灰度级的两类区域(目标区域和背景区域)的组合,选取一个比较合理的阈值,以确定图像中每个像素 ...
记录毕业论文 LanguageTool 二次开发时用到的网站
LanguageTool Development LanguageTool Supported Languages Share your knowledge about LT - LanguageTo ...
Android中的异步网络请求
本篇文章我们来一起写一个最基本的Android异步网络请求框架,借此来了解下Android中网络请求的相关姿势.由于个人水平有限,文中难免存在疏忽和谬误,希望大家可以指出,谢谢大家:) 1. 同步网络 ...
C#Json序列化和反序列化
1.动态决定数据是否要序列化我的需求是这样的,我用了一款数据库的组件叫Dos.ORM,确实方便了不少,但是在用的时候,我发现一个问题,比如我定义的表中有一个字段添加时间,修改时间,这些都是默认的,在 ...
WPF开发时光之痕日记本
很久没有写东西了,新的一年新的开始吧. 很早就想自己开发一款日记本软件不仅自己使用,也可以让大家免费使用,最主要的是对自己有一个认可,自学WPF以来,感觉不很顺利,WPF的资料相对来说有点少,主 ...
Object C学习笔记23-继承,重写,重载
前面的学习都一直在使用Object C对象,但是没有具体总结过Object C中的对象使用特性,这里简单总结一下. 一. 继承在面向对象编程中,子类可以通过继承得到父类的可以继承的的属性和方法,在 ...
css的6中居中的方式
请先看blog:http://blog.csdn.net/wolinxuebin/article/details/7615098
grunt安装
随着node的流行,各种后台的技术应用到前端,依赖注入.自动化测试.构建等等. 本篇就介绍下如何使用Grunt进行构建. grunt安装由于grunt依赖于nodejs,因此需要先安装nodejs. ...
ASP.NET MVC实现POST方式的Redirect
我们知道,在ASP.NET MVC中,要从一个Action跳转到另一个Action,通常是用一系列以“Redirect”开头的方法 Redirect RedirectToAction Redirect ...
JS实现Ajax---例：获取服务器时间
Ajax在本质上是一个浏览器端的技术 XMLHttpRequest XMLHttpRequest对象 XMLHttpRequest对象在IE浏览器和非IE浏览器中创建的方法不同. 简而言之:它可以异步 ...

&#x开头的是什么编码呢。浏览器可以解释它。如&#20013;&#22269;等同与中文"中国"?

HtmlEncoder，中文转换成&#开头的编码(及HTML特殊字符解码)

&#x开头的是什么编码呢。浏览器可以解释它。如&#20013;&#22269;等同与中文"中国"?的更多相关文章

随机推荐

热门专题

&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?

&#x开头的是什么编码呢。浏览器可以解释它。如中国等同与中文"中国"?的更多相关文章