Beautiful Soup 中文文档 原文 by Leonard Richardson (leonardr@segfault.org) 翻译 by Richie Yan (richieyan@gmail.com) ###如果有些翻译的不准确或者难以理解,直接看例子吧.### 英文原文点这里 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree). 它提供简单又常用的导航(navigating),搜索以及修改
一. binary和char比较: binary 字节为单位,char字符为单位,字符占几个字节取决于字符集 binary 比较规则基于字节值,char基于字符,即使是_bin的比较规则 范围都0-255字节,char对于不同字符集,可以存取的字节数不同 排序和比较规则都会根据字符码值,而不是词典顺序,如果采用binary那么是区分大小写的,和我们常用的utf8_general_ci相冲突 相同特性,摘自官方文档: Specifying the CHARACTER SET binary att
<!DOCTYPE> 声明 版本 年份 HTML 1991 HTML+ 1993 HTML 2.0 1995 HTML 3.2 1997 HTML 4.01 1999 XHTML 1.0 2000 HTML5 2012 XHTML5 2013 带有 HTML5 DOCTYPE 的 HTML 文档: <!DOCTYPE html> HTML 4.01 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//
ISO-8859-1 (ISO Latin 1) Character Encoding Contents The characters at a glance Character codes and names Notes for html documents Other notes Additional references The characters at a glance Here are all the printable characters, in collating order: