C#怎么去除带BOM的UTF-8

2024-08-31

【C# IO 操作】详解去掉字符顺序标记（BOM）头的方法

类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM).它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码.对于一般的文件,这样并不会产生什么麻烦.但对于 PHP来说,BOM是个大麻烦. PHP并不会忽略BOM,所以在读取.包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分.根据嵌入式语言的特点,这串字符将被直接执行(显示)出来.由此造成即使页面的 top padd

UTF8最好不要带BOM，附许多经典评论

UTF-8 不需要 BOM,尽管 Unicode 标准允许在 UTF-8 中使用 BOM.所以不含 BOM 的 UTF-8 才是标准形式,在 UTF-8 文件中放置 BOM 主要是微软的习惯(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯).BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte order).微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 A

UTF8文件带BOM引起的问题

起因是公司iOS端竟然加载除了HTML代码,百思不得其解,查文献,原来如此... UTF-8 不需要 BOM,尽管 Unicode 标准允许在 UTF-8 中使用 BOM.所以不含 BOM 的 UTF-8 才是标准形式,在 UTF-8 文件中放置 BOM 主要是微软的习惯(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯).BOM(byte order mark)是为 UTF-16 和 UTF-32 准备的,用于标记字节序(byte or

JSON字符串带BOM头"ufeff"

调用三方接口返回值JSON字符串带BOM头"\ufeff",JSON解析死活报错. 我是用SpringBoot的RestTemplate调用三方接口的,一开始返回值我是用对象接收返回值,发现一直报错,我以为是RestTemplate的接收转换有问题,就将返回值换成了String类型去接收.接收到字符串后再转JSON.JSON字符串解析死活报错. 接口返回值日志如下: 2020-03-25 13:18:55.687 DEBUG 8595 --- [ main] o.s.web.clien

[Python] UTF-8最好不要带BOM

一.问题回顾: 问题: 在写一个脚本读入IP分区表文件到list并做比较的时候,发现该成立的语句总是不成立,经调试后发现开头是这样:\xef\xbb\xbf1.0.3.0,故比较不成功. 解决办法:经查询后发现,\xef\xbb\xbf 是utf-8编码带BOM的标识,把文件转化为不带BOM的utf-8后,脚本正常. 用VIM去掉UTF-8方法: '去掉utf-8 BOM :set nobomb '保留utf-8 BOM :set bomb 二.UTF-8最好不要带BOM说明 BOM——Byte

php怎么解析utf-8带BOM编码的json数据，php解析json数据返回NULL

今天遇到一个问题,json_decode解析json数据返回null,试了各种方法都不行,最后发现,原来是json文件编码的问题. 当json_decode解析utf-8带BOM格式的json数据时,会返回null. json_decode函数能够接收utf8编码的参数,但是当参数中包含BOM时,json_decode就会失效. 这个函数能将给定的字符串转换成UTF-8编码,移除其中的BOM. 下面是PHP代码: function prepareJSON($input) { //This wil

php -- PHP5中file_get_contents函数获取带BOM的utf-8文件内容

最近,在用file_get_contents函数来取得文本的内容的时候,出现了一个情况(如下),苦思冥想了n久,不得其解,最后,果然还是得靠百度啊..... 百度到一个解释,下面是原文: PHP5中的file_get_contents函数获取文件内容,实际是按二进制来读取的,所以,当你用file_get_contents去获取一个带BOM的UTF-8文件时,它并不会把UTF-8的BOM去掉,当你把读取的内容当作文本内容来进行一些操作时,可能会发生一些意想不到的结果.这并不能算作一个BUG,因为f

utf 8无bom和utf 8什么区别

今天在上传CSV文件的时候,Windows下调试一切正常.妈的一到Linux下面,就出现问题,第一行数据总是读取不出来, 利用print_r()打印出读取文件的内容,发现有一个很奇怪的字符在作怪.为什么第一个字符会出现重叠的问题呢.经排除发现是文件的编码格式不对. 在Windows下面,转码后的CSV的编码格式为以带BOM的UTF-8格式编码,在Linux下面不支持BOM,因此在notepad++里面讲文件的格式转换成不在BOM的UTF-8格式编码,再次上传文件,在Linux下面运行一切正常.

python 带BOM头utf-8的响应解码

接口响应编码格式为带BOM头utf-8.直接获取响应的text出现乱码. '''dinghanhua2018-11requests text与content,指定响应的encoding''' api = 'http://testapi'response = requests.get(api) print(response.text) 乱码解决方式: 1 获取content再用utf-8-sig decode. 2 指定响应的编码格式为utf-8-sig.再获取text. 1 指定respo

C# UTF-8文件带BOM和不带BOM文件的转换

读取INI文件使用的是GetPrivateProfileString方法,自己读写ini文件没有问题. 调用C++的API对同一个ini文件进行处理后,发现首个Section的值读不出来:发现是API更改了ini文件格式. 原本C#进行读写的ini文件是UTF-8不带BOM的格式,C++ API写值后将ini文件格式改为UTF-8带BOM. API那边没有办法更改,GetPrivateProfileString我也不知道该怎么设定成带BOM的格式: 只能自己转换文件格式,转换方法如下: //以U

PSR-1之PHP代码文件必须以不带BOM的UTF-8编码

BOM——Byte Order Mark,就是字节序标记在UCS 编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE“的字符,它的编码是FEFF.而FFFE在UCS中是不存在的字符,所以不应该出现在实际传输中. UCS规范建议我们在传输字节流前,先传输字符”ZERO WIDTH NO-BREAK SPACE“. 如果接收者收到FEFF,就表明这个字节流是大字节序的:如果收到FFFE,就表明这个字节流是小字节序的.因此字符”ZERO WIDTH NO-BREAK SPACE“

去除文件BOM头工具

<?php /** * 用法:复制以下代码至新建的php文件中,将该php文件放置项目目录,运行即可.代码来源于网络. * chenwei 注. */ header('content-Type: text/html; charset=utf-8'); $auto=1;/* 设置为1标示检测BOM并去除,设置为0标示只进行BOM检测,不去除 */ $basedir='.'; $loop=true; echo '当前查找的目录为:'.$basedir.'当前的设置是:'; echo '(1)',$l

一键去除网页BOM属性【解决乱码，头部空白，&#65279问题】

几个常出现的问题: 1.网站打开空白 2.页面头部出现多余的空白 3.网站出现乱码,如“锘�” 解决方法可以是: 1.选用专业的编辑器,例如notepad++,sublime,editplus这样不会自动签名. 2.sublime通过如下操作File -> Save with Encoding -> UTF-8保存后即可去除bom 3.notepad++选中格式 -> 以UTF-8格式编码选项即可去除 <?php if (isset($_GET['dir'])){ //设置文件目

php去除文件bom头

有时候在ajax返回的json数据前多出一些不明的字符,就是所谓的bom头,导致javascript解析json格式失败,下面贴出一段PHP代码实现检测和去除bom头. <?php header('content-Type: text/html; charset=utf-8'); if (isset($_GET['dir'])) { //设置文件目录,如果没有设置,则自动设置为当前文件所在目录 $basedir = $_GET['dir']; } else { $basedir = '.'; }

关于UTF8文件带BOM头可能会引起的错误解析

今天在做一个文件上传的项目中碰到了一个十分奇怪的问题,在解析上传上来的csv文件时,总是在解析第一行的第一个标题字段时出错,就是第一个那个字段总是和对应的model字段对应不上,这个坑是真的很深,找了半天,发现原来utf8编码格式的文件可能会有BOM头这玩意儿! 我们先来看看什么是BOM头: 在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码. 现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-

带BOM头文件解析

在java中apache提供了一个工具类BOMStream,在获取文件流时,将获取到的文件流转化成为BOM流: InputStreamReader is = new InputStreamReader (new BOMInputStream (fileInputStream), "utf8"); 这种方法只能过滤掉UTF-8/UTF-16LE/UTF-16BE三种编码格式的文件,当文件是其他格式时,就会失效.只能使用另外一个工具了:UnicodeStream和UnicodeReader

UTF8最好不要带BOM

摘自:http://www.cnblogs.com/findumars/p/3620078.html 几周前还在为BOM的问题苦恼着...正如@梁海所说,“不含 BOM 的 UTF-8 才是标准形式”,的确是这样,无BOM使用得更多些,所以个人还是推荐一般情况下用无BOM的形式吧,除非有问题的时候,再考虑换有BOM的.Windows系统保存的都是有BOM的,所以你可以看到,用记事本保存一个UTF-8的txt,其实是有BOM的,这一点需要注意.另外不同的文本编辑器对于有无BOM的称呼也略有不同

php 批量去除项目文件bom头

<?php if (isset($_GET['dir'])) { //设置文件目录 $basedir = $_GET['dir']; } else { $basedir = '.'; } $auto = 1; checkdir($basedir); function checkdir($basedir) { if ($dh = opendir($basedir)) { while (($file = readdir($dh)) !== false) { if ($file != '.' &&

json_decode 解析带BOM头文件错误

//取前三个字符并转化为ASCII 判断是否为BOM文件 $charset[1] = substr($result, 0, 1); $charset[2] = substr($result, 1, 1); $charset[3] = substr($result, 2, 1); if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) { $result = sub

PHP批量去除文件BOM头

auto 是否自动替换默认否 dir 检查目录默认./ display 是否显示所有文件默认只显示有bom头的文件 <?php empty($_GET['auto']) && $_GET['auto'] = 0; empty($_GET['dir']) && $_GET['dir'] = './'; empty($_GET['display']) && $_GET['display'] = 0; $basedir = $_GET['dir'];

file_get_contents带bom

$dmText = file_get_contents( AROOT .'data' . DS . 'DMType.json.php'); if(preg_match('/^\xEF\xBB\xBF/',$dmText)) { $dmText = substr($dmText,3); } //trim $dmText = t($dmText); echo $dmText; /* create array list from comments */ $dmList = json_d

C#怎么去除带BOM的UTF-8

热门专题