php实现中文字符串截取各种问题

用php截取中文字符串会出现各种问题，做一简单汇总，文中的问题暂时还未解决，有大神解决了问题欢迎指教

 <?php

 header('Content-Type:text/html;charset=utf-8');//页面采用utf-8编码

 //header('Content-Type:text/html;charset=gbk');//页面采用gbk编码

 /**

  * 实现中文截取无乱码

  * @param $str:要截取的字符串

  * @param $start:开始位置

  * @param $length:截取长度

  * @return null|string

  */

  /*

   测试失败

   第一个函数:中文字符串截取会乱码

  */

  /*

 function GbSubstring($string,$start,$length){

     if(strlen($string)>$length){

         $str=null;

         $len=$start+$length;

         for($i=$start;$i<$len;$i++){

             if(ord(substr($string,$i,1))>0Xa0){

                 $str.=substr($string,$i,2);

                 $i++;

             }else{

                 $str.=substr($str,$i,1);

             }

         }

         return $str.'....';

     }else{

         return $string;

     }

 }

 $str1= GbSubstring('哈哈哈你好啊啊',1,3);

 echo $str1;

 */

 /*

  第二个函数测试成功

 */

 /**

  * 适用utf-8

  * @param $str

  * @param int $start

  * @param $length

  * @param string $charset

  * @param bool|true $suffix

  * @return string|void

  */

 /*

 function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)

 {

     if(function_exists("mb_substr"))

         return mb_substr($str, $start, $length, $charset);

     elseif(function_exists('iconv_substr')) {

         return iconv_substr($str,$start,$length,$charset);

     }

     $re['utf-8']   = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}/";

     $re['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/";

     $re['gbk']    = "/[x01-x7f]|[x81-xfe][x40-xfe]/";

     $re['big5']   = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/";

     preg_match_all($re[$charset], $str, $match);

     $slice = join("",array_slice($match[0], $start, $length));

     if($suffix) return $slice."…";

     return $slice;

 }

 echo msubstr('哈哈哈你好啊啊',1,3);

 */

 /*

  第三个函数:测试出错

 */

 /**

  * @param $string

  * @param $start

  * @param $length

  * @return string

  */

  /*

 function substr2($string, $start, $length)

 {

     $len = strlen($string);

     if($len > $length)

     {

         $str = '';

         $len1 = $start + $length; //截取到原字符串的位置

         for($i=$start; $i<$len1; $i++)

         {

             if(ord(substr($string, $i, 2)) > 0xa0) //在ASCII中，0xa0表示汉字的开始

             {

                 $str.=substr($string, $i, 2);

                 $i++;

             }

             else

             {

                 $str.=substr($string, $i, 1);

             }

         }

         return $str.'...';

     }

     else

     {

         return $string;

     }

 }

 echo substr2('哈哈哈你好啊啊',1,3);

 */

 /*

  第四个函数:测试出错

  */

  /*

 function chinesesubstr($str, $start, $len){

     $tmpstr=null;

     $strlen = $start + $len;

     for($i=0; $i<$strlen; $i++){

         if(ord(substr($str, $i, 1)) > 0xa0){

             $tmpstr .= substr($str, $i, 2);

             $i++;

         }else{

             $tmpstr .= substr($str, $i, 1);

         }

     }

     return $tmpstr;

 }

 $str = '哈哈哈你好啊啊';

 echo chinesesubstr($str, 1,4);

 */

 /*

  系统函数mb_substr测试成功

 */

 echo mb_substr('哈哈哈你好啊啊',1,4,"utf-8");

 ?>

php实现中文字符串截取各种问题的更多相关文章

Thinkphp 模板中直接对数据处理模板中使用函数中文字符串截取
1.Thinkphp 模板中直接对数据处理:{$data.name|substr=0,3} 2.中文字符串截取函数:mb_substr=0,14,'utf-8' 3.中文字符串统计:iconv_str ...
（实用篇）多个PHP中文字符串截取函数
字符串截取是一个非常常见的编程任务,而往往带中文的字符串截取会经常用到.虽然不难,但是自己写函数实现又耗费时间,这里介绍一个比较好用的字符串截取函数,能够胜任基本的需求了 <?php funct ...
PHP实现中文字符串截取无乱码
在我们学习PHP知识的过程中,PHP截取字符串应该是一个非常常见的字符串基础操作了,想必大家都比较熟悉这方面知识点. 但是有些新手朋友们可能遇到过,当截取中英文字符串时出现乱码的情况,其实这个也是非常 ...
PHP中文处理中文字符串截取(mb_substr)和获取中文字符串字数
一.中文截取:mb_substr() mb_substr( $str, $start, $length, $encoding ) $str,需要截断的字符串 $start,截断开始处,起始处为0 $l ...
(转)PHP中文处理中文字符串截取(mb_substr)和获取中文字符串字数
一.中文截取:mb_substr() mb_substr( $str, $start, $length, $encoding ) $str,需要截断的字符串 $start,截断开始处,起始处为0 $l ...
PHP中文字数限制：中文字符串截取(mb_substr)
一.中文截取:mb_substr() mb_substr( $str, $start, $length, $encoding ) $str,需要截断的字符串 $start,截断开始处,起始处为0 $l ...
Python中文字符串截取
#-*- coding:utf8 -*- s = u'中文截取' s.decode('utf8')[0:3].encode('utf8') # 结果u'中文截取延伸阅读: UTF-8中的汉字占用多少 ...
ruby -- 基础学习（八）中文字符串截取的函数
学习来源:http://www.codesky.net/article/200910/166595.html truncate(text, length = 30, truncate_string = ...
PHP 中文字符串截取
$str = "abcdef啊啊吧啊"; function my_sub($str, $st ,$len){ $ret = ""; for( $st; $len ...

随机推荐

getattribute()与getparameter()的区别
1.它们取到的值不同.getAttribute取到的是对象(object),而getParameter取到的是String. 2.数据传递路劲不同.request.getParameter方法传递的数 ...
Atitit 混合叠加俩张图片的处理图像处理解决方案 javafx blend
Atitit 混合叠加俩张图片的处理图像处理解决方案 javafx blend 1.1. Jhlabs 好像有了可以叠加算法,但是没有找到doc1 1.2. 自己算法叠加1 1.3. 使用javaf ...
Python - 001 - 类与实例间属性的理解
Python是个很灵活的语言,光看它的类和实例间属性的访问机制就可以看出这一点,不过这一点还真的不好理解,做了些测试之后我的理解是这样的: 实例在访问class属性时,先检索自己的names, 如果有 ...
How Google TestsSoftware - Part Three
Lots of questions in thecomments to the last two posts. I am not ignoring them. Hopefully many of th ...
Netty学习三：线程模型
1 Proactor和Reactor Proactor和Reactor是两种经典的多路复用I/O模型,主要用于在高并发.高吞吐量的环境中进行I/O处理. I/O多路复用机制都依赖于一个事件分发器,事件 ...
javaweb回顾第十一篇过滤器（附实现中文乱码问题）
1:过滤器概念过滤器就是一种在请求目标资源的中间组件,比喻把污水转换成纯净水中间需要一个污水净化设备,那么这个设备就好比一个过滤器.那么我用图来表示过滤器(可以有多个过滤器)运行的过程 2:Filt ...
通过Class获取标签，兼容的几种思路
在js中通过document.getElementsByClassName()在低版本IE浏览器中不兼容.然后我写了几种方案,大家可以参考参考. html代码 <!DOCTYPE html> ...
java坦克大战源码下载
HJZGG:https://github.com/hjzgg/hjzgg_tank_java 解压之后运行可执行jar包即可!效果图如下: v 1.游戏开始 v 2.选择地图 v 3.开始游戏 v 4 ...
Yii的学习(4)--Active Record
摘自Yii官网:http://www.yiiframework.com/doc/guide/1.1/zh_cn/database.ar 在官网原文的基础上添加了CDbCriteria的详细用法. 虽然 ...
Deep learning：四十(龙星计划2013深度学习课程小总结)
头脑一热,坐几十个小时的硬座北上去天津大学去听了门4天的深度学习课程,课程预先的计划内容见:http://cs.tju.edu.cn/web/courseIntro.html.上课老师为微软研究院的大 ...

php实现中文字符串截取各种问题

php实现中文字符串截取各种问题的更多相关文章

随机推荐

热门专题