javascript 高效按字节截取字符串
做为一个前端开发人员在网页展示中经常会碰到,标题过长,需要截取字符串,用CSS的实现的话各种兼容问题,各种坑。
让后台程序截一下,又各种推托,让后台按字节截一下更是和要了后台老命一样,最后可能只会安字符长度给你截一下,最后不好看,对不齐,还是回头整CSS、调兼容;
有以上有感触的前端同学默默点个赞吧。
最近接触一个项目,后台只提供接口(json),所有页面的数据渲染,数据绑定都都交给了前端。终于,不考虑SEO,页面所有的主动权到偶的手中了,不经意间就碰到字节截取老问题了。
网络上流传一个Javascript简单获取字节长度的方法:
- String.prototype.Blength = function(){//返回字符串字节长度
- return this.replace(/([^\x00-\xFF])/g, "aa").length;
- };
确实很简单,大于ASCII码的字符都算做两个字节,虽然严格来说不正确,但我们是用来辅助展示效果的,真严格起来反而不好了,
但总感觉为了一点投机取巧,而用正则这种较耗时东西不太好,其实也就节省了两行代码,所以我决定还是用正常方式计算:
- function getBlength(str){
- for(var i=str.length,n=0;i--;){
- n += str.charCodeAt(i) > 255 ? 2 : 1;
- }
- return n;
- }
我并没有把方法扩展到String对像的原型上去,还是因为效率问题,以下是测试代码:
- //扩展到String的prototype上
- String.prototype.Blength = function () {
- var str = this,
- n = 0;
- for (var i = str.length; i--; ) {
- n += str.charCodeAt(i) > 255 ? 2 : 1;
- }
- return n;
- }
- //给String对像增加一个方法
- String.getBlength = function (str) {
- for (var i = str.length, n = 0; i--; ) {
- n += str.charCodeAt(i) > 255 ? 2 : 1;
- }
- return n;
- }
- //先构造一个中英混合的长字符串
- var str = "javascript 高效按字节截取字符串方法 getBlengthjavascript 高效按字节截取字符串方法 getBlength";
- str = str.replace(/./g, str).replace(/./g, str);
- console.log("创造的字符串长度为:",str.length)
- console.log("-------------测试开始--------------")
- console.log("str.Blength() >> ",str.Blength())
- console.log("String.getBlength(str) >> ",String.getBlength(str))
- console.log("--效率测试开始--")
- var time1 = new Date()
- for(var i=0;i<100;i++){
- str.Blength()
- }
- console.log("Blength耗时:",new Date() - time1);
- var time2 = new Date()
- for(var i=0;i<100;i++){
- String.getBlength(str)
- }
- console.log("getBlength耗时:",new Date() - time2);
结果效率差的不是一点半点,至于原因可能时间花费在了原型链的检索上了,我没有深究,知道的可以留言告诉我:
- 创造的字符串长度为: 314432
- -------------测试开始--------------
- str.Blength() >> 425408
- String.getBlength(str) >> 425408
- --效率测试开始--
- Blength耗时: 1774
- getBlength耗时: 95
现在要截取字符串的基础函数有了,因为在这种情况下字符占的字节长度最长为2,所以用二分法来找到合适截取位置是再好不过了。
给一个效率应该算不错的截取函数:
- //简单计算字节长度
- String.getBlength = function (str) {
- for (var i = str.length, n = 0; i--; ) {
- n += str.charCodeAt(i) > 255 ? 2 : 1;
- }
- return n;
- }
- //按指定字节截取字符串
- String.cutByte = function(str,len,endstr){
- var len = +len
- ,endstr = typeof(endstr) == 'undefined' ? "..." : endstr.toString();
- function n2(a){ var n = a / 2 | 0; return (n > 0 ? n : 1)} //用于二分法查找
- if(!(str+"").length || !len || len<=0){return "";}
- if(this.getBlength(str) <= len){return str;} //整个函数中最耗时的一个判断,欢迎优化
- var lenS = len - this.getBlength(endstr)
- ,_lenS = 0
- , _strl = 0
- while (_strl <= lenS){
- var _lenS1 = n2(lenS -_strl)
- _strl += this.getBlength(str.substr(_lenS,_lenS1))
- _lenS += _lenS1
- }
- return str.substr(0,_lenS-1) + endstr
- }
拿上面的字符串来测试一下,应该是载得越长越耗时,截个20W的长度试试:
- console.log("创造的字符串长度为:",str.length," 字节长度为:",String.getBlength(str))
- console.log("-------------测试开始--------------")
- console.log("String.cutByte('1开始1',6,'...') >> ",String.cutByte('1开始1',6,'...'))
- console.log("String.cutByte(str,12,'...') >> ",String.cutByte(str,12,'...'))
- console.log("String.cutByte(str,13,'..') >> ",String.cutByte(str,13,'..'))
- console.log("String.cutByte(str,14,'.') >> ",String.cutByte(str,14,'.'))
- console.log("String.cutByte(str,15,'') >> ",String.cutByte(str,15,''))
- console.log("--效率测试开始--")
- var time1 = new Date()
- for(var i=0;i<100;i++){
- String.cutByte(str,200000,'...')
- }
- console.log("耗时:",new Date() - time1);
输出结果:
- 创造的字符串长度为: 314432 字节长度为: 425408
- -------------测试开始--------------
- String.cutByte('1开始1',6,'...') >> 1开始1
- String.cutByte(str,12,'...') >> javascrip...
- String.cutByte(str,13,'..') >> javascript ..
- String.cutByte(str,14,'.') >> javascript 高.
- String.cutByte(str,15,'') >> javascript 高
- --效率测试开始--
- 耗时: 155
其实把截取字符长度改到30W 40W的耗时也差不了多少,在二分法面前,这都是一个级别的
对比之前的计算字节长度的耗时,用二分法查找截取只消耗了不到两次字节长度的记算的时间.
最后,同学们,来挑战一下效率吧!
2014年4月24日补充:
因为一般来说,超长的占位符一般长度很小,所以把函数再改了一下,取消了一开始就比较 str的字节长 和 len的大小,而是等二分法查询完成之后,比较被截掉的字符串和站位符的长度。
这样,在多数情况下,特别是在处理大字符串的时候,效率会有质的提升。
- String.cutByte = function (str, len, endstr) {
- var len = +len,
- endstr = typeof(endstr) == 'undefined' ? "..." : endstr.toString(),
- endstrBl = this.getBlength(endstr);
- function n2(a) {var n = a / 2 | 0; return (n > 0 ? n : 1)}//用于二分法查找
- if (!(str + "").length || !len || len <= 0) {
- return "";
- }
- if(len<endstrBl){
- endstr = "";
- endstrBl = 0;
- }
- var lenS = len - endstrBl,
- _lenS = 0,
- _strl = 0;
- while (_strl <= lenS) {
- var _lenS1 = n2(lenS - _strl),
- addn = this.getBlength(str.substr(_lenS, _lenS1));
- if (addn == 0) {return str;}
- _strl += addn
- _lenS += _lenS1
- }
- if(str.length - _lenS > endstrBl || this.getBlength(str.substring(_lenS-1))>endstrBl){
- return str.substr(0, _lenS - 1) + endstr
- }else{
- return str;
- }
- }
用上面的测试例子测试的结果如下:
- 创造的字符串长度为: 314432 字节长度为: 425408
- -------------测试开始--------------
- String.cutByte('1开始1',6,'...') >> 1开始1
- String.cutByte(str,12,'...') >> javascrip...
- String.cutByte(str,13,'..') >> javascript ..
- String.cutByte(str,14,'.') >> javascript 高.
- String.cutByte(str,15,'') >> javascript 高
- --效率测试开始--
- 耗时: 72
转载请注明出处 http://www.cnblogs.com/whyoop,谢谢!
javascript 高效按字节截取字符串的更多相关文章
- java基础知识回顾之---java String final类普通方法的应用之“按照字节截取字符串”
/*需求:在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符.但对应的字节数不同,一个汉字占两个字节.定义一个方法,按照最大的字节数来取子串.如:对于“ab你好”,如果取三 ...
- C#、Java实现按字节截取字符串包含中文汉字和英文字符数字标点符号等
C#.Java实现按字节截取字符串,字符串中包含中文汉字和英文字符数字标点符号等. 在实际项目应用过程中,尤其是在web开发时可能遇到的比较多,就以我的(JiYF笨小孩管理系统)为例,再发布文章时候, ...
- Java中根据字节截取字符串
一.简介 为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节. 代码点值:与Unicod ...
- Java按字节截取字符串(GBK编码、UTF-8编码实现)
package FileDemo; import java.io.IOException; public class CutStringTest { /** * @param args * @thro ...
- JavaScript:在JS中截取字符串的方法
这篇主要说一说截取字符串的方法,用于帮助自己缕清方法的作用,参数的意义,返回值,是否对于原来的字符串进行了操作等. 在javascript中,常见的截取字符串的方法有slice().substring ...
- java练习:质数,匿名内部类创建接口,抽象类派生子类,画圆,字节截取字符串,数字变钱币,五子棋,梭哈
java学习-质数的孤独 正在看质数的孤独,,,于是写了一个练习代码,输出1-100之间的质数 代码比较烂.待完善吧. 这里用到了continue和break,continue指结束当前轮次循环,跳入 ...
- IO练习--按字节截取字符串
* 在Java中字符串“abcd”和字符串“ab你好”都是4个字符, * 但是字节数不同,因为GBK中一个汉字占两个字节 * 定义一个方法用来按字节数截取字符串. * 如:对于“ab你好”,取3个字节 ...
- JavaScript进阶(七)JS截取字符串substr 和 substring方法的区别
JS截取字符串substr 和 substring方法的区别 substr方法 返回一个从指定位置开始的指定长度的子字符串. stringvar.substr(start [, length ]) 参 ...
- [JavaScript] 根据指定宽度截取字符串
/** * 根据指定宽度截取字符串 * @param desc 原始字符串 * @param width 该显示的宽度 * @param fontsize 字体大小 12px * @returns { ...
随机推荐
- Windows窗体应用程序(非Console)使用libuv实现简单的异步WEB服务器
libuv是一个很强大的异步处理框架(严格意义上不能叫框架,其实就是一组异步函数库,当然框架这东西有各种各样的定义和理解_^...),最初的的目的是用于NODEJS的异步处理,不过因为它是一个独立的项 ...
- 移动端 js touch事件
随着智能手机和平板电脑的普及, 越来越多的人用移动设备浏览网页,我们平时在pc浏览器上用的鼠标事件,比如:click, mouseover等, 已经无法满足移动设备触摸屏的特点,触摸时代的到来,离不开 ...
- HDU 5593 ZYB's Tree 树形dp
题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=5593 题意: http://bestcoder.hdu.edu.cn/contests/contes ...
- 【CodeForces】【311C】Fetch the Treasures
最短路 神题一道…… //CF 311C #include<queue> #include<cstdio> #include<cstdlib> #include&l ...
- JDBC编程步骤
JDBC编程步骤 加载数据库驱动. 通常使用Class类的forName()静态方法来加载驱动. Class.forName(driverClass) dirverClass: mysql---Cla ...
- 小试牛刀MVC简单网页
上次我们创建了第一个MVC的网站,没用下,这次就简单来运行下,首先大家要去理解下MVC模式到底什么关系.在这里我就不多说,直接创建一个网页,用来显示一些数据,数据库的话我就先简单用这样创建先,为了方便 ...
- Scrum敏捷软件开发之技术实践——测试驱动开发TDD
重复无聊的定义 测试驱动开发,英文全称Test-Driven Development,简称TDD,是一种不同于传统软件开发流程的新型的开发方法.它要求在编写某个功能的代码之前先编写测试代码,然后只编写 ...
- easyui 页签
昨天开始搭后台框架,到晚上的时候遇到了一个现在觉得挺可笑但是当时一直很纠结很纠结的问题,这个问题刚刚解决出来,把它拿出来说说,让自己长点儿记性,希望大家不要犯我这个错误啊 在backstage.jsp ...
- 常见的NoSql系统使用场景分析--转载
•Cassandra •特性:分布式与复制的权衡\根据列和键范围进行查询\BigTable类似的功能:列,列族\写比读快很多 •最佳适用:写操作较多,读比较少的时候.如果你的系统都是基于Java的时候 ...
- SGU101
Dominoes – game played with small, rectangular blocks of wood or other material, each identified by ...