C++面试八股文:std::string是如何实现的?
某日二师兄参加XXX科技公司的C++工程师开发岗位第18面:
面试官:
std::string
用过吧?二师兄:当然用过(废话,C++程序员就没有没用过
std::string
的)。面试官:
std::string("hello")+"world"
、"hello"+std::string("world")
和std::string("hello")+std::string("world")
的结果是什么?为什么?二师兄:前者和后者的结果都是
std::string
的对象,内容是“helloworld\0
”,而中间的这个表达式无法通过编译。原因是std::string
重载了operator+(const char*)
和operator+(const std::string&)
,但是const char*
却没有重载operator+
运算符。面试官:
std::string
有两个API
,resize
和reserve
,你知道它们之间的区别吗?二师兄:
resize
对应的是size
,resize
可以改变字符串的大小。reserve
对应的是capacity
,reserve
只能改变capacity
的大小。二师兄:当
resize
传入的参数小于字符串的szie
时,多余的字符串会被截取。当reserve
传入的参数小于capacity
时,reserve
什么也不会做。二师兄:当
resize
传入的参数大于字符串的szie
时,增加的字符串会被默认初始化。当reserve
传入的参数大于capacity
时,capacity
会被扩容。面试官:好的。可以通过下标访问
std::string
实例的内容吗?二师兄:可以的,
std::string
重载了下标运算符,可以像数组一样通过下标运算取出某个字符。面试官:你知道
std::string
的at
成员方法吗?二师兄: 嗯,和下标运算功能相似,不过不用担心越界问题。可以安全的访问字符串中的字符。
面试官:既然有
at
方法了,为什么还要重载下标运算符呢?二师兄:主要是因为性能上的考量。
at
虽然保证了不会超出字符串范围(超出范围抛出异常),但是性能低于下标操作。这就是有舍有得。为了安全使用at
,为了性能使用下标操作。C++给了你多个选择,如何选择看你的需求。面试官:那你知道
std::string
是如何实现的吗?二师兄:在
string
内部维护一个指针,这个指针指向真正的字符串的位置。面试官:能简单的写一下实现代码吗?
二师兄:好的。
class string
{
public:
string():size_(0),data_(nullptr){}
explicit string(const char* c)
{
size_ = strlen(c);
data_ = (char*)malloc(size_+1);
memset(data_,0,size_+1);
memcpy(data_,c,size_);
}
size_t size() const {return size_;}
const char* c_str() const {return data_;}
private:
size_t size_;
char* data_;
};
二师兄:在实现
append
或者+=
的时候,需要把当前字符的长度加上append
的内容的长度,以此长度申请一块新内存,然后把当前字符串的内存和append
的内容考入新申请的内存中。free
掉之前data_
指向的内存,然后把data_
指针指向新申请的内存。面试官:好的。这样的实现有一些弊端。如果频繁的对一个
std::string
对象append
内容,会发生什么?二师兄:是的,因为频繁的
malloc
和free
,会有性能问题。因所以编译器在实现std::string
的时候一般会预先申请一块大的内存,这块内存的长度是capacity
,当添加的字符串的长度加上当前的字符串长度小于capacity
时,直接添加到当前的块上即可。面试官:好的。针对字符串比较少的情况,一般编译器会做一些优化,你知道如何优化的吗?
二师兄:这个好像在哪看过,不记得额。。。
面试官:好的,今天的面试结束了,请回去等通知吧。
今天二师兄的表现不错,除了最后一个问题,基本上都答上来了。让我们来看下这个问题:
针对字符串比较少的情况,一般编译器会做一些优化,你知道如何优化的吗?
我们可以看看GCC中std::string
的实现:
typedef basic_string<char> string;
_Alloc_hider _M_dataplus;
size_type _M_string_length;
enum { _S_local_capacity = 15 / sizeof(_CharT) };
union
{
_CharT _M_local_buf[_S_local_capacity + 1];
size_type _M_allocated_capacity;
};
这里的_CharT
就是char
,所以_S_local_capacity
等于15
。当字符串的长度小于等于15
时,直接存在_M_local_buf
中,而不需要在堆中申请内存。当字符串长度大于15
时,在内存中申请一块内存,这块内存的起始地址保存在_M_dataplus
中,这块内存的容量保存在_M_allocated_capacity
中,而字符串的真实长度保存在_M_string_length
中。当向字符串中添加字符时,如果添加字符的长度大于 _M_allocated_capacity - _M_string_length
,则需要resize
,否则直接追加到_M_dataplus
保存的内存块中即可。
好了,今天的面试到这里就结束了。感谢小伙伴们的耐心阅读,咱们明天继续二师兄的面试之旅!
关注我,带你21天“精通”C++!(狗头)
C++面试八股文:std::string是如何实现的?的更多相关文章
- 《面试八股文》之 Redis 16卷
微信公众号:moon聊技术 关注选择" 星标 ", 重磅干货,第一 时间送达! [如果你觉得文章对你有帮助,欢迎关注,在看,点赞,转发] 大家好,我是 moon. redis 作为 ...
- 《面试八股文》之 JVM 20卷
微信公众号:moon聊技术 关注选择" 星标 ", 重磅干货,第一 时间送达! [如果你觉得文章对你有帮助,欢迎关注,在看,点赞,转发] 大家好,我是 moon. <面试八股 ...
- QString 和std::string互转
std::string cstr; QString qstring; //****从std::string 到QString qstring = QString(QString::fromLocal8 ...
- std::string的split函数
刚刚要找个按空格分离std::string的函数, 结果发现了stackoverflow上的这个问题. 也没仔细看, 直接拿来一试, 靠, 不对啊, 怎么分离后多出个空字符串, 也就是 "a ...
- could not deduce template argument for 'const std::_Tree<_Traits> &' from 'const std::string'
VS2008, 写一个简单的demo的时候出现了这个: 1>------ Build started: Project: GetExportTable, Configuration: Relea ...
- 源码阅读笔记 - 3 std::string 与 Short String Optimization
众所周知,大部分情况下,操作一个自动(栈)变量的速度是比操作一个堆上的值的速度快的.然而,栈数组的大小是在编译时确定的(不要说 C99 的VLA,那货的 sizeof 是运行时计算的),但是堆数组的大 ...
- CString std::string相互转换
CString->std::string 例子: CString strMfc=“test“; std::string strStl; strStl=strMfc.GetBuffer(0); s ...
- 计算std:string的字节长度
如果项目本身是使用 Unicode 字符集和utf8编码,std::string的length(),size()甚至是c的strLen取到的都是字节长度了,比如三个汉字,就是9, 以上情况不满足的话, ...
- 【原】error C2679: binary '<<' : no operator found which takes a right-hand operand of type 'std::string'
今天遇到一个非常难以排查的BUG,谷歌度娘都问过了依旧无解,最后自己重新尝试之后找到解决方案: 先看一下报错信息: 1>.\lenz.cpp(2197) error C2679: binary ...
- 类型安全且自动管理内存的返回 std::string 的 sprintf 实现
在这篇博文里,我提到了一个例子,说的是使用C++实现类型安全的printf.这个例子很惊艳,但是在我写程序的时候,并非那么"迫切"地需要它出现在我的工具箱中,因为它并不比普通的pr ...
随机推荐
- MySQL相关优质文章推荐
MySQL相关优质文章推荐 文章推荐 文章链接地址 MySQL高性能优化系列 MySQL字符集及校对规则的理解 MySQL InnoDB锁机制全面解析分享 MySQL事务隔离级别和MVCC,MVCC文 ...
- SRS+Docker部署教程
SRS+Docker部署教程 安装Docker Windows安装docker 安装Hyper-V Hyper-V 是微软开发的虚拟机,类似于 VMWare 或 VirtualBox,仅适用于 Win ...
- 迁移学习《Efficient and Robust Pseudo-Labeling for Unsupervised Domain Adaptation》
论文信息 论文标题:Efficient and Robust Pseudo-Labeling for Unsupervised Domain Adaptation论文作者:Hochang Rhee.N ...
- [ElasticSearch]修改开源安全组件Search Guard-6 用户密码
ES有很多的安全组件可用,例如: X-pack,Sarch Guard.但目前开源免费的,仅Search Guard. 1 前置条件 Elastic Search 6 服务安装成功,且成功运行. ES ...
- MordernC++之左值(引用)与右值(引用)
左值与右值 C++中左值与右值的概念是从C中继承而来,一种简单的定义是左值能够出现再表达式的左边或者右边,而右值只能出现在表达式的右边. int a = 5; // a是左值,5是右值 int b = ...
- CentOS 7 更改内网 IP
打开网络配置文件 vim /etc/sysconfig/network-scripts/ifcfg-em2 修改配置文件如下 TYPE=Ethernet PROXY_METHOD=none BROWS ...
- C++ 基于Capstone实现反汇编器
Capstone是一个反汇编框架,提供了一个简单.轻量级的API接口,可透明地处理大多数流行的指令体系,包括x86/x86-64.ARM及MIPS等.Capstone支持C/C++和Python,并且 ...
- 第7章. 部署到GiteePages
Gitee Pages 是一个免费的静态网页托管服务,您可以使用 Gitee Pages 托管博客.项目官网等静态网页.如果您使用过 Github Pages 那么您会很快上手使用 Gitee 的 P ...
- 通过重构来加深理解——DDD
上部分模型驱动设计的构造块为维护模型和实现之间的关系打下了基础.在开发过程中使用一系列成熟的基本构造块并运用一致的语言,能够使开发工作更加清晰而有条理. 我们面临的真正挑战是找到深层次的模型,这个模型 ...
- laravel框架三级联动,详细代码
这里运用到省份表中,下面是效果图 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 需要一个省份表,里面的字段要有个pid,name这些字段 下面是控制器代码,(Cit ...