摘要: C语言的基本数据类型,大家从学生时代就开始学习了,但是又有多少人会试图从底层的角度去学习呢?这篇文章会用一问一答的形式,慢慢解析相关的内容和困惑。

本文分享自华为云社区《从深入理解底层的角度学习C语言之基本数据类型》,作者: breakDawn 。

C语言的基本数据类型,大家从学生时代就开始学习了,但是又有多少人会试图从底层的角度去学习呢?这篇文章会用一问一答的形式,慢慢解析相关的内容和困惑。

  1. 数据类型位数和符号
  2. 数据类型转换
  3. 浮点数

数据类型位数和符号

Q: C里的signed 和unsigned类型的区别是什么?

A:拿unsigned char无符号char 和 signed char有符号char举例(因为他们都是1字节,比较好举例子)

假设某个局部变量a,内存里存的都是0xff(即二进制11111111)

执行printf("%d",a)时, 输出的是255,还是-1呢?

如果a是无符号,那就是255。

如果a是有符号,那就是-1。

Q:为什么有符号的0xff输出的是-1?
A:这个就是补码的概念。

正数的补码就是其本身
负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后+1. (即在反码的基础上+1)

  • 补码的计算方式:如果是-1,则负号就是首位的“1”, 而“-1”里的1作为二进制是0000001,取反+1,得到1111111, 和首位1拼接,变成了11111111.
  • 进行printf打印时,C语言通过变量类型,确认11111111的首位是符号位,于是通过补码的反向计算,得到实际真值为-1。
  • 如果是无符号,则C语言通过变量类型,确认11111111的首位不是符号位,不需要反向计算,于是直接输出255。

原码、反码、补码对于+1和-1的表示如下
[+1] = [00000001]原 = [00000001]反 = [00000001]补
[-1] = [10000001]原 = [11111110]反 = [11111111]补

Q: 已知正负数默认都是补码的形式,为什么不能用原码表示数字呢?即只用第一个标识符号位,后面7位就是代表真实绝对值
A:计算机CPU做计算时,无法区别符号位,只会死板的将8位数字进行加法计算。
假设做减法,就和下面那样
1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2
可以看到符号位的信息会误导减法的计算。

Q: 那为什么不用能反码呢
A:因为反码对于0的表示有两种情况,11111111可以代表-0,而00000000代表+0,相当于浪费了。
而补码不存在这个情况。11111111代表-1,00000000代表0。

Q: 为什么要有补码?补码有什么好处?
A:当计算机执行1 - 1时, 希望都是用加法的动作来做,且不希望做if-else判断,根据符号位去判断正负再做加减,对计算机的消耗是很大的。

使用补码的机制,则可以将1-1转成变成1+(-1)
那么-1就是补码0xff,和0x01相加,变成了0,即不需要做真正的减法即可

Q: 刚才提到CPU希望都是位加法,不肯做减法,为什么?
A:因为CPU的减、乘、除都是基于加法、移位等操作实现的。
加法过程依赖CPU的ALU累加器,累加器背后的电路是数字电路异或门和与门的组合。

Q: 为什么补码表示的情况下,范围是-128到127?为什么补码会比原码和反码多一位?
A:就是上面提到的0的问题。原码的10000000、00000000都表示0,补码的11111111和00000000都表示0,而补码只有1个0的表示

同时补码有一个100000000, 把后7位取反+1,等同于-128。

原码、反码、补码知识详细讲解(此作者是我找到的讲的最细最明白的一个)

Q: 计算机在CPU做计算时,怎么识别是无符号还是有符号?
A:CPU 所处理的寄存器、内存中的数本身无符号信息。CPU 做加减法时会一起做无符号数的进位/有符号数的溢出标志,并不专门对待有符号数和无符号数。

有无符号的区别是只属于(中)高级语言的概念,反映到机器语言上,是跟运算及与其结果相关的指令上的区别,而不会反映到 CPU 所处理的数本身。

即CPU处理时,统一用加法处理,但是否要做求补等操作,取决于提供的运算指令。

Q: C语言的char是signed char还是unsigned char?
A: 当你定义为char时, 可能是signed char,也可能是unsigned char。

这个取决于你编译器的实现。
-funsigned-char : 设置为 unsigned char
-fno-signed-char : 设置为 非 signed char
-fsigned-char : 设置为 signed char
-fno-unsigned-char : 设置为 非 unsigned char

Q: int有可能像char一样,即可能是signed int也可能是unsigned int吗?
A:int一定是有符号int。不会因为编译器不同而不同。

Q: 为什么char可以区分有符号或者无符号,但是int只能默认为signed int ?
A:个人理解和应用场景有关,char不一定会参与计算,而int大部分情况下都是有符号计算,因此默认为signed int比较好。

Q: ILP32、LP64、LLP64分别是什么?
A:指的是这个操作系统中,有哪些类型分别是多少位的意思。
I指int
L指long
LL指long long
P指point指针
32和64就是分别指32位和64位。

  • 32位系统一定是ILP32模型
  • 64位系统中,unix一般是LP64,而windows则是LLP64
    即linux中,long是64位, 而在windows中,long是32位,而只有long long是64位

Q: 为什么windos要用LLP64这么奇怪的模型?这个模型里, long是32位,long long 才是64位。
A:来自知乎陈硕大佬的回答:

我猜,是因为 Windows API 从 16-bit 升级到 32-bit 发生得太晚了——大约是随 1995 年发布的 Windows 95 而普及 。

虽然之前有 Windows NT 3.x 和 Win32s,但似乎比较小众。

而 Unix 从 16-bit 升级到 32-bit 发生在 1980 年前后,当时运行在 VAX 上的 Unix/32V 和 3BSD 都是 32-bit 的。

造成的结果是,两边的程序对 short/int/long 的长度形成了不同的习惯认知:

Unix 程序习惯了 int 是 32-bit,而 long 不一定只有 32-bit。Windows/DOS 习惯了 long 是 32-bit,而 int 有可能是 16-bit 或 32-bit,因为刚刚从 16-bit 升级上来嘛。

当往 64-bit 升级的时候,如果把 Windows 的 long 升级到 64-bit,会破坏原来很多程序的假设,只好用个新的类型来表示 64-bit 整数了。反正 LONGLONG 在 32-bit 程序中也是 64-bit 整数,干脆用它好了。

详细的数据类型展示:

PS: 从上面可以看到java虚拟机的一个优势,就是对开发者而言,屏蔽了各不同系统情况下的数据位数。

Q: 那么又有个问题,java虚拟机如何实现不同平台可以跑相同的java代码,不用担心底层数据类型的?
A:如图所示,class字节码都是同一份,但是不同的系统,会有不同的虚拟机解释器实现,在解释器实现里处理了不同的数据类型位数情况。

数据类型转换

Q: C里的隐式类型转换有什么规律?
A:

  • 占用字节数少的类型,向占用字节数多的类型转换;
    int->long
  • 占用字节数相同情况下,有符号向无符号转换;
    int->unsigned int
  • 整数类型向浮点类型转换;
    int -> double
  • 单精度向双精度转换;
    float->double

Q: 下面这个例子输出多少,为什么?
A:

void Test()
{
int a = -1;
unsigned b = 10; if (a > b)
{
printf("a is greater than b.\n");
}
else
{
printf("a is less than or equal b.\n");
}
}

输出a>b即a is greater than

因为a=-1,存储的二进制是11111111, 强转成unsigned时,二进制没有变,但是对编译器而言表示的大小变成了255了。

浮点数

float、double、long double的比特数、有效位数、数值范围如下:

Q: 下面这个代码输出什么?

#include <stdio.h>
int main(void)
{
float a = 9.87654321;
float b = 9.87654322;
if(a > b)
{
printf("a > b\n");
}
else if(a == b)
{
printf("a == b\n");
}
else
{
printf("a < b\n");
}
return 0;
}

A:输出"a=b", 因为float最多7位有效小数点位数。

Q: 32位float,1bit为符号位,23bit为位数,8bit为指数, 这3个划分是如何得到float的有效位数以及数值范围的?
A:IEEE754标准理解。

【计算机组成原理】IEEE754标准

有人问为什么要学习这个?

对于高精度场景下的浮点计算,掌握IEEE754的标准很重要,否则无法理解高精度场景时计算过程出现的各种问题, 特别是一些金融场景,对于小数点后面的数字会特别敏感。

Q:java的BigDecimal类可以表示任意精度,原理是啥?

A:BigDecimal的原理很简单,就是将小数扩大N倍,转成整数后再进行计算,同时结合指数,得出没有精度损失的结果。

以long型的intCompact和scale来存储精确的值。

点击关注,第一时间了解华为云新鲜技术~

换个角度带你学C语言的基本数据类型的更多相关文章

  1. C语言和C++的应用领域都在哪些?学C语言好,还是学习C++好?

    从事嵌入式开发十几年,基本上围绕着这两种编程语言展开,都可以直接操作底层的编程语言,用的越熟练越是感觉工具属性越强.虽然两种编程语言分属于不同的编程思想,用的时间长了觉得差异也不是很大,现在就个人的从 ...

  2. 带你学C带你飞!

    C语言免费课程推荐:带你学C带你飞! 想学习C语言,首先就要了解什么是C语言: C语言是一门通用计算机编程语言,应用广泛.C语言的设计目标是提供一种能以简易的方式编译.处理低级存储器.产生少量的机器码 ...

  3. 我是先学C语言还是先学C++,实不相瞒,鱼和熊掌可兼得!

    这是最近一周时间几个读者小伙伴所提的问题,我顺手截了两个图. 实不相瞒,这类问题之前也经常看到.     每次遇到这种问题,看起来很简单,但是打字一时半会还真说不清,想想今天周末了,写一篇文章来统一聊 ...

  4. 小C的故事(快速学C语言,,,极速版!)

    前几天这篇博客写了太多废话! 删啦~~. 本篇博客只是为chd A协的全嫩小鲜肉入门C语言的预科, 如果你在此处学习C语言, 不幸走火入魔, 小弱概不负责. //请直接随便找个C语言编译器,抄一下下面 ...

  5. 边看MHA源码边学Perl语言之一开篇

    边看MHA源码边学Perl语言之一开篇 自我简介 先简单介绍一下自己,到目前为此我已经做了7年左右的JAVA和3年左右php开发与管理,做java时主要开发物流行业的相关软件,对台湾快递,国际快递,国 ...

  6. 快看Sample代码,速学Swift语言(1)-语法速览

    Swift是苹果推出的一个比较新的语言,它除了借鉴语言如C#.Java等内容外,好像还采用了很多JavaScript脚本里面的一些脚本语法,用起来感觉非常棒,作为一个使用C#多年的技术控,对这种比较超 ...

  7. 我要带徒弟学写JAVA架构,引路架构师之路(Jeecg开源社区)

    带徒弟学JAVA架构(Jeecg社区)      Java程序员如何打破工作2,3年的瓶颈问题,如何更上一层楼?      太多的巧合,让我接触到了开源,通过JEECG与很多朋友交流后,让我有了帮助别 ...

  8. 【凯子哥带你学Framework】Activity界面显示全解析(下)

    咱们接着上篇继续讲,上篇没看的请戳:[凯子哥带你学Framework]Activity界面显示全解析(上) 如何验证上一个问题 首先,说明一下运行条件: //主题 name="AppThem ...

  9. 我为什么要学Go语言

    # 我为什么要学Go语言 ### 公司的强烈推荐---之前也了解过Go语言并没有觉得有什么了不起,Go能做的其他语言都能做. ### 网上查找学习Go语言的理由---网上大体有两类人,一类说Go是大公 ...

随机推荐

  1. java中设置准确的时间日期类的用法

    5.日期Date相关类: 题目1: 设置准确的时间(jdk1.1以后Date的setHours不被推荐了,所以要用Calendar设置时间) import java.util.*;public cla ...

  2. CSS样式写在JSP代码中的几种方法

    1.行内样式. 可以直接把css代码写在现有的HTML标签元素的开始标签里面,并且css样式代码要写在style=" "双引号中才可以, 如: <p style=" ...

  3. Java中的反射原理以及简单运用(原理+例子)

    @ 目录 学习总结 1. 为什么要使用反射 2. 反射的概念 3. Java反射加载过程 4. 反射优缺点 5. 字节码对象理解 6. 获取字节码对象(.class)的三种方式 7. 反射常用API ...

  4. 使用Object.Defineproperties改变对象数据结构

    此方法设置键的时候如果需要使键为变量则需要加中括号[]  如下 let addKeys = Number(keys[keys.length - 1]) + 1 Object.assign(this.t ...

  5. 底部footer挡住上面内容的bug

    当设置底部footer的样式为: .footer{ position: fixed; height: 49px; bottom: 0; background: #fff; } 这样会挡住上面的内容,修 ...

  6. pytest-mark 参数化

    在类前或用例前用pytest.mark.parametrize ,可进行参数化 传参方式比较灵活,有很多种,下面是列出的几种方式,其他的可自行研究 @pytest.mark.parametrize(& ...

  7. 分库分表实现方式Client和Proxy,性能和维护性该怎么选?

    大家好,我是[架构摆渡人],一只十年的程序猿.这是分库分表系列的第一篇文章,这个系列会给大家分享很多在实际工作中有用的经验,如果有收获,还请分享给更多的朋友. 其实这个系列有录过视频给大家学习,但很多 ...

  8. Hyperledger Fabric节点的动态添加和删除

    前言 在Hyperledger Fabric组织的动态添加和删除中,我们已经完成了在运行着的网络中动态添加和删除组织.本文将在其基础上,详细介绍了如何在 soft 组织上添加新的 peer2 节点,并 ...

  9. 几种比较经典的波形及其FFT变换(正弦波,三角波,方波和锯齿波)

    之前上学时我的信号学得最差了,主要原因还是我高数学得不怎么样.可能是人总敬畏自己最不会的,所以我觉得我学过诸多科目中,数学是最博大精深而最妙的,从最开始的一次函数到反比例函数,二次三次函数和双曲线,椭 ...

  10. 『忘了再学』Shell基础 — 9、Bash中的特殊符号(一)

    目录 1.双单引号 2.双引号 3.$符号 4.反引号 5.$()符号 6.#符号 7.\符号 1.双单引号 '':单引号.在单引号中所有的特殊符号,如$和"`"(反引号)都没有特 ...