第八节 Linux 文件的属性(上半部分)

标签(空格分隔):Linux实战教学笔记


第1章 Linux中的文件

1.1 文件属性概述(ls -lhi)

linux里一切皆文件

Linux系统中的文件或目录的属性主要包括:索引节点(inode),文件类型,权限属性,链接数,所归属的用户和用户组,最近修改时间等内容:

文字解释:

第一列:inode索引节点编号(相当于人的身份证,全国唯一)

第二列:文件类型及权限

第二列共11个字符:其中第一个字符为文件类型,随后的9个字符为文件的对应权限,最后一个字符点号“.”是和selinux有关的一个标识;

第三列:硬链接个数(详细参看ln命令的讲解);

相当于超市的多个入口,可以从不同的文件入口进入文件,还可以互为备份(消防通道)

第四列:文件或目录所属的用户 文件的所有者(属主);

linux里面文件和程序的存在必须要有用户和组满足相应的存在需求。

第五咧:文件或目录所属的组

第六列:文件或目录的大小;

第七八九列:文件或目录的修改时间:默认月日时分

第十列:实际的文件或目录名

文件名不算文件的属性

下面我们以chensiqi文件为例进行说明,具体列的内容参考下上面的图:

1736707 -rwx-xr-x- 1 root root 35 Oct 28 11:29 chensiqi

  • inode索引节点编号:1736707
  • 文件类型,文件类型是-,表示这是一个普通文件;
  • 文件权限:文件权限是rwxr-xr-x,表示文件属主可读,可写,可执行,文件归属的用户组可读可执行,其他用户可执行。
  • 硬链接个数:表示chensiqi这个文件没有其它的硬链接,因为连接数是1,就是他本身;
  • 文件属主:这个文件所属的用户,这里意思是chensiqi文件被root用户拥有,注意,是第一个root;
  • 文件属组:这个文件所属的用户组,在这里是root用户组,是显示信息里的第二个root
  • 文件大小:文件大小是35个字节
  • 文件修改时间:这里的时间是该文件最后被更新(包括文件创建,内容更新,文件名更新等)的时间,可用如下命令查看文件的修改,访问,创建的时间

1.2 索引节点inode

1.2.1 inode 概述

  • 硬盘要存储数据,首先要分区,然后格式化创建文件系统,最后挂载,才能存数据。
  • Inode,中文意思是索引节点(index node)。在每个linux存储设备或存储设备的分区(存储设备可以是硬盘,软盘,U盘...)被格式化为ext4(CentOS6.8)文件系统后,一般生成两部分:第一部分是Inode(很多个),第二部分是Block(很多个)。
  • 这个Block是用来存储实际数据用的,例如:照片,视频等普通文件数据。
  • 而inode就是用来存储这些数据属性信息的(也就是ls -l的结果),inode属性信息包括不限于文件大小,属主(用户),归属的用户组,文件权限,文件类型,修改时间,还包含指向文件实体的指针功能(inode节点--block的对应关系)等,但是,inode里面唯独不包含文件名本身

身份证号 ==== inode号

身高体重三围有没有头发(属性)====inode

  • Inode除了记录文件属性的信息外,还会为每个文件进行信息索引,所以就有了inode的数值。操作系统根据指令,即可通过inode的值最快的找到相对应的文件实体。文件,inode,block之间的关系见下图:

为了能让大家更形象的理解,我举个例子。假如有一本书,存储设备和分区就相当于这本书,Block相当于书中的每一页内容,而inode就相当于这本书前面的目录,一本书有很多内容,一个知识点可能有多页,如果想查找某部分或某知识点的内容,我们一般先查书的目录,通过目录能更快的找到我们想要看的知识点的内容。虽然不太恰当,但还是比较形象。

当我们用ls查看某个目录或文件时,如果加上-i参数,就可以看到inode节点了;

root@chensiqi /】# ls -i

  • 上图第一列inode值259615;查看一个文件或目录的inode,通过ls命令的-i参数即可。
  • 因为inode要存放文件的属性信息,所以每个inode本身是有大小的,Centos5系列inode的默认大小是128字节,而Centos6系列inode的默认大小是256字节,inode的大小在分区被格式化创建文件系统之后定下来的,格式化以后就无法更改inode大小,格式化前可以通过参数指定inode的大小,但是一般企业工作环境没这个需求
  • 不同Centos版本inode大小不同

查看文件系统inode总量以及剩余量

root@chensiqi /】# df -i

查看磁盘使用量

[root@chensiqi /]# df -h

Inode:存放文件的属性+文件内容的位置(block的位置) df - l 查看使用量

Block:存放实际数据

1.2.2 企业案例模拟:

模拟磁盘满的情况

磁盘满的一个特征(no space left on device)

1.block 满了 磁盘空间满了

2.inode 满了 创建一个文件就需要一个inode

1.2.3 有关inode的小结

学会给阶段性的知识做小结是学好linux运维的好习惯。

  1. 诞生:磁盘被分区并格式化为ext4文件系统后,会生成一定数量的inode和block
  2. inode称为索引(目录)节点,它的作用是存放文件的属性信息以及作为文件的索引(指向文件的实体block)
  3. ext3/ext4 文件系统的block 存放的是文件的实际内容(数据)。
  4. inode是磁盘上的一块存储空间,CentOS6非启动分区inode默认大小256字节,CentOS5是128字节
  5. inode的表现是形式一串数字,不同的文件对应的inode(一串数字)在文件系统里是唯一的。
  6. inode节点号相同的文件,互为硬链接文件,可以认为是一个文件的不同入口。
  7. ext3/ext4文件系统下,一个文件至少要占用一个inode和一个block。(文件size比较大)
  8. ext3/ext4文件系统下,正常情况一个文件占用且只能占用一个inode(人和身份证号)
  9. block是用来存储实际数据的,每个block的大小一般有1k,2k,4k几种。其中引导分区等为1k,其他普通分区多为4K(CentOS6)
  10. 如果一个文件很大(高清大片4G),需要占用多个block,如果文件很小(0.01k),至少占一个block,并且这个block的剩余空间就浪费了,即无法在存储其他数据

1.2.4 有关Block的知识小结

  1. 磁盘读取数据是按block为单位读取的
  2. 一个文件可能占用多个block。每读取一个block就会消耗一次磁盘I/O
  3. 如果要提升磁盘I/O性能,那么就要尽可能一次性读取数据尽量的多。
  4. 一个block只能存放一个文件的内容,无论内容多小。如果block默认是4K大小,那么存放一个1K的文件,剩余3K就不能存放别的文件,只能浪费了
  5. Block并非越大越好。Block太大对于存放小文件就会浪费磁盘空间,例如:1000K的文件,Block大小为4K,占用250个Block,如果Block默认为1K,则需要占用1000个Block。访问效率谁更高?消耗I/O分别为250次和1000次。
  6. 根据业务需求,确定默认的block大小,如果是大文件(大于16K)一般设置block大一点,小文件(小于1K)一般设置block小一点
  7. block太大,例如4K,文件都是0.1K的,大量浪费磁盘空间,但是访问性能高
  8. block太小,例如1K,文件都是1000K,消耗大量磁盘I/O
  9. 企业里文件都会比较大(一般会大于4K),block设置大一些会提升磁盘访问效率。
  10. ext3/ext4文件系统(CentOS5和CentOS6),一般都设置为4K。

    当前的生产环境一般设置为4K,特殊的业务,如视频可以加大block大小
  • Block块越大对于单个的小文件多(0.5K)的业务,会非常浪费空间,因为,一个文件无论多大都会必须占用至少一个inode和一个block,磁盘读取数据是按Block为单位读取的,但是对于大文件,可以提升读取的效率,因为如果block太小,就要读多个block,这样就消耗磁盘I/O,如果block大,则会读较少的aBlock就读完数据,从而减少磁盘I/O
  • Block块太小又会影响硬盘读取大文件数据的效率,Block块越小,同样存储一个文件就需要更多的Block,这样硬盘读取数据时就要读取多个block,因此效率就越低。

  • Block分大了,浪费空间,分小了,影响磁盘读取性能

1.2.5 inode与block总的小结

  1. 磁盘被分区格式化文件系统后,会分为inode和block两部分内容
  2. inode存放文件的属性以及指向文件实体的指针(block的位置),文件名不在inode里,一般在上级目录的block里
  3. 访问文件的过程,通过文件名(上一级目录的block)--->inode--->blocks
  4. inode centos6一般情况默认非启动分区大小256B,block大小1,2,4K,默认是4K,注意,引导分区等特殊分区除外
  5. 通过df -i 查看inode的数量及使用情况,dumpe2fs /dev/sda3 查看inode及block的大小及数量
  6. 一个文件至少要占用一个inode及一个block,多个文件可以占用同一个inode(硬链接),相同文件
  7. 一个block只能被一个文件使用,如果文件很小block很大,剩余空间浪费,无法继续被其他文件使用
  8. block不是越大越好,要根据业务的文件大小进行选择,一般CentOS6就是默认4K
  9. 可以在格式化的时候改变inode及block的大小

1.2.6 企业面试题一:

一个100M(100000K)的磁盘分区,分别写入1K的文件或写入1M的文件,分别可以写多少个?

  • 1K文件虽小,但是block一般默认4K,即使1K的数据也会占用4K大小,比如大家创建一个空文件,然后du -sk 看看大小是多少。(如果大家此时认为应该100000/4的话,那么你就掉坑了-_-!别忘了存储数据,消耗的不光是block还有inode,inode默认只有256K(centos6),每个文件至少占用一个block的同时还会占用一个inode)
  • 1M的数据他刚好能被4整除。所以不会浪费空间,大约为100个左右,inode充足。

    总上对于大文件一般inode是足够的,大文件基本也不会浪费空间,整除就可以;但是对于小文件来说,inode是不足够的,因此能够存储的数量就是inode的数量

1.27 企业面试题二:

如果向磁盘写入数据提示如下错误:No space left on device,通过df -h查看磁盘空间,发现没满,请问可能原因是什么?企业场景什么情况下会导致这个问题发生?

  • 磁盘没满但是不能卸乳文件,最可能的原因就是inode被耗尽了

    企业工作中邮件临时队列/var/spool/clientmquene或/var/spool/postfix/maildrop这里很容易被大量小文件占满导致No space left on device的错误。clientmquene目录只有安装了sendmail服务,才会有,是sendmail的临时队列。centos5.8默认就会装sendmail,centos6默认没有sendmail,但是有postfix

1.3文件类型及文件扩展名

1.3.1 文件类型介绍

  • windows扩展名让系统区分不同文件类型,扩展名错误导致文件无法打开。
  • linux通过扩展名让人区分文件类型,为了易读,错误也可以正常使用

例如:

windows图片文件扩展名:jpg,jpeg,png,gif等

文本文件扩展名:doc,docx,txt,pdf

1.3.2 Linux中的文件类型

对于这里我不想说太多,因为实在感觉对于实际应用意义不大,大家只需要知道通过ls -l查看目录的时候,

1,如果权限那里是-rw--r--r--,第一个字符是‘-’就代表是普通文件

2,如果第一个字符是d例如drw--r--r--.就代表是个文件夹

3,如果第一个字符是l例如lrw--r--r--,就代表是个软链接

1.3.3 软连接

软连接文件可通过:

ln -s 源文件名 新文件名 的方式来创建(如果不使用-s,则会创建硬链接,但不适合目录)

这个软连接和windows的快捷方式是相似的。

1.3.4 Linux下扩展名的作用

在linux中,虽然扩展名没什么意义,但是为了兼容windows,同时,便于我们大多数windows用户区分文件的不同,所以,我们还是习惯通过扩展名来表示不同文件的类型。

如下

  1. tar,tar.gz,tgz,zip,tar.bz表示压缩文件,创建命令一般为tar,gzip,unzip等
  2. .sh表示shell脚本文件,通过shell语言开发的程序
  3. .pl表示perl语言文件,通过perl语言开发的程序
  4. .py表示python语言文件,通过python语言开发的程序
  5. .html,.htm,.php,.jsp,.do表示网页语言的文件
  6. .conf表示系统的配置文件
  7. .rpm表示rpm安装包文件

1.4 知识扩展(企业实际经验)

问题: Linux文件系统如何选择?

通过综合使用多种标准文件系统Benchmarks对Ext3,Ext4,Reiserfs,XFS,JFS,Reiser4的性能测试对比,对不同应用选择合适的文件系统给出以下方案,供大家参考。

  1. 大量小文件(LOSF,Lost of small files)I/O应用(如小图片)
  • Reiserfs(首选),Ext4文件系统适合这类负载特征,IO调度算法选择deadline,block size=4096,ext4关闭日志功能
  • reiserfs mount参数:-o defaults,async,noatime,nodiratime,notail,data=writeback
  • ext4 mount参数:-o defaults,async,noatime,nodiratime,data=writeback,barrier=0
  • 关闭ext4日志:tune2fs -O^has_joumal /dev/sdXX

2.大文件I/O应用(如视频下载,流媒体)

  • EXT4文件系统适合此类负载特征,IO调度算法选择anticipatory,block size=4096,关闭日志功能,启用extent(default)
  • mount参数:-o defaults,async,noatime,nodiratime,data=writeback,barrier=0
  • 关闭ext4日志:tune2fs -O^has_joumal /dev/sdXX

3.SSD文件系统选择

EXT4/Reiserfs可以作为SSD文件系统,但未对SSD做优化,不能充分发挥SSD性能,并影响SSD使用时间

Btrfs对SSD作了优化,mount通过参数启用。但Btrfs扔处于试验阶段,生产环境谨慎使用

JFFS2/Nilfs2/YAFFS是常用的flash file system,在嵌入式环境广泛应用,建议使用。性能目前还未作测试评估

简单分析一下选择Reiserfs和ext4文件系统的原因

1、Reiserfs

 大量小文件访问,衡量指标是IOPS,文件系统性能瓶颈在于文件元数据操作、目录操作、数据寻址。reiserfs对小文件作了优化,并使用B+ tree组织数据,加速了数据寻址,大大降低了open/create/delete/close等系统调用开销。mount时指定noatime,nodiratime,notail,减少不必要的inode操作,notail关闭tail package功能,以空间换取更高性能。因此,对于随机的小I/O读写,reiserfs是很好的选择。

2、Ext4

 大文件顺序访问,衡量指标是IO吞吐量,文件系统性能瓶颈在于数据块布局(layout)、数据寻址。Ext4对ext3主要作了两方面的优化:

:是inode预分配。这使得inode具有很好的局部性特征,同一目录文件inode尽量放在一起,加速了目录寻址与操作性能。因此在小文件应用方面也具有很好的性能表现。

:是extent/delay/multi的数据块分配策略。这些策略使得大文件的数据块保持连续存储在磁盘上,数据寻址次数大大减少,显著提高I/O吞吐量。

因此,对于顺序大I/O读写,EXT4是很好的选择。另外,XFS性能在大文件方面也相当不错。

Linux实战教学笔记08:Linux 文件的属性(上半部分)的更多相关文章

  1. Linux实战教学笔记08:Linux 文件的属性(下半部分)

    第八节 Linux 文件的属性(下半部分) 标签(空格分隔): Linux教学笔记 ---更多相关资料请点我查看 第1章 链接的概念 在linux系统中,链接可分为两种:一种为硬链接(Hard Lin ...

  2. Linux实战教学笔记11:linux定时任务

    第十一节 linux定时任务 标签(空格分隔): Linux实战教学笔记 ---更多资料点我查看 1.1 定时任务Crond介绍 Crond是linux系统中用来定期执行命令/脚本或指定程序任务的一种 ...

  3. Linux实战教学笔记07:Linux系统目录结构介绍

    第七节 Linux系统目录结构介绍 标签(空格分隔):Linux实战教学笔记 第1章 前言 windows目录结构 C:\windows D:\Program Files E:\你懂的\精品 F:\你 ...

  4. Linux实战教学笔记06:Linux系统基础优化

    第六节 Linux系统基础优化 标签(空格分隔):Linux实战教学笔记-陈思齐 第1章 基础环境 第2章 使用网易163镜像做yum源 默认国外的yum源速度很慢,所以换成国内的. 第一步:先备份 ...

  5. Linux实战教学笔记04:Linux命令基础

    第四节:Linux命令基础 标签(空格分隔):Linux实战教学笔记 第1章 认识操作环境 root:当前登陆的用户名 @分隔符 chensiqi:主机名 -:当前路径位置 用户的提示符 1.1 Li ...

  6. Linux实战教学笔记12:linux三剑客之sed命令精讲

    第十二节 linux三剑客之sed命令精讲 标签(空格分隔): Linux实战教学笔记-陈思齐 ---更多资料点我查看 1,前言 我们都知道,在Linux中一切皆文件,比如配置文件,日志文件,启动文件 ...

  7. Linux实战教学笔记18:linux三剑客之awk精讲

    Linux三剑客之awk精讲(基础与进阶) 标签(空格分隔): Linux实战教学笔记-陈思齐 快捷跳转目录: * 第1章:awk基础入门 * 1.1:awk简介 * 1.2:学完awk你可以掌握: ...

  8. Linux实战教学笔记19:Linux相关网络知识梳理

    第十九节 Linux相关网络知识梳理 标签(空格分隔): Linux实战教学笔记-陈思齐 一,前言 一个运维有时也要和网络打交道,所以具备最基本的网络知识,对一个运维人员来说是必要的.但,对于我们的工 ...

  9. Linux实战教学笔记

    Linux实战教学笔记01:计算机硬件组成与基本原理 Linux实战教学笔记02:计算机系统硬件核心知识 Linux实战教学笔记03:操作系统发展历程及系统版本选择 Linux实战教学笔记04:Lin ...

随机推荐

  1. 聊聊Unity项目管理的那些事:Git-flow和Unity

    0x00 前言 目前所在的团队实行敏捷开发已经有了一段时间了.敏捷开发中重要的一个话题便是如何对项目进行恰当的版本管理.项目从最初使用svn到之后的Git One Track策略再到现在的GitFlo ...

  2. 开源:Taurus.MVC 框架

    为什么要创造Taurus.MVC: 记得被上一家公司忽悠去负责公司电商平台的时候,情况是这样的: 项目原版是外包给第三方的,使用:WebForm+NHibernate,代码不堪入目,Bug无限,经常点 ...

  3. 如何在高并发环境下设计出无锁的数据库操作(Java版本)

    一个在线2k的游戏,每秒钟并发都吓死人.传统的hibernate直接插库基本上是不可行的.我就一步步推导出一个无锁的数据库操作. 1. 并发中如何无锁. 一个很简单的思路,把并发转化成为单线程.Jav ...

  4. HTML 事件(二) 事件的注册与注销

    本篇主要介绍HTML元素事件的注册.注销的方式. 其他事件文章 1. HTML 事件(一) 事件的介绍 2. HTML 事件(二) 事件的注册与注销 3. HTML 事件(三) 事件流.事件委托 4. ...

  5. CENTOS 6.5 平台离线编译安装 Mysql5.6.22

    一.下载源码包 http://cdn.mysql.com/archives/mysql-5.6/mysql-5.6.22.tar.gz 二.准备工作 卸载之前本机自带的MYSQL 安装 cmake,编 ...

  6. 利用Node.js的Net模块实现一个命令行多人聊天室

    1.net模块基本API 要使用Node.js的net模块实现一个命令行聊天室,就必须先了解NET模块的API使用.NET模块API分为两大类:Server和Socket类.工厂方法. Server类 ...

  7. 数据图表插件Echarts(一)

    一.引言 最近做一个智慧城市项目,项目中需要图表和报表进行数据分析,从网上找了很多,最后找到了百度开放的echarts,一个很强大的插件. 二.介绍 ECharts,缩写来自Enterprise Ch ...

  8. php实现的分页类

    php分页类文件: <?php /** file: page.class.php 完美分页类 Page */ class Page { private $total; //数据表中总记录数 pr ...

  9. Flex 布局教程:实例篇

    该教程整理自 阮一峰Flexible教程 今天介绍常见布局的Flex写法.你会看到,不管是什么布局,Flex往往都可以几行命令搞定. 我的主要参考资料是Landon Schropp的文章和Solved ...

  10. pycharm2016.3.1激活及汉化

    pycharm快捷键 PyCharm设置python新建文件指定编码为utf-8 Python | 设置PyCharm支持中文 0, 注册码 43B4A73YYJ-eyJsaWNlbnNlSWQiOi ...