新建一個空檔案佔用多少磁碟空間?

今天我們來思考一個簡單的問題。在Linux下你用touch命令新建一個空檔案:

touch empty_file.txt

操作完成後,是否要消耗掉我們的一些磁碟空間?需要的話,大概能消耗多少?嗯,是的,這個問題簡單的超乎你的想象,但是不知道你否能給你自己一個滿意的答案。

我前面的幾篇文章都是介紹的磁碟物理層面的構成,但這對於理解檔案相關的問題幫助可能還不夠。從今天開始讓我們從物理層往上走,到Linux檔案系統原理裡去尋找答案。

實踐出真知

我覺得可能先丟開核心原理,直接動手操作來實驗更有意思一些。你一定知道ls這個命令你可以檢視檔案大小,那麼讓我們就用它來看一下。

# touch abcdefghigklmn.txt   # ls -l   total 0   -rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file

額,ls命令告訴我這個空檔案佔用的是0。 檔案的大小確實是0,因為我們還沒有為該檔案寫入任何內容。但是我們現在要思考的是,一個空檔案是否佔用磁碟空間。所以直覺告訴我們這絕對不可能,磁碟上多出來一個檔案,怎麼可能一點空間開銷都沒有!

為了解開這個謎底,還需要藉助df命令。輸入df –i

# df -i Filesystem            Inodes   IUsed   IFree IUse% Mounted on ...... /dev/sdb1            2147361984 12785019 2134576965    1% /search

這個輸出幫我們展示了我們檔案系統中inode的使用情況。注意IUsed是12785019。我們繼續新建一個空檔案

# touch empty_file2.txt df -i Filesystem            Inodes   IUsed   IFree IUse% Mounted on ...... /dev/sdb1            2147361984 12785020 2134576964    1% /search [@bjzw_46_76 temp]#

這下注意IUsed變成了12785020。

哈哈,我們的一個結論就出來了。新建一個空檔案會佔用一個Inode

細說inode

那麼inode裡都存了哪些和檔案相關的資訊呢?我們再稍微看一下核心的原始碼。大家可以下載一份linux的原始碼。以ext2檔案系統為例,在我下載的linux-2.6裡的檔案fs/ext2/ext2.h中,可以找到核心對於inode結構體的定義。該結構體較為複雜,主要儲存除了檔案內容以外的一些其他資料,我們選一些比較關鍵的擷取出來:

struct ext2_inode {         __le16  i_mode;         # 檔案許可權         __le16  i_uid;          # 檔案所有者ID         __le32  i_size;         # 檔案位元組數大小         __le32  i_atime;        # 檔案上次被訪問的時間         __le32  i_ctime;        # 檔案建立時間         __le32  i_mtime;        # 檔案被修改的時間         __le32  i_dtime;        # 檔案被刪除的時間         __le16  i_gid;          # 檔案所屬組ID         __le16  i_links_count;  # 此檔案的inode被連線的次數         __le32  i_blocks;       # 檔案的block數量         ......         __le32  i_block[EXT2_N_BLOCKS]; # 指向儲存檔案資料的塊的陣列         ......

可以看到和檔案相關的所屬使用者、訪問時間等都是存在inode中的。另外在include/linux/fs.h中,還有個VFS層面的inode的定義,這裡咱就不發散了。使用stat命令就可以直接看到檔案inode中資料。

# stat test   File: `test'   Size: 0               Blocks: 0          IO Block: 1024   regular empty file Device: 801h/2049d      Inode: 26          Links: 1 Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root) Access: 2020-03-01 12:14:31.000000000  0800 Modify: 2020-03-01 12:14:31.000000000  0800 Change: 2020-03-01 12:14:31.000000000  0800

每個inode到底是多大呢?dumpe2fs可以告訴你(XFS的話使用xfs_info)。

# dumpe2fs -h /dev/mapper/vgroot-lvroot dumpe2fs 1.41.12 (17-May-2010) ...... Inode size:               256

Inode size表示每個Inode的大小。我的這臺機器上,每個inode都是256位元組。兩個inode的大小正好對齊到磁碟扇區的512位元組。

檔名存到哪裡了

inode結構體都看完了,搞了半天不知道有沒有發現一個問題,inode裡並沒有儲存檔名!!那麼,檔名到底跑哪兒去了?

fs/ext2/ext2.h中,我找到了如下資料夾相關的結構體

struct ext2_dir_entry {          __le32  inode;                  /* Inode number */          __le16  rec_len;                /* Directory entry length */          __le16  name_len;               /* Name length */          char    name[];                 /* File name, up to EXT2_NAME_LEN */ };

這個結構體就是我們司空見慣的資料夾。沒錯,檔名是存在其所屬的資料夾資料結構中的,就是其中的char name[]欄位。和檔名一起,資料夾裡還記錄了該檔案的inode等資訊。

結論

    1. 新建一個空檔案需要消耗掉一個inode,用來儲存使用者、建立時間等後設資料。
    1. 新建一個空檔案還需要消耗掉其所有目錄的block中一定的空間,這些空間用來儲存檔名,許可權、時間等資訊

所以,看起來新建一個空檔案而已,只要你想挖,真的能挖出很多知識的。最後分享一個我們團隊裡同學遇到的一個故障。我們的一臺離線任務機直接歇菜了,重啟後排查原因是inode被消耗光了。再追查發現一個程序建立了太多的空日誌檔案。雖然檔案都是空檔案,但是inode卻被浪費光了。後來讓負責的同學修改了建立日誌檔案的邏輯,刪掉了多出來的空檔案,該機器恢復正常。


開發內功修煉之硬碟篇專輯:


我的公眾號是「開發內功修煉」,在這裡我不是單純介紹技術理論,也不只介紹實踐經驗。而是把理論與實踐結合起來,用實踐加深對理論的理解、用理論提高你的技術實踐能力。歡迎你來關注我的公眾號,也請分享給你的好友~