菜单

文件和数据操作

相关源文件

本文档涵盖了 tldr-pages 仓库中记录的核心文件和数据操作实用程序。它侧重于三个主要类别:通过校验和进行文件完整性验证、磁盘和数据复制以及基本文本处理。有关更高级的文本处理工具和 shell 实用程序,请参阅 Shell 实用程序和文本处理。有关处理 JSON 和 XML 等结构化数据的开发工具的信息,请参阅 数据处理和结构化数据

文件操作实用程序概述

tldr-pages 仓库记录了许多允许用户从根本上操作文件和数据的实用程序。这些工具是更复杂操作的构建块,对于系统管理、数据验证和文本处理任务至关重要。

来源:pages/common/sha256sum.md pages/common/dd.md pages/common/cut.md pages/common/more.md

校验和实用程序

校验和实用程序计算文件的加密哈希值,提供了一种验证文件完整性并检测更改或损坏的方法。tldr-pages 仓库记录了几个校验和实用程序,按算法家族组织。

SHA 系列校验和

SHA(安全哈希算法)系列包括具有不同输出大小和安全特性的多种变体。

实用工具算法哈希长度常见用法
sha1sumSHA-1160 位(40 个十六进制字符)过时的验证方法,不推荐用于安全关键用途
sha224sumSHA-2224 位(56 个十六进制字符)紧凑型 SHA-2 变体
sha256sumSHA-2256 位(64 个十六进制字符)最常用的 SHA-2 变体,在安全性和性能之间取得了良好的平衡
sha384sumSHA-2384 位(96 个十六进制字符)更强的 SHA-2 变体
sha512sumSHA-2512 位(128 个十六进制字符)最强的 SHA-2 变体

来源:pages/common/sha256sum.md pages/common/sha512sum.md pages/common/sha1sum.md pages/common/sha384sum.md pages/common/sha224sum.md

其他校验和实用程序

除了 SHA 系列之外,该仓库还记录了

实用工具算法特性
md5sumMD5速度快但加密已损坏;128 位(32 个十六进制字符)
b2sumBLAKE2快速、安全;可变长度,通常为 512 位
b3sumBLAKE3更新、比 BLAKE2 更快;可变长度
shasum多选支持多种算法的包装器实用程序

来源:pages/common/md5sum.md pages/common/b2sum.md pages/common/b3sum.md pages/common/shasum.md

校验和操作

所有校验和实用程序都遵循相似的使用模式,如下图所示

来源:pages/common/sha256sum.md6-32 pages/common/md5sum.md6-32

使用 dd 进行数据复制

dd 实用程序是用于低级数据复制和转换的强大工具。与大多数复制实用程序不同,dd 在块级别工作,使其适用于磁盘操作。

dd 的主要功能

来源:pages/common/dd.md pages/linux/dd.md

dd 的常见用例

dd 实用程序在几个特定场景中表现出色

  1. 创建可启动的 USB 驱动器:

    dd if=path/to/file.iso of=/dev/usb_drive status=progress
    
  2. 磁盘克隆:

    dd bs=4M conv=fsync if=/dev/source_drive of=/dev/dest_drive
    
  3. 生成随机数据:

    dd bs=100 count=1 if=/dev/urandom of=path/to/random_file
    
  4. 磁盘性能基准测试:

    dd bs=1M count=1024 if=/dev/zero of=path/to/file_1GB
    
  5. 系统备份:

    dd if=/dev/drive_device of=path/to/file.img status=progress
    

来源:pages/common/dd.md6-24 pages/linux/dd.md6-28

特定平台的 dd 功能

虽然核心功能保持一致,但 dd 的实现具有一些特定平台的特性

平台特殊功能
Linux通过 kill -USR1 $(pgrep -x dd) 内置的进度监控
macOS/BSD略有不同的块大小表示法(4m 而非 4M)

来源:pages/linux/dd.md26-28 pages/osx/dd.md

文本处理实用程序

文本处理实用程序有助于在字符、字段或行级别上操作文本数据。

cut 实用程序

cut 实用程序从文件的每一行或标准输入中提取文本部分。

来源:pages/common/cut.md

cut 用法示例

操作命令示例描述
提取字符cut -c 1-10 file.txt提取每行的前 10 个字符
提取字段cut -f 2,4 file.txt提取每行的第 2 和第 4 个字段
自定义分隔符cut -d ':' -f 1 /etc/passwd从 passwd 文件中提取用户名
从标准输入`commandcut -f 1`

来源:pages/common/cut.md6-20

文本分页器:more

more 实用程序是一个简单的分页器,用于一次查看一个屏幕的文本文件。它允许基本的滚动和搜索。

来源:pages/common/more.md

与其他数据处理工具的集成

文件和数据操作实用程序通常与其他工具在数据处理管道中协同工作。

来源:pages/common/sha256sum.md pages/common/cut.md pages/common/dd.md

总结

tldr-pages 仓库中记录的文件和数据操作实用程序提供了关键功能,用于

  1. 通过各种校验和算法验证文件完整性
  2. 使用 dd 进行块级别的数据复制和转换
  3. 使用 cut 提取特定部分来处理文本数据
  4. 使用 more 交互式地查看文本内容

这些工具在命令行操作、系统管理和数据处理工作流中充当基础构件。