文件str操作常用命令

模式匹配

  • grep, egrep, fgrep, rgrep - print lines that match patterns
    grep [OPTION...] PATTERNS [FILE...]
    grep [OPTION...] -e PATTERNS ... [FILE...]
    grep [OPTION...] -f PATTERN_FILE ... [FILE...]
  • tr:translate or delete characters
    • -s:squeeze-repeats

统计操作

  • uniq:report or omit repeated lines

    • -c, --count: prefix lines by the number of occurrences将词频作为前缀
  • wc 用于统计输入内容的行数、单词数、字节数等:

    • -l:统计行数(如日志文件行数)。
    • -w:统计单词数(以空格/换行符分隔)。
    • -c:统计字节数(文件大小)。
    • -m:统计字符数(适用于多字节编码如UTF-8)。
    • -L:显示最长行的字符数

排序

  • sort:sort lines of text files,按行排序,以\n作为分隔符
    • -d:按字典序排列
    • -n:按字符串的数值排列

控制输出

  • sed(这个什么都能干)