awk|grep|sed|find

awk

1、awk 其他用法

awk '!S[$0]++' filename     # 去除文件重复的行
awk 'S[$0]++' filename      # 显示文件重复的行
awk '!S[$1]++' filename     # 去除第一列相同的行
awk '!S[$2]++' filename     # 去除第二列相同的行

awk '{S[$0]++}END{ for(i in S) print i"\t\t"S[i]}' filename   # 去重,并统计每一行出现的次数
awk '{S[$2]++}END{ for(i in S) print i"\t\t"S[i]}' filename   # 去重,并统计第二列字符出现的次数

2、使用awk匹配用法

awk 'NR < 5' filename                                                            # 行号小于5
awk 'NR==1,NR==4 {print}' filename                                               # 打印出来1和4的行号
awk '/linux/' filename                                                           # 包含linux文本的行
awk '!/linux/'                                                                   # 不包含linux文本的行
awk '/stat/, /end/' filename                                                     # 打印处于start 和 end 之间的文本

3、for 在 awk 中用法

4、if 在 awk 中用法

5、BEGIN END 用法

6、变量在 awk 中用法

7、合并文本两行为一行

grep

-o 只输出匹配的文本行 VS -v 只输出没有匹配的文本行 -c 统计文件中包含文本的次数 -n 打印匹配的行号 -i 搜索时忽略大小写 -l 只打印文件名 -w 精准匹配 -R 递归 -e 多条件 -A :后跟一个数字(有无空格都可以),例如 A2则表示打印符合要求的行以及下面两行 -B :后跟一个数字,例如 B2 则表示打印符合要求的行以及上面两行 -C :后跟一个数字,例如 C2 则表示打印符合要求的行以及上下各两行

1、常用命令


例如:文件目录

2、递归精准查询当前路径下包含 test 的文件及行号

3、递归模糊查询当前路径下包含 test 的文件名

4、递归模糊查询当前路径下包含 test 的文件及行号

5、匹配多个条件

6、统计文件中 test 出现的次数

sed

1、常见参数

  • n 取消默认输出(输出所有文本内容),-n只显示处理过的行

  • -i 直接操作文件

  • -f 使用sed脚本

  • -e 连续编辑

  • p 打印匹配的内容,通常与-n一起使用

  • a 追加 < 插入当前行的后面一行 >

  • i 插入 < 插入当前行的前面一行 >

  • c 更改

  • d 删除

  • s 替换

  • p 打印

  • = 打印匹配的行号

  • n 读取下一行

  • r,w 读和写

2、删除操作,!为取反操作

3、插入新行

4、替换操作

5、多个 sed 命令组合

6、引用变量

7、合并文本两行为一行

8、过滤多了200b字符文件

vim查看文件,发现多了<200b>字符,使用/200b搜索匹配不上;

处理方法见: http://superuser.com/questions/207207/how-can-i-delete-u200b-zero-width-space-using-sed

linux中sed在指定字符前后添加内容

假设文档内容如下:

要求:在1111之前添加AAA,方法如下:

sed -i 's/指定的字符/要插入的字符&/' 文件

要求:在1111之后添加BBB,方法如下:

sed -i 's/指定的字符/&要插入的字符/' 文件

要求:(1) 删除所有空行;(2) 一行中,如果包含"1111",则在"1111"前面插入"AAA",在"11111"后面插入"BBB"

要求:在每行的头添加字符,比如"HEAD",命令如下:

要求:在每行的尾部添加字符,比如"tail",命令如下:

说明: 1."^"代表行首,"$"代表行尾 2.'s/$/&tail/g'中的字符g代表每行出现的字符全部替换,如果想在特定字符处添加,g就有用了,否则只会替换每行第一个,而不继续往后找。

find

语法: find [路径] [参数] 注:如果不输入路径,查询当前目录!

  • -perm <权限数值>

  • -name 文件名字

  • -iname 忽略文件名的大小写,匹配所有大小写字母

  • -type f文件,d目录,l连接文件,b块设备,c串行端口设备

  • -size 通过文件大小查找

  • -inum 查找 inode

  • -user 指定属主,也可以使用 uid

  • -group 指定用户组,也可以使用 gid

  • -not 查找不满足条件的文件,用在特定的条件之前

  • -o 或者

  • -a 并且

  • -mindepth 指定目录的开始深度

  • -maxdepth 指定目录的最大深度

  • -*time mtime 创建或更改时间;atime 访问时间;ctime文件inode号被修改。

  • -*min mmin ±n,大于小于 n 分钟

  • -mtime +365 创建或更改时间,大于365天的

  • -mtime -10 创建或更改时间,小于10天

  • -atime +365 访问或读取时间,大于365天

  • -atime -10 访问或读取时间,小于10天

1、根据文件或者正则表达式进行匹配

2、否定参数

3、根据文件类型进行搜索

4、基于目录深度搜索

5、根据文件时间戳进行搜索

6、根据文件大小进行匹配

7、删除匹配文件

8、根据文件权限进行匹配

9、结合 -exec 使用

10、搜索但跳过指定的目录

11、搜索属于空文件,空目录,

Last updated