awk|grep|sed|find
awk
1、awk 其他用法
awk '!S[$0]++' filename # 去除文件重复的行
awk 'S[$0]++' filename # 显示文件重复的行
awk '!S[$1]++' filename # 去除第一列相同的行
awk '!S[$2]++' filename # 去除第二列相同的行
awk '{S[$0]++}END{ for(i in S) print i"\t\t"S[i]}' filename # 去重,并统计每一行出现的次数
awk '{S[$2]++}END{ for(i in S) print i"\t\t"S[i]}' filename # 去重,并统计第二列字符出现的次数2、使用awk匹配用法
awk 'NR < 5' filename # 行号小于5
awk 'NR==1,NR==4 {print}' filename # 打印出来1和4的行号
awk '/linux/' filename # 包含linux文本的行
awk '!/linux/' # 不包含linux文本的行
awk '/stat/, /end/' filename # 打印处于start 和 end 之间的文本3、for 在 awk 中用法
4、if 在 awk 中用法
5、BEGIN END 用法
6、变量在 awk 中用法
7、合并文本两行为一行
grep
-o 只输出匹配的文本行 VS -v 只输出没有匹配的文本行 -c 统计文件中包含文本的次数 -n 打印匹配的行号 -i 搜索时忽略大小写 -l 只打印文件名 -w 精准匹配 -R 递归 -e 多条件 -A :后跟一个数字(有无空格都可以),例如 A2则表示打印符合要求的行以及下面两行 -B :后跟一个数字,例如 B2 则表示打印符合要求的行以及上面两行 -C :后跟一个数字,例如 C2 则表示打印符合要求的行以及上下各两行
1、常用命令
例如:文件目录
2、递归精准查询当前路径下包含 test 的文件及行号
3、递归模糊查询当前路径下包含 test 的文件名
4、递归模糊查询当前路径下包含 test 的文件及行号
5、匹配多个条件
6、统计文件中 test 出现的次数
sed
1、常见参数
n 取消默认输出(输出所有文本内容),-n只显示处理过的行
-i 直接操作文件
-f 使用sed脚本
-e 连续编辑
p 打印匹配的内容,通常与-n一起使用
a 追加 < 插入当前行的后面一行 >
i 插入 < 插入当前行的前面一行 >
c 更改
d 删除
s 替换
p 打印
= 打印匹配的行号
n 读取下一行
r,w 读和写
2、删除操作,!为取反操作
3、插入新行
4、替换操作
5、多个 sed 命令组合
6、引用变量
7、合并文本两行为一行
8、过滤多了200b字符文件
vim查看文件,发现多了<200b>字符,使用/200b搜索匹配不上;
处理方法见: http://superuser.com/questions/207207/how-can-i-delete-u200b-zero-width-space-using-sed
linux中sed在指定字符前后添加内容
假设文档内容如下:
要求:在1111之前添加AAA,方法如下:
sed -i 's/指定的字符/要插入的字符&/' 文件
要求:在1111之后添加BBB,方法如下:
sed -i 's/指定的字符/&要插入的字符/' 文件
要求:(1) 删除所有空行;(2) 一行中,如果包含"1111",则在"1111"前面插入"AAA",在"11111"后面插入"BBB"
要求:在每行的头添加字符,比如"HEAD",命令如下:
要求:在每行的尾部添加字符,比如"tail",命令如下:
说明: 1."^"代表行首,"$"代表行尾 2.'s/$/&tail/g'中的字符g代表每行出现的字符全部替换,如果想在特定字符处添加,g就有用了,否则只会替换每行第一个,而不继续往后找。
find
-perm <权限数值>
-name 文件名字
-iname 忽略文件名的大小写,匹配所有大小写字母
-type f文件,d目录,l连接文件,b块设备,c串行端口设备
-size 通过文件大小查找
-inum 查找 inode
-user 指定属主,也可以使用 uid
-group 指定用户组,也可以使用 gid
-not 查找不满足条件的文件,用在特定的条件之前
-o 或者
-a 并且
-mindepth 指定目录的开始深度
-maxdepth 指定目录的最大深度
-*time mtime 创建或更改时间;atime 访问时间;ctime文件inode号被修改。
-*min mmin ±n,大于小于 n 分钟
-mtime +365 创建或更改时间,大于365天的
-mtime -10 创建或更改时间,小于10天
-atime +365 访问或读取时间,大于365天
-atime -10 访问或读取时间,小于10天
1、根据文件或者正则表达式进行匹配
2、否定参数
3、根据文件类型进行搜索
4、基于目录深度搜索
5、根据文件时间戳进行搜索
6、根据文件大小进行匹配
7、删除匹配文件
8、根据文件权限进行匹配
9、结合 -exec 使用
10、搜索但跳过指定的目录
11、搜索属于空文件,空目录,
Last updated