awk数组与语法[通俗易懂]

awk数组与语法[通俗易懂]1、awk数组1.1数组结构1.2数组分类索引数组:以数字为下标关联数组:以字符串为下标1.3awk关联数组现有如下文本,格式如下:即左边是随机字母,右边是随机数字,即将相同的字母后面的数字加在一起,按字母的顺序输出以$1为下标,创建数组a[$1]=a[$1]+$2或者(a[$1]+=$2)然后配合END和for循环输出结果:for(iina):…

大家好,又见面了,我是你们的朋友全栈君。

1、awk数组

1.1 数组结构

awk数组与语法[通俗易懂] awk数组与语法[通俗易懂]

1.2 数组分类

引数组:以数字为下标

关联数组:以字符串为下标

1.3 awk关联数组

现有如下文本,格式如下:即左边是随机字母,右边是随机数字, 即将相同的字母后面的数字加在一起,按字母的顺序输出

awk数组与语法[通俗易懂]

以$1为下标,创建数组a[$1]=a[$1]+$2 或者(a[$1]+=$2)然后配合END和for循环输出结果:

awk数组与语法[通俗易懂]

for(i in a ) :循环的顺序不是按照文本内容的顺序来处理的,排序可以在命令后用sort

1.4 awk索引数组

以数字为下标的数组seq生成1-10数字,,只显示奇数行

awk数组与语法[通俗易懂]

seq生成1-10的数字,要求不显示文件的后3行

awk数组与语法[通俗易懂]

改变i的范围

1.5 awk数组实战去重

a++ 和++a

awk数组与语法[通俗易懂]

对一下文本进行去重处理 针对第二列去重

awk数组与语法[通俗易懂]

解法一:

awk数组与语法[通俗易懂]

解析:
!a[$2]++是模式(条件),命令也可写成awk ‘!
a[$2]=a[$2]+1{print $0}’ 22.txt
a[$2]++ ,“++”在后,先取值后加一
!a[$2]=a[$2]+1:是先取a[$2]的值,比较“!a[$2]”是否符合条件(条件非0),后加1
注意:此方法去重后的结果显示的是文本开头开始的所有不重复的行

解法二:

awk数组与语法[通俗易懂]

解析:
++a[$2]==1是模式(条件),也可写成a[$2]=a[$2]+1==1即只有当条件(a[$2]+1的结果)为1的时候才打印出内容
++a[$2] ,“++”在前,先加一后取值
++a[$2]==1:是先加1,后取a[$2]的值,比较“++a[$2]”是否符合条件(值为1)
注意:此方法去重后的结果显示的是文本开头开始的所有不重复的行

解法三:

awk数组与语法[通俗易懂]

解析:
注意此方法去重后的结果显示的是文本结尾开始的所有不重复的行

1.6 awk处理多个文件(数组、NR、FNR)

awk数组与语法[通俗易懂]

解析:NR==FNR处理的是第一个文件,NR!=FNR处理的是第二个文件.
注意:当两个文件NR(行数)不同的时候,需要把行数多的放前边.
解决方法:把行数多的文件放前边,行数少的文件放后边.

把输出的结果放入一个新文件new.txt中:

awk数组与语法[通俗易懂]

1.7 awk分析日志文件,统计访问网站的个数

awk数组与语法[通俗易懂]

2、awk简单语法

2.1 函数sub gsub

awk数组与语法[通俗易懂]

sub只会替换行内匹配的第一次内容;相当于sed ‘s###’
gsub 会替换行内匹配的所有内容;相当于sed ‘s###g’

awk数组与语法[通俗易懂] awk数组与语法[通俗易懂]

案例

以’|’为分隔, 现要将第二个域字母前的数字去掉,其他地方都不变, 输出为:

方法一:

awk数组与语法[通俗易懂]

方法二:

awk数组与语法[通俗易懂]

2.2 if else

awk数组与语法[通俗易懂] awk数组与语法[通俗易懂]

2.3 next用法

awk数组与语法[通俗易懂]

解析:
{print $0″ NO YES”}:此动作是默认执行的,当前边的$0~/AA/匹配,就会执行{print $0″ YES”;next}
因为action中有next,所以会跳过后边的action。
如果符合$0~/AA/则打印YES ,遇到next后,后边的动作不执行;如果不符合$0~/AA/,会执行next后边的动作;
next前边的(模式匹配),后边的就不执行,前边的不执行(模式不匹配),后边的就执行。

2.4 printf不换行输出及next用法

printf :打印后不换行

如下文本,如果 Description:之后为空,将其后一行内容并入此行。

解法一:

awk数组与语法[通俗易懂]

解析:使用正则匹配,匹配到’/^Desc.*:$/,就使用printf打印(不换行),不匹配的打印出整行。

解法二(使用ifelse实现):

awk数组与语法[通俗易懂]

解法三(使用next实现):

awk数组与语法[通俗易懂]

注:可简写成awk ‘/Desc.*:$/{printf $0;next}1’
printf.txt ## 1是pattern(模式),默认action(动作)是{print $0}

awk数组与语法[通俗易懂]

2.5 去重后计数按要求重定向到指定文件

文本如下,要求计算出每项重复的个数,然后把重复次数大于2的放入gt2.txt文件中,把重复次数小于等于2的放入le2.txt文件中

awk数组与语法[通俗易懂]

解析:{print },或括号中打印后可直接重定向到一个新文件,文件名用双引号引起来。如: {print $1 >”xin.txt”}

3、awk总结

  • NR==FNR ##不能写成NR=FNR(=在awk中是赋值的意思)
  • NR!=FNR ##NR不等于FNR
  • {a=1;a[NR]} 这样会报错:同一条命令中变量和数组名不能重复 d)printf 输出的时候不换行
  • {print },或括号中打印后可直接重定向到一个新文件,文件名用双引号引起来。如: {print $1 >”xin.txt”}
  • 当模式(条件)是0的时候,后边的动作不执行,!0的时候后边动作才执行。

原文地址:https://mp.weixin.qq.com/s/2Ic4lCBTYjxMuC8lH5IdVg

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/161641.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • linux搭建开源ldap服务器方法

    linux搭建开源ldap服务器方法1.什么是ldap服务器ldap是统一认证服务,它的优点是存储用户认证等不经常改变的信息,有清晰的组织结构。ldap条目概念:基准DN,例如dc=company,dc=com,DN,例如cn=test,dc=company,dc=com,一个DN就是一个条目,RDN是相对DN,具有唯一性,上面例子的DN的RDN就是cn=test2.下载openldapopenld…

    2022年5月15日
    43
  • PHP开发api接口安全验证

    PHP开发api接口安全验证

    2021年10月13日
    39
  • vue 计数器_vue实现计算器

    vue 计数器_vue实现计算器计数器的实现在页面上简单实现一个计数器<!DOCTYPEhtml><htmllang="en"><head><metach

    2022年7月30日
    7
  • vs code如何运行_vs如何代码提示

    vs code如何运行_vs如何代码提示第一步:新建C#项目文件夹并将其在VisualStudioCode中打开之后,在底下的终端中输入下方指令创建项目的.csproj文件:dotnetnewconsole第二步:执行下方指令编译代码:dotnetrestore第三步:输入下方指令运行项目。dotnetrun…

    2025年10月14日
    3
  • hash一致性算法以及应用场景_什么不是算法的基本特性

    hash一致性算法以及应用场景_什么不是算法的基本特性最近有小伙伴跑过来问什么是Hash一致性算法,说面试的时候被问到了,因为不了解,所以就没有回答上,问我有没有相应的学习资料推荐,当时上班,没时间回复,晚上回去了就忘了这件事,今天突然看到这个,加班为大家整理一下什么是Hash一致性算法,希望对大家有帮助!文末送书,长按抽奖助手小程序即可参与,祝君好运!经常阅读我文章的小伙伴应该都很熟悉我写文章的套路,上来就是先要问一句为什么?也就是为什么要有Has

    2022年10月6日
    3
  • java数组去重方法是,java数组去重的两种方法

    java数组去重方法是,java数组去重的两种方法我们对于数组元素的使用,有时候在创建数组的初期,并没有考虑过元素的重复问题。当我们想要不重复元素的数组时,就要再进行一步去重的工作。数组的去重有两种方法可以实现,一个是循环比较,另一个是hashSet的集合方法。下面我们就这两种Java数组去重的方法带来详解。1、循环比较循环对比每个元素的值是否一致,这个就不过多去介绍,主要是第2种方法2、利用hashSet去重hashSet是一个没有重复元素的集…

    2022年6月22日
    76

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号