awk通过将下标整体看成一个字符串来支持多维数组。本文结合例子介绍awk多维数组的赋值及遍历。 Read more
awk
文本处理工具使用笔记:目录
文本处理工具grep、sed、awk各自特点,必要时用shell脚本将这三个工具串起来,可以高效地处理文本。本文将grep、sed、awk整理成以目录的形式,以便索引。
数据集Infocom06分析:求所有重叠区间(附源码)
数据集Infocom06记录了节点相遇情况,对其分析会发现节点i与节点j检测到对方的时间往往不一致,考虑到节点间通信需要同步,这样的话,求出节点间相遇的所有重叠区间,就可将有向图转化成无向图,便于后续分析(如社区检测)。本文先简单介绍数据集的格式,再结合源代码介绍求其重叠区间。
awk脚本学习笔记:基本语法、流程控制、自定义函数
awk是一款优秀的文本处理工具(按行处理),也是一门编程设计语言(样式扫描和处理语言)。可以进行正则表达式匹配,样式装入、流控制、数学运算、进程控制语句,甚至内置的变量和函数。本文整理awk脚本的基本语法、流程控制、自定义函数。
《傲慢与偏见》英文小说中各个单词出现的频率
起初想找一份英文单词文件,用于数据分析。没找到,所以就想,找一本英文小说,将重复的单词去掉,几乎可以得到一份单词文件。本文以《傲慢与偏见》英文小说为例,统计小说中各个单词出现的次数。