linux 删除文件相同的行(去重,去除重复行)

 
更多

linux 删除文件相同的行(去重,去除重复行)。

1. 使用 vi 命令

基于 vi 工具,先用 sort 进行排序,然后使用正则表达式匹配重复的行,最后删除重复的行。

:sort
:g/^\(.*\)$\n^\1$/d

解析:

g:全局匹配
^\(.*\)$:匹配一行任意内容,并将匹配到的内容存放于匹配分组\1中
\n^\1$:匹配与第一行相同的内容
d:删除重复项

2. 使用 linux shell 命令

基于 linux shell 命令,先用 sort 进行排序,然后使用 uniq 命令删除重复行。

sort old_file | uniq > new_file

解析:

old_file:原始文件
new_file:去除重复行之后的文件
|:管道操作符,将上一个命令的结果当作下一个命令的输入
>:重定向符,发送上一个命令的输出到某个文件中

注意:上述两种方法都需要先进行排序,再删除重复行。

打赏

本文固定链接: https://www.cxy163.net/archives/3023 | 绝缘体

该日志由 绝缘体.. 于 2023年12月24日 发表在 未分类 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: linux 删除文件相同的行(去重,去除重复行) | 绝缘体
关键字: , , , ,
【上一篇】
【下一篇】

linux 删除文件相同的行(去重,去除重复行):等您坐沙发呢!

发表评论


快捷键:Ctrl+Enter