用CPU来加速你的Linux命令_环球速读
在处理大数据的时候我们总会想着一些并行的操作来加速我们的操作,我们的cpu是多核多线程的,但是我们的有些命令却是单线程的命令,不能够进行并行的运算,如: grep、bzip2、wc、awk、sed等等,只能使用一个CPU内核。要想让Linux命令使用所有的CPU内核,我们需要用到GNU Parallel命令,下面我们技术下加速的方法吧 |
我们都知道 grep, bzip2, wc, awk, sed等等,都是单线程的,只能使用一个CPU内核。那么如何才能使用这些内核?
要想让Linux命令使用所有的CPU内核,我们需要用到GNU Parallel命令,它让我们所有的CPU内核在单机内做神奇的map-reduce操作,当然,这还要借助很少用到的–pipes 参数(也叫做–spreadstdin)。这样,你的负载就会平均分配到各CPU上,真的。
BZIP2bzip2是比gzip更好的压缩工具,但它很慢!别折腾了,我们有办法解决这问题。
(资料图片)
以前的做法:
cat bigfile.bin | bzip2 --best > compressedfile.bz2
现在这样:
cat bigfile.bin | parallel --pipe --recend "" -k bzip2 --best > compressedfile.bz2
尤其是针对bzip2,GNU parallel在多核CPU上是超级的快。你一不留神,它就执行完成了。
GREP如果你有一个非常大的文本文件,以前你可能会这样:
grep pattern bigfile.txt
现在你可以这样:
cat bigfile.txt | parallel --pipe grep "pattern"
或者这样:
cat bigfile.txt | parallel --block 10M --pipe grep "pattern"
这第二种用法使用了 –block 10M参数,这是说每个内核处理1千万行——你可以用这个参数来调整每个CUP内核处理多少行数据。
AWK下面是一个用awk命令计算一个非常大的数据文件的例子。
常规用法:
cat rands20M.txt | awk "{s+=$1} END {print s}"
现在这样:
cat rands20M.txt | parallel --pipe awk \"{s+=\$1} END {print s}\" | awk "{s+=$1} END {print s}"
这个有点复杂:parallel命令中的–pipe参数将cat输出分成多个块分派给awk调用,形成了很多子计算操作。这些子计算经过第二个管道进入了同一个awk命令,从而输出最终结果。第一个awk有三个反斜杠,这是GNU parallel调用awk的需要。
WC想要最快的速度计算一个文件的行数吗?
传统做法:
wc -l bigfile.txt
现在你应该这样:
cat bigfile.txt | parallel --pipe wc -l | awk "{s+=$1} END {print s}"
非常的巧妙,先使用parallel命令‘mapping’出大量的wc -l调用,形成子计算,最后通过管道发送给awk进行汇总。
SED想在一个巨大的文件里使用sed命令做大量的替换操作吗?
常规做法:
sed s^old^new^g bigfile.txt
现在你可以:
cat bigfile.txt | parallel --pipe sed s^old^new^g
…然后你可以使用管道把输出存储到指定的文件里。
原文来自:https://linux.cn/article-2188-1.html
本文地址:https://www.linuxprobe.com/use-cpu-commands.html
本文原创地址:https://www.linuxprobe.com/use-cpu-commands.html
标签:
相关文章
电动化不是万能药:美国汽车制造商喜欢的大型电动车资源消耗巨大 快播报
IT之家5月7日消息,推广电动汽车是应对气候危机的重要措施之一,但是美国汽车市场上,越来越多的电动汽车变
天天速看:海南省专业技术人员继续教育网登录_海南省专业技术人员继续教育网
1、不是有大纲嘛专业课的大纲,海南大学应该发布的,照着大纲来就行。2、基本上就是大纲没有的就不用看了,
计划招聘480人!海南省2023年上半年事业单位公开招聘笔试开考 环球新要闻
原标题:计划招聘480人!海南省2023年上半年事业单位公开招聘笔试开考海南日报记者易宗平通讯员冯青山5月7
【世界说】退役美军勒死黑人流浪汉!美媒:美国社会对黑人的暴力刻板印象根深蒂固
中国日报网5月6日电据美国全国广播公司(NBCNews)报道,当地时间5月1日下午2点30分左右,纽约一名患有精神
捡到OPPOr17求解锁(捡到oppor17怎么解锁简介介绍)
对于捡到oppor17怎么解锁这个问题感兴趣的朋友应该很多,这个也是目前大家比较关注的问题,那么下面小好小
焦点热文:京东方A:毛利率降至10年来最低,今年6月成分水岭?| 看财报
今年一季度京东方A的毛利率达到十年最低点的6 84%,同比下滑68%。钛媒体App梳理数据看到,显示器件业务的毛
重点聚焦!恶魔岛动画版_恶魔岛动画网站
1、不一定,bilibili上可以看,而且更新的很快。2、还有许多关于动漫的MAD,音乐,pv。3、最新资讯等等,但是注
崩坏星穹铁道冬兵进行曲任务攻略 冬兵进行曲冒险任务通关解析
崩坏星穹铁道冬兵进行曲任务怎么完成?冬兵进行曲是游戏中的冒险任务,玩家在等级达到了26级之后就可以解锁
每日看点!海南省对2022年度全省行政执法案卷进行评查
近日,省司法厅组织开展2022年度全省行政执法案卷评查工作,对全省市场监管、生态环境、农业农村、旅游文化
全球短讯!从IU李钟硕,到林智妍李道贤,明星公开约会,获韩网友们的支持?
从演员IU、李钟硕,到林智妍、李道贤,韩国的演艺圈最近流行公开约会,据悉,她们都获得了韩国网友们的支持
天天快消息!有种危险叫二次事故!来看看发生在绕越高速的这起案例吧
扬子晚报网5月6日讯(记者郭一鹏通讯员通讯员李焱)车辆在高速公路上行驶,驾驶人需要密切关注道路通行状况
全国首创智慧用能平台 黄埔区拟推155家工业园区转供电改革|全球今亮点
5月6日,广州市黄埔区、广州开发区发布工业园区转供电改革实施方案(下称“实施方案”),并正式上线“埔e
花样年境外债重组获76%支持 近半债务实现债转股
5月6日晚间,花样年(股票代码:1777 HK)发布有关境外债务重组的公告称,占公司现有债务工具76 44%的持有
17家房企主体拼抢北京丰台青塔地块 建工+城乡房屋“摇中”
新京报讯(记者袁秀丽)5月6日,北京丰台青塔、大兴西红门两宗宅地进行现场竞拍。其中,青塔意向拿地房企及