分类:未分类
sort命令默认并不以ASCII排序
咱们在课程中讲,sort命令默认以ASCII排序,但这是要一个前提的。先来看看ASCII表:
做个实验吧:
1.txt文件内容如下:
1
2
a
[
b
A
C
{
*
sort的时候,结果并不是按ASCII排序的:
[
{
*
1
2
a
A
b
C
这结果很明显不对。
man sort的时候发现了一个信息:
*** WARNING *** The locale specified by the environment affects sort order. Set LC_ALL=C to get the traditional sort order that uses native byte values.
它意思是说,sort排序的结果会跟运行sort的系统环境有关系,而影响sort排序结果的环境变量为LC_ALL,如果想要按ASCII排序,需要设置LC_ALL=C
我们在系统上查看该变量
echo $LC_ALL 结果为空,然后设置一下:
export LC_ALL=C
再次排序:
*
1
2
A
C
[
a
b
{
这次结果对了。
bzip2和xz的默认压缩级别验证
一个1.1G的日志文件
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -sh logfile
1.1G logfile
[root@izwz98t5u2dsk7xaviccuhz tmp]# cp logfile logfile_9
[root@izwz98t5u2dsk7xaviccuhz tmp]# cp logfile logfile_6
[root@izwz98t5u2dsk7xaviccuhz tmp]# bzip2 logfile
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -sm logfile.bz2
42 logfile.bz2
[root@izwz98t5u2dsk7xaviccuhz tmp]# bzip2 -6 logfile_6
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -sh logfile_6.bz2
46M logfile_6.bz2
到这里,就不用继续压缩logfile_9了吧。 答案已经确定,bzip2默认压缩级别就是9.
而xz的测试结果,有点匪夷所思。
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -s logfile_9.xz
48796 logfile_9.xz
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -s logfile_6.xz
47908 logfile_6.xz
[root@izwz98t5u2dsk7xaviccuhz tmp]# du -s logfile_default.xz
47908 logfile_default.xz
有一点可以肯定,xz默认压缩级别为6,但是用9级别压缩时,反而比6级别还要大一些,怪事。
grep命令的-P选项
2017年7月9日
未分类
No Comments
aming
man grep的时候有一个-P,文档上的英文:
-P, –perl-regexp
Interpret PATTERN as a Perl regular expression. This is highly experimental and grep -P may warn of nimplemented features.
这意思是,-P 可以让grep使用perl的正则表达式语法,因为perl的正则更加多元化,能实现更加复杂的场景。
最典型的用法是,匹配指定字符串之间的字符。 比如,我们想在一句话(Hello,my name is aming.)中匹配中间的一段字符串(my name is) 可以这样写正则表达式。
echo “Hello, my name is aming.”|grep -P ‘(?<=Hello, ).*(?= aming.)’
如果只需要匹配到的部分,还可以加上-o选项
echo “Hello, my name is aming.”|grep -Po ‘(?<=Hello, ).*(?= aming.)’
根据这个思路,我们可以去匹配IP地址
ifconfig eth0 |grep -Po ‘(?<=addr:).*(?= Bcast)’
grep正则