5、一些短脚本
(9)计算平均氢键数量,以及平均界面面积
##hbond
hb_ave=$(awk 'NR > 1 {sum += $2 + $3} END {if (NR > 1) print sum / (NR - 1)}' "HB.dat")
echo "average of H_bond: $hb_ave"
##sasa 将每一帧的界面面积结果输出到文件中
paste SA-N_teminal.dat SA-C_teminal.dat SA-complex.dat | grep -ve '-1.0000' | awk '{print $1,($2+$4-$6)/2}' >contact_area.dat
#使用NR>1来忽略第一行,然后对第二列求和。在END块中,如果总行数>1,则计算平均值并输出。
average=$(awk 'NR > 1 {sum += $2} END {if (NR > 1) print sum / (NR - 1)}' "contact_area.dat")
echo "average of SASA: $average"
(1)#取出log文件中带有“Value”的第二个匹配行
for ff in `ls *log`;do sed -n '/Value/p' $ff | sed -n 2p >> s2s2.dat;done
(2)#取出log文件中带有“Value”的第二个匹配行的第九列
for ff in `ls *log`;do sed -n '/Value/p' $ff | sed -n 1p | awk '{print $9}'>> s1s1.dat;done
(3)#将每一行的数字除以18然后输出到新文件中去
for line in `cat 330_bcl850.dat`;do echo "scale=5;$line/18"| bc >> 330bcl850.dat;done
(4)#将文件夹bcl_addh_gjf中的000.gjf 001.gjf...文件移动到frame0 1 2 ...9文件夹下
for i in 0 1 2 3 4 5 6 7 8 9;do mkdir frame$i;done
for i in 0 1 2 3 4 5 6 7 8 9;do mv bcl_addh_gjf/*"00$i"* frame$i;done
(5)#输出文件夹frame8中所有文件的相对路径,\为转义符
find frame8/* | sed 's/^/.\//' > 888.txt
(6)#将gjf文件转换成xyz文件
for i in `ls *dat`;
do
aa=`echo $i | sed 's/\.dat//g'`
echo $aa
wc -l $i | awk {'print $1 - 11'} > $aa.xyz;echo '' >>$aa.xyz
head -n -3 $i | tail -n +9 >> $aa.xyz
done
(7)#一列数求和,取平均,取极值等
cat r_270.dat | awk '{sum+=$1} END {print "average=",sum/NR}' #sum
cat data|awk '{sum+=$1} END {print "Average = ", sum/NR}' #average
cat data|awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print "Max=", max}' #max
cat data|awk 'BEGIN {min = 1999999} {if ($1<min) min=$1 fi} END {print "Min=", min}' #min
cat rmsd_average.dat | awk '{print $2}' | awk 'BEGIN {min = 1999999} {if ($1<min) min=$1 fi} END {print "Min=", min}' #min 第二列
awk '{x[NR]=$0; s+=$0; n++} END{a=s/n; for (i in x){ss += (x[i]-a)^2} sd = sqrt(ss/n); print "SD = "sd}' angle_sdt.dat #求一列数的标准差
(8)第二列去重
cat dis.dat | awk '!a[$2]++{print}' | awk '{print $2}'
4,、shell中的引号
单引号表示完全不希望处理引起来的字符,就是字符串
双引号与单引号一样,但是双引号会确切地处理引起来的文字中的转移字符、算术、命令替换等。
3,求一列数的标准差
awk '{x[NR]=$0; s+=$0; n++} END{a=s/n; for (i in x){ss += (x[i]-a)^2} sd = sqrt(ss/n); print "SD = "sd}' angle_sdt.dat
2,每隔50行取一下平均(作图用)
awk '{SUM+=$1}NR%50==0{print SUM/50;SUM=0}END {if (NR%50) {print SUM/(NR%50)}}' angle_cpp.agr > angle.dat
1,文件去重,删除相同的行
(1)sort -u file3 或者 sort file3 | uniq #先排序再去重
(2)awk ' !x[$0]++' file3 #直接去重
本文来自博客园,作者:计算之道,转载请注明原文链接:https://www.cnblogs.com/jszd/p/13495077.html