学习日记-4月

4/5/2017

linux:

还是跟3月份的教程是一样的,不过学到了day2了

刚开始看了下fastq的格式(现在是几乎所有的illumina测序平台的通用格式了),然后fastq一个数据有有4行,分别是ID,序列读长,+,和对应的测序质量。这些都是可以在百度或者谷歌搜到的(下次准备单独更新市面上的测序格式)

常见的fastq格式的命令

zcat filename | grep ^*** | wc -l         以***开头的有多少行

                     | less                              查看具体的数据

                     | head -n 4000 > top_1000.fastq 将前4000行截下来,然后保存(注意,由于一个读长数据占的是4行,所以我们只能获得1000个数据)

       | tail -n 4000 > bottom_1000.fastq

然后学习了paste命令,最常用的就是

zcat filename.fastq.gz | paste - - - -(这里的“-”之间是有空格的!!!!),然后就能把原来4行的fastq一个数据变成了以一个4列格式显示。(如果不是很懂这个命令,可以先用ls | paste - -先试试)

zcat filename.fastq.gz | paste - - - - | head -n 1000 > top_1000.txt(这里,由于4行变一行,所以只需要取前1000行即可)

具体的paste的用法可见,http://logo32.iteye.com/blog/1316299

然后初步地学习了linux的大杀器-awk编程

但光看那个手册不是很懂。。。我觉得我得找本资料或者书去看看。。。。。突然感觉我要从入门到放弃了。。

暂定这个网站:http://www.zsythink.net/archives/tag/awk/

 

4/8/2017

 linux:

学习了评估illumina数据的质量(先前已经有过一篇了,可见3月份的生物信息学-教学------  用FastQC检查二代测序原始数据的质量,不过那篇是转载的)

 上面提到了windows下跑很慢,因为你得连接到fastqc的服务器上,所以还是linux下跑比较快。

python:

学习了字符串的转化,初步了解了下元祖(tuple)

学习了python的类型转化,int(),float(),str(),bool()--待学

了解了下函数,自己写了个弱鸡函数,注意def sayHello():-----()和:都不能少,下面的tab缩进!!也不能少,还有不能在定义的函数里面再调用自身。

然后还是决定用笔,纸记笔记了,赵奶奶貌似以前说过抄程序其实也是有帮助的。

 

4/10/2017

python:

学习了python的加参数

4月的事应该忙完了,应该可以抽出时间来学习编程了,接下来要把R语言也加上了。

 

4/11/2017

python:

学习了函数的简单使用,大致跟VB还是差不多。但要注意,python的函数是要有返回值的,即return,如果没有返回值,会得到一个None的对象,具体也可以见

https://www.zhihu.com/question/23765556/answer/25592016

http://www.iplaypy.com/jinjie/return.html

这两篇综合起来看

cross 先生最后说到:函数可以把某个功能的代码分离出来,在需要的时候重复使用,就像拼装积木一样,这会让程序结构更清晰。让我突然感觉其实函数跟合成生物学有点相似,都是把一类东西封装了,想用的时候拿出来用就行了

4/13/2017

python:

学了if,else,elif。大致跟VB还是一样,有点明白return这个东西了。

感觉最近越来越忙了。。。。。

4/22/2017python:

学了list相关的内容,学了索引,还学了切片。注意切片的话,开始位置包含在切片里面,结束位置不包含。

posted @ 2017-04-05 15:14  熵负  阅读(174)  评论(0编辑  收藏  举报