学习日记-4月
4/5/2017
linux:
还是跟3月份的教程是一样的,不过学到了day2了
刚开始看了下fastq的格式(现在是几乎所有的illumina测序平台的通用格式了),然后fastq一个数据有有4行,分别是ID,序列读长,+,和对应的测序质量。这些都是可以在百度或者谷歌搜到的(下次准备单独更新市面上的测序格式)
常见的fastq格式的命令
zcat filename | grep ^*** | wc -l 以***开头的有多少行
| less 查看具体的数据
| head -n 4000 > top_1000.fastq 将前4000行截下来,然后保存(注意,由于一个读长数据占的是4行,所以我们只能获得1000个数据)
| tail -n 4000 > bottom_1000.fastq
然后学习了paste命令,最常用的就是
zcat filename.fastq.gz | paste - - - -(这里的“-”之间是有空格的!!!!),然后就能把原来4行的fastq一个数据变成了以一个4列格式显示。(如果不是很懂这个命令,可以先用ls | paste - -先试试)
zcat filename.fastq.gz | paste - - - - | head -n 1000 > top_1000.txt(这里,由于4行变一行,所以只需要取前1000行即可)
具体的paste的用法可见,http://logo32.iteye.com/blog/1316299
然后初步地学习了linux的大杀器-awk编程
但光看那个手册不是很懂。。。我觉得我得找本资料或者书去看看。。。。。突然感觉我要从入门到放弃了。。
暂定这个网站:http://www.zsythink.net/archives/tag/awk/
4/8/2017
linux:
学习了评估illumina数据的质量(先前已经有过一篇了,可见3月份的生物信息学-教学------ 用FastQC检查二代测序原始数据的质量,不过那篇是转载的)
上面提到了windows下跑很慢,因为你得连接到fastqc的服务器上,所以还是linux下跑比较快。
python:
学习了字符串的转化,初步了解了下元祖(tuple)
学习了python的类型转化,int(),float(),str(),bool()--待学
了解了下函数,自己写了个弱鸡函数,注意def sayHello():-----()和:都不能少,下面的tab缩进!!也不能少,还有不能在定义的函数里面再调用自身。
然后还是决定用笔,纸记笔记了,赵奶奶貌似以前说过抄程序其实也是有帮助的。
4/10/2017
python:
学习了python的加参数
4月的事应该忙完了,应该可以抽出时间来学习编程了,接下来要把R语言也加上了。
4/11/2017
python:
学习了函数的简单使用,大致跟VB还是差不多。但要注意,python的函数是要有返回值的,即return,如果没有返回值,会得到一个None的对象,具体也可以见
https://www.zhihu.com/question/23765556/answer/25592016
http://www.iplaypy.com/jinjie/return.html
这两篇综合起来看
cross 先生最后说到:函数可以把某个功能的代码分离出来,在需要的时候重复使用,就像拼装积木一样,这会让程序结构更清晰。让我突然感觉其实函数跟合成生物学有点相似,都是把一类东西封装了,想用的时候拿出来用就行了
4/13/2017
python:
学了if,else,elif。大致跟VB还是一样,有点明白return这个东西了。
感觉最近越来越忙了。。。。。
4/22/2017python:
学了list相关的内容,学了索引,还学了切片。注意切片的话,开始位置包含在切片里面,结束位置不包含。