随笔分类 - Daily Blog
摘要:20230112 Notepad++ 使用技巧之--把没有html规范格式的html文本变成有缩进的规范格式: 下载插件XML Tools restart Notepad++ 选中文本,使用快捷键:Ctrl + Shift + Alt + B R的一个函数:sink 可以把R当前的数据通过sink(
阅读全文
摘要:20230202 HTML文件和bs4使用 HTML有下面几部分: 便签(tag) : soup = BeautifulSoup('<b class="boldest">Extremely bold</b>', 'html.parser') <!-- 这就是b标签--> tag = soup.b t
阅读全文
摘要:20230203 bs4的BeautifulSoup有三种解码方式: html.parser lxml lxml-xml 但是解析svg的话,感觉lxml-xml方式可以更好的还原文件,保证一致性.
阅读全文
摘要:20230111 今天发现下载smpdb的数据有点问题,没有下载完全并且感觉自己的思路错了.可能还是需要去做更多的事情来可视化.比如解析SBGN或者SBML. 想尝试一下自己改动一下PC合成的svg,再看看是否可以进一步更改.
阅读全文
摘要:20230131 使用下面的方法对一个字符串一次性的进行不同替换 s = 'one two one two one' print(s.translate(str.maketrans({'o': 'O', 't': 'T'})))
阅读全文
摘要:20230201 在linux中启动rstdio: 使用conda把rstudio安装好后,想启动的话需要先激活相应的conda,再启动rstudio,不然会启动失败.
阅读全文
摘要:20230103 做多线程爬虫,需要有些对抗反扒机制的措施. 有些时候直接写多线程,比如python的multiprocessing,会发现抓不下来东西.这也可能是我的爬虫没写好.但是就是发现同样的代码,不使用多线程就可以抓下来.使用多线程就啥也抓不下来. 这次写爬虫发现了一个取巧的办法,就是反扒机
阅读全文
摘要:20221229 使用下面的命令可以对Linux的结果进行排序 ll -h | awk '{print \$5}' |sort |uniq -c python的pandas读取csv和筛选某一列中数据也在list中 import pandas as pd dataFrame = pd.read_cs
阅读全文
摘要:20221206 今天看了刘永鑫写的ImageGP包的代码和网站,感觉做的不错.代码是使用bash调用R的,可以学习一下,下面的操作 地址是这里 下面是.sh的用法说明的部分 usage() {..... ${txtbld}OPTIONS${txtrst}: #这部分是参数 -f Data file
阅读全文