Fork me on GitHub

随笔分类 -  Daily Blog

摘要:20230112 Notepad++ 使用技巧之--把没有html规范格式的html文本变成有缩进的规范格式: 下载插件XML Tools restart Notepad++ 选中文本,使用快捷键:Ctrl + Shift + Alt + B R的一个函数:sink 可以把R当前的数据通过sink( 阅读全文
posted @ 2023-02-09 11:58 Mo槑 阅读(10) 评论(0) 推荐(0) 编辑
摘要:20230202 HTML文件和bs4使用 HTML有下面几部分: 便签(tag) : soup = BeautifulSoup('<b class="boldest">Extremely bold</b>', 'html.parser') <!-- 这就是b标签--> tag = soup.b t 阅读全文
posted @ 2023-02-08 14:32 Mo槑 阅读(91) 评论(0) 推荐(0) 编辑
摘要:20230203 bs4的BeautifulSoup有三种解码方式: html.parser lxml lxml-xml 但是解析svg的话,感觉lxml-xml方式可以更好的还原文件,保证一致性. 阅读全文
posted @ 2023-02-08 14:31 Mo槑 阅读(80) 评论(0) 推荐(0) 编辑
摘要:20230111 今天发现下载smpdb的数据有点问题,没有下载完全并且感觉自己的思路错了.可能还是需要去做更多的事情来可视化.比如解析SBGN或者SBML. 想尝试一下自己改动一下PC合成的svg,再看看是否可以进一步更改. 阅读全文
posted @ 2023-02-08 14:31 Mo槑 阅读(62) 评论(0) 推荐(0) 编辑
摘要:20230131 使用下面的方法对一个字符串一次性的进行不同替换 s = 'one two one two one' print(s.translate(str.maketrans({'o': 'O', 't': 'T'}))) 阅读全文
posted @ 2023-02-08 14:31 Mo槑 阅读(9) 评论(0) 推荐(0) 编辑
摘要:20230201 在linux中启动rstdio: 使用conda把rstudio安装好后,想启动的话需要先激活相应的conda,再启动rstudio,不然会启动失败. 阅读全文
posted @ 2023-02-08 14:31 Mo槑 阅读(64) 评论(0) 推荐(0) 编辑
摘要:20230103 做多线程爬虫,需要有些对抗反扒机制的措施. 有些时候直接写多线程,比如python的multiprocessing,会发现抓不下来东西.这也可能是我的爬虫没写好.但是就是发现同样的代码,不使用多线程就可以抓下来.使用多线程就啥也抓不下来. 这次写爬虫发现了一个取巧的办法,就是反扒机 阅读全文
posted @ 2023-01-04 22:18 Mo槑 阅读(19) 评论(0) 推荐(0) 编辑
摘要:20221229 使用下面的命令可以对Linux的结果进行排序 ll -h | awk '{print \$5}' |sort |uniq -c python的pandas读取csv和筛选某一列中数据也在list中 import pandas as pd dataFrame = pd.read_cs 阅读全文
posted @ 2022-12-29 22:06 Mo槑 阅读(11) 评论(0) 推荐(0) 编辑
摘要:20221206 今天看了刘永鑫写的ImageGP包的代码和网站,感觉做的不错.代码是使用bash调用R的,可以学习一下,下面的操作 地址是这里 下面是.sh的用法说明的部分 usage() {..... ${txtbld}OPTIONS${txtrst}: #这部分是参数 -f Data file 阅读全文
posted @ 2022-12-06 21:55 Mo槑 阅读(19) 评论(0) 推荐(0) 编辑