随笔分类 -  python

CPTAC CT数据下载过程记录
摘要:下载官网提供的客户端总也下不好 所以用代码下,确保挂了梯子 下好pycharm 或者其他的python编程IDE。两行代码,阅读下载的log日志,如果网速影响导致没有下全,重复运行几次,他会再次把没有下好的数据重新下载。 点击查看代码 from tcia_utils import nbia df = 阅读全文
posted @ 2025-08-23 16:19 Bonjour_! 阅读(95) 评论(0) 推荐(0)
linux上批量将pdf转为png文件
摘要:点击查看代码 import fitz # pip install pymupdf -i https://pypi.tuna.tsinghua.edu.cn/simple/ import os def pdf2img(pdf_path, zoom_x, zoom_y): """ 参数说明 :param 阅读全文
posted @ 2024-09-18 12:59 Bonjour_! 阅读(139) 评论(0) 推荐(0)
批量修改Fasta文件中序列的名称
摘要:比如一个Fasta文件的内容如下: seq001|aaa ATCGGGG seq002|bbb AAAATTTT 删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称 点击查看代码 #!/usr/bin/env python import sys import pysam wi 阅读全文
posted @ 2023-10-30 10:51 Bonjour_! 阅读(551) 评论(0) 推荐(0)
最长蛋白序列和最长转录本提取
摘要:#### 1. 第一种数据格式为protein.fa(translated.fa) 和 gene.gtf文件,序列信息如下 ![](https://img2023.cnblogs.com/blog/1775879/202307/1775879-20230731150638409-1442956648 阅读全文
posted @ 2023-07-31 16:08 Bonjour_! 阅读(889) 评论(0) 推荐(0)
scanpy 去批次pipeline
摘要:### 1. 脚本主要内容 * 批量读取下机数据 * 计算双细胞比例 * BBKNN去除批次效应 * 去除细胞周期的影响 * 转换为seurat对象 ### 2. 脚本 点击查看代码 ``` import scanpy as sc import anndata as an import pandas 阅读全文
posted @ 2023-07-06 15:02 Bonjour_! 阅读(703) 评论(0) 推荐(0)
hotspot
摘要:点击查看代码 ``` import argparse import scanpy as sc import hotspot import numpy as np import mplscience import matplotlib import matplotlib.pyplot as plt i 阅读全文
posted @ 2023-07-03 11:50 Bonjour_! 阅读(79) 评论(0) 推荐(0)
cellrnger -mulit 上游分析pipeline脚本记录
摘要:1. 多线程返回值的获取 点击查看代码 ``` import argparse import os from pickle import FALSE import threading import shutil import datetime import json import time impo 阅读全文
posted @ 2023-06-29 15:02 Bonjour_! 阅读(59) 评论(0) 推荐(0)
函数集合
摘要:01 提取不同文件夹下同名文件 点击查看代码 def select(dir,name): import os import shutil list1 =[] list2 = [] dd = '' for root,dirs,files in os.walk(dir): for file in fil 阅读全文
posted @ 2022-09-30 14:00 Bonjour_! 阅读(91) 评论(0) 推荐(0)
提取最长转录本|多物种批量操作版
摘要:点击查看代码 #!/usr/bin/env python # -*- coding=utf-8 -*- ''' 提取序列文件中最长的转录本ID 需要修改######位置的参数 以及 open的目录 ''' import sys import re Fasta=open("/Business/psn_ 阅读全文
posted @ 2022-09-28 17:49 Bonjour_! 阅读(462) 评论(0) 推荐(0)