随笔 - 56,  文章 - 0,  评论 - 0,  阅读 - 95691

随笔分类 -  Python

pandas基本用法
摘要:1、#导入pandas模块 import pandas as pd 2、读取csv文件数据 df = pd.read_csv(file, sep=''\t) #首行作为column_index df = pd.read_csv(file, sep=''\t, header=None)#首行不作为co 阅读全文
posted @ 2025-03-05 19:50 caicai2019 阅读(0) 评论(0) 推荐(0) 编辑
将Python打包成exe文件
摘要:经常需要在多个PC上运行python脚本,但又嫌麻烦在每个PC上都安装python并配置环境。这时使用pyinstaller将python脚本打包成exe软件,可以完美解决上述问题。 首先通过pip install pyinstaller安装pyinstaller包 然后通过命令行pyinstall 阅读全文
posted @ 2025-03-05 19:48 caicai2019 阅读(7) 评论(0) 推荐(0) 编辑
python绘制频次直方图
摘要:笔者有两文件,其中的数据结构如下,要比较两个文件中每行的最大值与次大值的比值的分布情况,通过频次分布图进行比较 #加载lib import pandas as pdimport matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['Si 阅读全文
posted @ 2024-04-03 16:59 caicai2019 阅读(105) 评论(0) 推荐(0) 编辑
python DataFrame函数
摘要:1、读取txt文件,并打印前10行 data = pd.read_table(input.txt) print(data.head(10)) data = pd.read_table(input.txt, header=None) 读取时加上header=None,第一行不作为column name 阅读全文
posted @ 2024-04-03 13:52 caicai2019 阅读(35) 评论(0) 推荐(0) 编辑
ImportError: DLL load failed while importing _cext: 找不到指定的模块
摘要:网上搜索说,这个错误表明Python在尝试导入名为_cext的扩展模块时失败了,这通常是因为它依赖的某些动态链接库(DLL)文件无法被正确加载。这可能是因为相应的DLL文件不存在于预期的位置,或者系统缺少运行该DLL所必需的其他依赖项。 在一个帖子中看到通过pip install msvc-runt 阅读全文
posted @ 2024-04-03 11:49 caicai2019 阅读(4873) 评论(0) 推荐(0) 编辑
python merge函数使用
摘要:函数语法: pd.merge(left, right, how="inner, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True) 参数解释: left - 数据顿对象。 righ 阅读全文
posted @ 2024-03-04 15:58 caicai2019 阅读(134) 评论(0) 推荐(0) 编辑
解决报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 13: invalid start byte
摘要:data_frame = pd.read_csv(Filepath, encoding='utf8') 在使用上述代码读取csv文件时报错“UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 13: invalid 阅读全文
posted @ 2023-07-30 20:01 caicai2019 阅读(852) 评论(0) 推荐(0) 编辑
如何从Notepad++运行python(转载自https://zhuanlan.zhihu.com/p/381986542)
摘要:从Notepad++可以直接配置快捷键运行当前python程序。 点击 运行(R) -运行(R)... 在弹出的输入框内输入以下命令,点击 保存... 分配一个名称与快捷键,即可以按快捷键运行当前程序。 cmd /k cd /d "$(CURRENT_DIRECTORY)" & python "$( 阅读全文
posted @ 2023-07-29 01:31 caicai2019 阅读(419) 评论(0) 推荐(0) 编辑
python安装第三方库
摘要:在使用python时经常会遇到需要安装第三方库的情况,尤其是在一台新的服务器或者电脑上工作的时候。例如,在运行代码时出现下所示提示时,意思是本地没有pandas包,需要安装。此时可以在cmd终端窗口中使用pip进行安装。 Traceback (most recent call last): File 阅读全文
posted @ 2023-07-29 01:15 caicai2019 阅读(111) 评论(0) 推荐(0) 编辑
python修改pip源
摘要:在安装好python后,有时候会根据需要安装一些python包,默认的pip源地址下载速度往往比较慢,经常会报超时错误。比较好的解决办法是修改pip默认源为国内源。国内比较靠谱的源地址有: pypi 清华大学源:https://pypi.tuna.tsinghua.edu.cn/simple pyp 阅读全文
posted @ 2021-01-22 10:12 caicai2019 阅读(1443) 评论(0) 推荐(0) 编辑
python if条件判断dataframe是否为空
摘要:在使用python for循环做数据处理时,会遇到某些文件为空,导致程序报错,可以使用dataframe.empty加if条件判断进行解决 例如: 1 data = pd.read_csv(file, skiprows=1, header=None, error_bad_lines=False) 2 阅读全文
posted @ 2020-06-10 10:26 caicai2019 阅读(19669) 评论(0) 推荐(1) 编辑
python学习——利用循环实现分类散点图绘制
摘要:数据示例 代码实例 阅读全文
posted @ 2019-06-04 15:11 caicai2019 阅读(2759) 评论(0) 推荐(0) 编辑
python学习——通过命令行参数根据fasta文件中染色体id提取染色体序列
摘要:提取fasta文件genome_test.fa中第14号染色体的序列,其内容如下: 用python以及命令行参数实现 新建.py文件“”GetSeqFromChrID.py”, python脚本如下: 命令行参数输入如下:红色字体是输入部分 结果如下: 阅读全文
posted @ 2019-05-15 08:56 caicai2019 阅读(2490) 评论(0) 推荐(0) 编辑
python学习——把读取fasta文件的代码封装成函数
摘要:将读取文件的代码封装成函数,并使其作为模块可在其他程序运行 创建fasta_def.py文件,并输入如下代码: 新建一个test.py文件 输入如下代码调用上述模块fasta_def 阅读全文
posted @ 2019-05-13 09:59 caicai2019 阅读(1565) 评论(0) 推荐(0) 编辑
python学习——把计算GC含量的代码封装成函数
摘要:把代码封装成函数的好处是可以重复使用该段代码,并且会使代码结构清晰 例如要计算chr1以及chr2染色体的GC含量,代码如下: 阅读全文
posted @ 2019-05-13 09:41 caicai2019 阅读(1159) 评论(0) 推荐(0) 编辑
python学习——使用argparse参数解释器传递命令行参数
摘要:argparse是python中用于传递和解析命令行参数的模块,例如: 从cmd输入命令行 E:\15_python\DEBUG>python fasta_argparse.py -avg -min_len 50 100 10 200 40 回车得到 total length:300.00avera 阅读全文
posted @ 2019-05-10 16:35 caicai2019 阅读(629) 评论(0) 推荐(0) 编辑
python学习——生成列表并修改其元素
摘要:以人类染色体个数为例: 通过range()函数快速生成一系列整数,将其一列表的形式存储;对其进行扩展;然后修改列表中的元素(染色体id),生成Chr_形式 cmd终端python代码如下: 用VSCode编写python 阅读全文
posted @ 2019-05-09 09:57 caicai2019 阅读(303) 评论(0) 推荐(0) 编辑
python学习——读取染色体长度(七:for循环对染色体序列进行反向互补)
摘要:对fasta文件genome_test.fa中的染色体序列进行反向互补,并输出到文件genome_test_RC.fa genome_test.fa >chr1ATATATATAT>chr2ATATATATATCGCGCGCGCG>chr3ATATATATATCGCGCGCGCGATATATATAT 阅读全文
posted @ 2019-05-01 14:10 caicai2019 阅读(383) 评论(0) 推荐(0) 编辑
python学习——读取染色体长度(七:读取fasta文件)
摘要:读取fasta文件genome_test.fa,并计算染色体总长,同时输出最长染色体编号、序列以及长度 fasta文件genom_test.fa的内容如下: >chr1ATATATATAT>chr2ATATATATATCGCGCGCGCG>chr3ATATATATATCGCGCGCGCGATATAT 阅读全文
posted @ 2019-04-29 17:56 caicai2019 阅读(1162) 评论(0) 推荐(0) 编辑
python学习——读取染色体长度(六:读取含有染色体长度的文件)
摘要:含有染色体长的文件chr_len.txt chr1 10chr2 20chr3 30chr4 40chr5 50 python脚本 #传递命令行参数 import sys # 导入模块 # 从命令行获取文件名称 f_chr_len = sys.argv[1] # 定义命令行参数,1表示变量1 # 打 阅读全文
posted @ 2019-04-29 11:18 caicai2019 阅读(289) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示