根据基因名批量查询下载PDB蛋白结构数据库
下载Using EntrezDirect as noted to get structure accessions
https://www.ncbi.nlm.nih.gov/books/NBK179288/
1 2 3 4 5 | for i in ` cat all.epi.regulators.txt` do echo $i esearch -db structure -query "$i [GENE]" | esummary | xtract -pattern DocumentSummary -element PdbAcc,ExpMethod,Resolution,PdbClass,PdbDepositDate,PdbDescr,string > $i.pdb_id done |
偶尔会有网络连接问题
最后再下一遍
1 2 3 | ls *.pdb_id | sed "s/.pdb_id//" > downloaded.list grep -vxFf downloaded.list all.epi.regulators.txt |
参考:
- http://localhost:17449/lab/tree/projects/LiLab/selfDB/Drug-DB/Drug_to_gene.ipynb
- ~/projects/LiLab/selfDB/rcsb_PDB/
- https://www.biostars.org/p/9576260/
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2021-12-13 初探投行 | 金融
2016-12-13 Sun Grid Engine (SGE)大型集群作业调度系统
2016-12-13 生物医学专利申请 | US Patent
2016-12-13 Hacker Technology
2016-12-13 shell中for循环