python中统计基因组所含scaffolds总数、碱基总个数
2022/8/9 1:25:26
本文主要是介绍python中统计基因组所含scaffolds总数、碱基总个数,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
001、
(base) root@PC1:/home/test# ls ## 测试数据及脚本 a.fasta test.py (base) root@PC1:/home/test# cat a.fasta ## 测试数据 >scaffold_1 CCCGGGTAAAACGGGTCTTCAAGAAAACGCTCCTCCGTTAATGCCGGCCGATTCAAATAA CCTCTGGCAACACCCGCTCCGGCAATGTATAGTTCACCGATACATCCAACAGGCAGCATC GGCCC >scaffold_2 CTGTTGCTCCTGTTGCTCCTGTTGATCCCGTTGCACCTGTTGGTCCAGTCGGTCCAATTC >scaffold_3 TTGATCCAGTGGCTCCGGTTACTCCAGTTGATCCTGTTGCGCCTGTTGCTCCAGTTTCTC CGGTTGGTCCGGTTGATCCGGTTGCACCTGTTACTCCAGTGGCTCCGGTTACTCCCGTCG CTGTTGCTCCTGTTGCTCCTGTTGATCCCGTTGCACCTGTTGGTCCAGTCGGTCCAATTC (base) root@PC1:/home/test# cat test.py ## 脚本 #!/usr/bin/python in_file = open("a.fasta", "r") out_file = open("result.txt", "w") import re total_sca = 0 total_len = 0 total_len_gc = 0 for i in in_file: i = i.strip() if i[0] == ">": total_sca += 1 else: total_len += len(i) total_len_gc += len(re.findall("[GCgc]", i)) print("n_scofflod", "total_len", "total_len_gc", "proportion_gc", file = out_file, sep = "\t") print(total_sca, total_len, total_len_gc, total_len_gc/total_len, file = out_file, sep = "\t") in_file.close() out_file.close() (base) root@PC1:/home/test# python test.py ## 执行程序 (base) root@PC1:/home/test# ls a.fasta result.txt test.py (base) root@PC1:/home/test# cat result.txt ## 查看统计结果 n_scofflod total_len total_len_gc proportion_gc 3 365 203 0.5561643835616439
参考:https://mp.weixin.qq.com/s?__biz=MzIxNzc1Mzk3NQ==&mid=2247491482&idx=1&sn=596fd0f0e7d41757e1e539f3223a8c8c&chksm=97f5af82a08226943da69bca8228480d4b708ca2c89f8008281f140682e8814b43cf49d60762&scene=178&cur_album_id=2403674812188688386#rd
这篇关于python中统计基因组所含scaffolds总数、碱基总个数的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门
- 2024-11-14Python编程入门指南
- 2024-11-13Python基础教程
- 2024-11-12Python编程基础指南
- 2024-11-12Python基础编程教程
- 2024-11-08Python编程基础与实践示例
- 2024-11-07Python编程基础指南