At present there is no detailed manual for this application, you will simply have to play around and see what happens.
CentriVision 旨在提供一个简单而强大的工具,用于分析和可视化基因组中着丝粒的结构。它支持从基因组中提取和分析着丝粒相关信息,并提供丰富的可视化功能,以帮助研究人员深入理解着丝粒的组织和功能。
你可以使用 pip 来安装 CentriVision:
pip install CentriVision
或者,你也可以从本地安装 CentriVision 的 wheel 文件:
pip install CentriVision-0.0.0-py3-none-any.whl
软件依赖TRF,Mafft,Muscle
以下以 ubuntu操作系统 用户名为charles 的conda3 python3.11环境为例
默认安装路径:
/home/charles/anaconda3/lib/python3.11/site-packages/CentriVision/
查看依赖文件:
cat /home/charles/anaconda3/lib/python3.11/site-packages/CentriVision/conf.ini
[ini]
trf_path = /usr/bin/trf
mafft_path = /usr/bin/mafft
muscle_path = /usr/bin/muscle
使用vim或其它编辑器修改对应依赖软件位置TRF\Mafft\Muscle 并保存
命令: CentriVision -h
usage: CentriVision [options]
runing CentriVision
options:
-h, --help show this help message and exit
-v, --version show program's version number and exit
-ps PALINDROMIC Palindromic sequence 查询基因组中的回文序列;
-trf TRF run TRF(Tandem Repeat Finder) 通过TRF查找串联重复序列;
-cf CENTRIFINDER Centrifinder 着丝粒预测;
-d DOTPLOT Dotplot 重复序列点图;
-hmap HEATMAP Heatmap 区域相似度热图;
-gc GET_CENTRI Get_centri 提取基因组的指定区域;
查看对应参数
命令: CentriVision -d ?
将参数重定向到配置文件total.conf
覆盖式命令: CentriVision -d ? > total.conf
追加式命令: CentriVision -d ? >> total.conf
配置文件:
[Dotplot]
genome_file = genome file
windows = 4000
minlength = 8
poly = False
cpu = 16
outfile = out dotplot
参数解释:
genome_file 着丝粒fasta文件
windows 窗口宽度
minlength 最短重复片段
poly 单碱基重复去除
cpu 线程数
outfile 着丝粒特征文件
功能执行:
命令: CentriVision -d total.conf
查看对应参数
命令: CentriVision -hmap ?
将参数重定向到配置文件total.conf
覆盖式命令: CentriVision -hmap ? > total.conf
追加式命令: CentriVision -hmap ? >> total.conf
配置文件:
[Heatmap]
centromere_file = genome file
align_software = muscle or mafft
color_mode = Discrete or Gradient
split = 1000
out_path = out path
参数解释:
centromere_file 着丝粒fasta文件
align_software 多序列比对软件支持 muscle or mafft
color_mode 颜色模式支持 Discrete or Gradient
split 每着丝粒拆分为1000等份
out_path 输出路径
功能执行:
命令: CentriVision -hmap total.conf
结果