鲲鹏云服务器移植RNACocktail

网友投稿 492 2022-05-28

RNACocktail-pipeline由用于RNA-Seq分析不同步骤的高精度工具组成。它可以对短读技术和长读技术进行广谱的RNA-Seq分析,以从转录组数据中获得有意义的解析。

开发语言:python

一句话描述:准确高效的RNA-Seq分析的综合框架

开源协议:Apache 2.0

建议的版本

根据实际需要选择版本,本文档以“RNACocktail release 0.3.1”为例进行说明。

云服务器要求

本文以云服务器KC1实例测试,云服务器配置如表 云服务器配置所示。

项目

说明

规格

kc1.large.2 | 2vCPUs | 4GB

磁盘

系统盘:高IO(40GB)

鲲鹏云服务器移植RNACocktail

操作系统要求

操作系统要求如表 操作系统要求所示。

项目

说明

下载地址

CentOS

7.6

在公共镜像中已提供。

Kernel

4.14.0-115

在公共镜像中已提供。

安装相关依赖。

yum install python2 python2-devel BEDTools zlib-devel bzip2-devel xz-devel -y

安装samtools,参考https://www.huaweicloud.com/kunpeng/software/samtools.html

安装hisat2,参考https://support.huaweicloud.com/prtg-kunpenghpcs/kunpenghpcs_prtg_0014.html

安装stringtie,参考https://www.huaweicloud.com/kunpeng/software/stringtie.html

安装相关python包。

pip install pybedtools

获取“RNACocktail release 0.3.1”源码包。

cd /usr/local/src

wget https://github.com/bioinform/rnacocktail/archive/v0.3.1.tar.gz

解压并进入源码目录。

tar -zxvf v0.3.1.tar.gz

cd rnacocktail-0.3.1

执行编译脚本。

python setup.py install

编辑测试脚本

测试脚本中直接使用下载的x86版的stringtie、hisat2和smatools进行测试,在鲲鹏服务器上无法使用,因此需要把脚本中的相应软件替换成我们自己安装的版本。

cd test

vim test_run.sh

修改前

echo "Download HISAT2 binaries"

wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip

echo "Unzip HISAT2 binaries"

unzip hisat2-2.0.5-Linux_x86_64.zip

echo "Index genome with HISAT2"

./hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2

echo "Test alignment step using HISAT2"

run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz  --2 ../A1_2.fq.gz --hisat2 hisat2-2.0.5/hisat2 --hisat2_sps hisat2-2.0.5/hisat2_extract_splice_sites.py  --samtools samtools --sample A

echo "Download StringTie binaries"

wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz

echo "Untar StringTie binaries"

tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz

echo "Test reconstruction step using StringTie"

run_rnacocktail.py reconstruct --alignment_bam work/hisat2/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie stringtie-1.3.3.Linux_x86_64/stringtie --sample A

修改后(加粗部分需要修改,其他部分不变。加“#”为屏蔽掉stringtie和hisat2的下载和安装,因为我们自己已经安装过了。其他加粗部分分别为hisat2、samtools和stringtie的安装路径)

#echo "Download HISAT2 binaries"

#wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.0.5-Linux_x86_64.zip

#echo "Unzip HISAT2 binaries"

#unzip hisat2-2.0.5-Linux_x86_64.zip

echo "Index genome with HISAT2"

/opt/hisat2-2.0.5/hisat2-build Homo_sapiens.GRCh37.75.dna.chromosome.21.fa Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2

echo "Test alignment step using HISAT2"

run_rnacocktail.py align --align_idx Homo_sapiens.GRCh37.75.dna.chromosome.21.HISAT2 --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --1 ../A1_1.fq.gz  --2 ../A1_2.fq.gz --hisat2 /opt/hisat2-2.0.5/hisat2 --hisat2_sps /opt/hisat2-2.0.5/hisat2_extract_splice_sites.py  --samtools /usr/bin/samtools --sample A

#echo "Download StringTie binaries"

#wget http://ccb.jhu.edu/software/stringtie/dl/stringtie-1.3.3.Linux_x86_64.tar.gz

#echo "Untar StringTie binaries"

#tar -xzvf stringtie-1.3.3.Linux_x86_64.tar.gz

echo "Test reconstruction step using StringTie"

run_rnacocktail.py reconstruct --alignment_bam /opt/hisat2-2.0.5/A/alignments.sorted.bam --outdir out --workdir work --ref_gtf Homo_sapiens.GRCh37.75.chromosome.21.gtf --stringtie /opt/stringtie/stringtie --sample A

执行测试脚本

./test_run.sh

执行完毕后再最后一行会出现“All Done!”的回显信息,

鲲鹏

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:华为云SQLServer软硬件升级,推动性能全面提升
下一篇:要想数据库性能好,软硬升级少不了
相关文章