第一步:进入NCBI选择“Download”, 进入后选择“Download Tools”工具下载


第二步:选择“SRA Toolkit”的“Download”按钮,进入版本选择

此处我选择的是“CentOS Linux 64 bit architecture”,若想在linux系统中下载,可选择右键“复制链接地址”,然后到 Linux 系统中用 wget 命令获取。


下载 sratoolkit 文件,当前版本为3.0:

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.0/sratoolkit.3.0.0-centos_linux64.tar.gz

第三步:安装与使用

此安装包解压即可使用,但需先配置存储位置。

tar zxvf sratoolkit.3.0.0-centos_linux64.tar.gz
cd sratoolkit.3.0.0-centos_linux64/bin
vdb-config -i # 配置存储位置

使用方法:

prefetch SRR1036346  # SRR1036346为你想要获取的 sra 数据编号
# fastq_dump 可将 sra 数据转化为 fastq 格式数据
fastq-dump --split-3 --gzip SRR1036346.sra
# fasterq_dump 支持多线程,更快速
fasterq-dump --split-3 ./SRR1036346.sra -e 16 -o ./SRR1036346
# 若为双端数据,则会产生两个数据,分别为SRR1036346_1.fastq 和 SRR1036346_2.fastq;若为单端数据,则只有一个数据,为SRR1036346.fastq
# 10X 数据需添加 --include-technical 生成三个文件
fasterq-dump --split-files --include-technical ../SRR7722941.sra
# 并行运算
conda install -c bioconda parallel-fastq-dump
parallel-fastq-dump -t 16  -O ./ --split-files --gzip -s SRR7722941.sra
Avatar photo

作者 xian

发表回复