BLAST+與BLAST相比,有很多改進和提高,NCBI強烈推薦放棄BLAST,使用BLAST+, 這里說的BLAST和BLAST+,都是本地的。BLAST下載地址:NCBI BLAST+ (ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/) 。
BLAST+的一般用法如下:
格式化數(shù)據(jù)庫
makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname
參數(shù)說明:
-in:待格式化的序列文件
-dbtype:數(shù)據(jù)庫類型,prot或nucl
-out:數(shù)據(jù)庫名
蛋白序列比對蛋白數(shù)據(jù)庫(blastp)
blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
參數(shù)說明:
-query: 輸入文件路徑及文件名
-out:輸出文件路徑及文件名
-db:格式化了的數(shù)據(jù)庫路徑及數(shù)據(jù)庫名
-outfmt:輸出文件格式,總共有12種格式,6是tabular格式對應BLAST的m8格式
-evalue:設置輸出結(jié)果的e-value值
-num_descriptions:tabular格式輸出結(jié)果的條數(shù)
-num_threads:線程數(shù)
核酸序列比對核酸數(shù)據(jù)庫(blastn)以及核酸序列比對蛋白數(shù)據(jù)庫(blastx)
與上面的blastp用法類似:
blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8
以上的參數(shù)說明只是一些常用的參數(shù),完整的參數(shù)說明可以用-help查詢。
轉(zhuǎn)載自:有個博客 [ http://www.yelinsky.com/blog/ ]