Una de las primeras herramientas bioinformáticas que aprendemos a usar es BLAST. Es un algoritmo que realiza comparaciones de una secuencia problema con una base de datos y nos devuelve como salida un alineamiento local de aquellas secuencias de la base de datos que presentan mayor similitud con la problema.
Muchos de vosotros habréis ejecutado BLAST desde la página de NCBI, enfrentando vuestra secuencia contra la base de datos de alguno de los organismo modelo más estudiados en genética o, si como yo estudiáis bichos raros, contra alguna genérica. También existen otras vías para ejecutar en remoto estas BLAST contra estas bases de datos fuera del navegador como, por ejemplo, instalando BLAST en local o con BioPython.
Pues bien, podemos ejecutar localmente BLAST de manera simple con una base de datos propia. Para ello, necesitamos instalar BLAST. En mi caso los he instalado desde los repositorios de Bio-Linux:
$ sudo aptitude install bio-linux-blast bio-linux-blast+
Seguidamente, creamos nuestra base de datos a partir de un fichero con secuencias en formato FASTA de la siguiente manera:
$ formatdb -i grasshoppers.fasta -p F -n ghoppers
Y una vez creada la base de datos, ejecutamos BLAST para que nos devuelva la salida en HTML:
$ blastall -p blastn -d ghoppers -i miseq.fasta -T -o output.html
Esta orden nos generará un fichero HTML con las puntuaciones y los alineamientos que podemos abrir con nuestro navegador preferido.
Otra línea más compleja puede ser:
$ blastall -p blastn -d ghoppers -i miseq.fasta -v 10000 -e 0.0001 -m 7 -o output.xml
Que resulta un fichero XML con hasta 10000 hits con e-valor de hasta 0.0001.
Y esto es todo, espero que haya sido de vuestro interés.
Más información | Bio-Linux
———————————————————————————
ACTUALIZACIÓN 29/01/2014
Comandos para BLAST+
$ makeblastdb -in grasshopper.fasta -dbtype nucl -out ghoppers
$ blastn -num_threads 8 -db ghoppers -query miseq.fasta -html -out output.html
Fuente | Quick Start Guide (pdf)
———————————————————————————
ACTUALIZACIÓN 10/08/2015
blastn: N –> N
blastp: A –> A
blastx: N –> A
tblastn: A –> N
tblastx: N –> N
recomiendo prfectblast, es una interfaz grafica que trabaja con toda la suite de aplicaciones de blast, genera bases de datos tipo blast, busquedas con fastacmd, y blastn, blastp, blastx, tblastx, tblastn
http://www.cicy.mx/sitios/jramirez/index.php/english/downloads
Gracias por la recomendación, parece muy interesante.
Muy buen tema, yo lo necesite para mi curso de bioinformatica 2 donde tenemos que ejecutar blast de manera local (anotaciomatica de genes) con la base de datos nr del ncbi
Pingback: BLAST sin conexión a Internet | Bioinformática: Una breve introducción