Una de las primeras herramientas bioinformáticas que aprendemos a usar es BLAST. Es un algoritmo que realiza comparaciones de una secuencia problema con una base de datos y nos devuelve como salida un alineamiento local de aquellas secuencias de la base de datos que presentan mayor similitud con la problema.
Muchos de vosotros habréis ejecutado BLAST desde la página de NCBI, enfrentando vuestra secuencia contra la base de datos de alguno de los organismo modelo más estudiados en genética o, si como yo estudiáis bichos raros, contra alguna genérica. También existen otras vías para ejecutar en remoto estas BLAST contra estas bases de datos fuera del navegador como, por ejemplo, instalando BLAST en local o con BioPython.
Pues bien, podemos ejecutar localmente BLAST de manera simple con una base de datos propia. Para ello, necesitamos instalar BLAST. En mi caso los he instalado desde los repositorios de Bio-Linux:
$ sudo aptitude install bio-linux-blast bio-linux-blast+
Seguidamente, creamos nuestra base de datos a partir de un fichero con secuencias en formato FASTA de la siguiente manera:
$ formatdb -i grasshoppers.fasta -p F -n ghoppers
Y una vez creada la base de datos, ejecutamos BLAST para que nos devuelva la salida en HTML:
$ blastall -p blastn -d ghoppers -i miseq.fasta -T -o output.html
Esta orden nos generará un fichero HTML con las puntuaciones y los alineamientos que podemos abrir con nuestro navegador preferido.
Otra línea más compleja puede ser:
$ blastall -p blastn -d ghoppers -i miseq.fasta -v 10000 -e 0.0001 -m 7 -o output.xml
Que resulta un fichero XML con hasta 10000 hits con e-valor de hasta 0.0001.
Y esto es todo, espero que haya sido de vuestro interés.
Más información | Bio-Linux
Me gusta:
Me gusta Cargando...
Últimos comentarios