Llevaba tiempo buscando alguna manera de introducir secuencias en formato abi en Biopython. Este formato contiene las lecturas del secuenciador así que no solo tenemos la información de la secuencia sino de la calidad o el nivel de confianza de dada una de las bases secuenciadas.
El módulo de Biopython se llama Abifpy y está disponible para descargar libremente desde el Github del autor. Una manera de instalarlo es introducir la ruta del módulo en el fichero ~/.bashrc:
# Add custom Python modules to the Python path.
PYTHONPATH=$PYTHONPATH:~/abifpy
PYTHONPATH=$PYTHONPATH:~/usr/lib/python2.6/site-packages
export PYTHONPATH
Ahora al iniciar Python deberíamos tener el módulo operativo. La forma de uso es muy sencilla:
$ python
>>> import abifpy
>>> secuencia = abifpy.Trace(«file.ab11») # abrir fichero
>>> secuencia = abifpy.Trace(«file.ab1», trimming=True) # abrir fichero y quitar los extremos de la secuencia, de menor calidad
>>> secuencia.seq # ver secuencia
>>> secuencia.qualVal # ver valores de calidad de cada secuencia
>>> secuencia.name # nombre de la secuencia
Fácil, ¿verdad? Pues tan más útil resulta.