Etiqueta agregada: ‘Bioinformática

16
Jul
09

EMBOSS 6.1.0 liberada

Como viene siendo costumbre, todos los 15 de Julio aparece una nueva versión de la suite bioinformática libre por excelencia: EMBOSS.

El código fuente está disponible desde esta dirección: ftp://emboss.open-bio.org/pub/EMBOSS/

Los cambios realizados este años los encontráis aquí: ChangeLog file.

Otro día enseñaré cómo actualizar a la nueva versión.

12
Jul
08

Instalar Biopython: Python para bioinformatiquillos


Biopython es un proyecto que provee de módulos y funciones útiles para los programadores de Python que trabajan con bioinformática.

Está disponible en los repositorios de Ubuntu, aunque a mí personalmente no se sirvió con un simple apt-get, por lo que decidí intentar compilar para no complicarme y tener la última versión. Además en la web de Biopython existe un manual de instalación bastante sencillo, que voy a resumir.

Primeramente, instalamos Python (si no lo tenemos instalado) con apt-get. Seguidamente, descargamos el código fuente de la dependencia mxTextTools. Descomprimimos, abrimos un terminal en la carpeta obtenida y tecleamos:

python setup.py build

y después:
sudo python setup.py install

La otra dependencia que debemos instalar es Numerical Python de la misma manera que la anterior.
Podemos instalar otras dependencias que no son prescindibles como ReportLab.

Después descargamos el código fuente, ahora sí, de Biopython y realizamos el mismo proceso.

Para comprobar que la instalación ha sido un éxito, en un terminal tecleamos ‘python’ y una vez cargado escribimos lo que está delante de >>>:

$ python
Python 2.4 (#1, Dec 5 2004, 20:47:03)
[GCC 3.3.3] on cygwin
Type "help", "copyright", "credits" or "license" for more information.
>>> from Bio.Seq import Seq
>>> from Bio.Alphabet.IUPAC import unambiguous_dna
>>> new_seq = Seq(’GATCAGAAG’, unambiguous_dna)
>>> new_seq[0:2]
Seq(’GA’, IUPACUnambiguousDNA())
>>> from Bio import Translate
>>> translator = Translate.unambiguous_dna_by_name["Standard"]
>>> translator.translate(new_seq)
Seq(’DQK’, HasStopCodon(IUPACProtein(), ’*’))
>>>

Si no aparece ningún mesage de error, lo hemos hecho bien y podemos disfrutar de Biopython.

Web del proyecto Biopython
Manuales: Documentación

10
Jul
08

Bioinformática

Hace mucho tiempo, cuando el blog estaba en Blogger, hice una encuesta para hacer mejoras en el blog. Hubo cosas que hice y otras que no. Bueno, pues hoy vamos a dar una pincelada al concepto que le da nombre a este sitio (después de casi un año, ya me valía).

La Bioinformática es una rama de la Computación cuyo objetivo es tratar la ingente cantidad de datos que genera el estudio de las entidades biológicas, en especial a nivel molecular, para mejorar la comprensión de su funcionamiento. Existen cuatro campos de estudio distintos:

  • Genómica Computacional (Computational Genomics): trata la información que se origina al secuenciar genomas –en mente de todos está el Proyecto Genoma Humano–. Buscan determinadas secuencias que podrían contener genes (ORF), comparan genomas de distintas especias para encontrar similitudes y diferencias, analizan dónde están los genes que nos producen determinadas enfermedades, estudian mecanismos de regulación de la expresión génica, etc…
  • Bioinformática Estructural (Structural Bioinformatics): principalmente, predice la estructura de una proteína a partir de la secuencia de aminoácidos. Simulan las posibles interacciones en la cadena aminoacidica, pudiendo contribuir al descubrimiento de algún fármaco o mejorando el entendimiento de la función de las proteínas.
  • Biología de Sistemas (Systems Biology): consiste en la simulación del compendio de interacciones que ocurren en la célula para comprender su funcionamiento.
  • Algoritmos y Bases de Datos (Algorithms anda Databases): construyen herramientas informáticas para tratar la información generada.

Básicamente es esto, para más información, si te gusta el tema, la Wikipedia puede ser un buen comienzo:

Bioinformática en Wikipedia

Si ya partes con algo más de conocimiento, estos enlaces te pueden ayudar:

MANUALES:

Introducción:

Genomics and its impact on Medicine and Society. A 2001 primer
Dictionary of Genetic Terms

Bioinformatics Educational ResourceTutorial de PerlPrimer on Molecular Genetics

CURSOS:
11
Jun
08

Manueles sobre conceptos y programas bioinformáticos, con licencia CC

Me lo apunto para leerlo cuando acaben los exámenes…

Fuente: Bioinformática

¿Cuántas veces os habeis encontrado con que quereis aprender sobre alguna nueva herramienta que todo el mundo usa, pero que no dominais en absoluto? ¿O tal vez se os resbala un poco una técnica o concepto? Gracias a David G. Pisano (que lo ha encontrado), aquí teneis el enlace al sitio de CLC bio dedicado a Bioinformática. En este sitio podeis encontrar bastantes documentos en PDF escritos en inglés sobre temas como las bases de datos biológicas, comparativas de Blast contra Smith & Waterman, predicción de la estructura de RNA, detección de sitios de restricción, etc… Toda esta documentación está licenciada bajo Creative Commons – NonCommercial – NonDerivs 2.5, de forma que todo el contenido lo podeis copiar, distribuir y usar de forma libre siempre que sea para uso educativo, y se mencione al propietario (en este caso, CLC Bio).

La lástima es que esta licencia no permita traducir los contenidos a otros idiomas, porque sería un material muy útil para la comunidad hispanoparlante que no domina el inglés.

24
Ene
08

Fold Space Navigator: plegamientos de proteínas para bioinformáticos

Fuente: Bioinformática

Acaba de llegarme información por el lado de Ana Rojas sobre un sitio web relacionado con la bioinformática estructural. Se trata del C.A.M.E. (Center of Applied Molecular Engineering), donde hay disponible un catálogo interesante de servicios bioinformáticos. Entre ellos, el que más le llamó la atención a Ana fue el Fold Space navigator, que es una aplicación basada en Flash que te permite estudiar el espacio conocido de plegamientos de proteínas, y las interrelaciones existentes estos plegamientos por sus coocurrencias en estructuras. La aplicación usa la información proveniente de las bases de datos estructurales COPS, SCOP y CATH. La aplicación permite ver, mediante un identificador de PDB, toda la información que posee relacionada con esa entrada mediante el visor integrado en forma de árbol. Además, permite lanzar el servicio TopMatch de superposición de estructuras, para comparar las diferencias entre las estructuras mediante Jmol, y que proporciona información detallada a varios niveles.

Enlaces:
Servicios del C.A.M.E.

05
Oct
07

Distribuciones para bioinformática

He recopilado una serie de distros muy útiles para la bioinformática, yo aún no sé utilizarlas, pero todo se andará.

Fuente: Bioinformática

Hace tiempo que llevo dándole vueltas a la cabeza acerca de cuál es el mejor sistema operativo para hacer bioinformática (aquí se me nota que estudié Ingeniería Informática). Y si os soy sincero, lo único que he sacado en claro es que no es Windows :-) Éste es el primero de una serie de artículos sobre sistemas operativos y bioinformática, e intentaré mencionar los sistemas más representativos.

Much@s de nosotr@s estamos usando distribuciones Linux (Debian/Ubuntu/etc, RedHat/Fedora, SuSE/OpenSuSE, Madrake/Mandriva, Gentoo, etc…), Unix (FreeBSD, Solaris/OpenSolaris, IRIX, Tru64, HP/UX, AIX, …), Mac OS X, ¡o incluso Windows! Y tod@s nosotr@s, en mayor o menor medida hemos sufrido con los siguientes problemas:

  1. Tras leernos un artículo, hemos querido instalar un programa o librería (por ejemplo, t-coffee o BioPerl), pero como no hay paquetes instalables para nuestro sistema, hemos tenido que compilarlos a mano.
  2. Como estos programas y librerías dependen muchas veces de paquetes que no están en nuestra distribución/sistema operativo, ¡también los hemos tenido que compilar!
  3. Pasa el tiempo, y hemos querido actualizar el sistema operativo, y entonces, ¡se va todo al garete! ¡Vuelta a empezar!

1. Gentoo

Hace un par de años estaba ya totalmente harto de compilar, por todo el tiempo que perdía buscando qué tenía que instalar, probando, etc… Además, también estaba harto de que cada vez que actualizaba el sistema operativo, pudieran surgir problemas entre lo que compilé y lo que se ha actualizado. En ese momento pensé en usar algún sistema operativo con actualizaciones continuas, como alguna variante de Debian Linux, FreeBSD o Gentoo Linux (éstos dos últimos para los radicales entre los radicales). Por curiosidad, me puse a ver qué paquetes había disponibles en Gentoo, y quedé gratamente sorprendido al encontrar muchos relacionados con la bioinformática. Si mirais en:

http://packages.gentoo.org/packages/?category=sci-biology

vereis lo que hay disponible de serie para la biología/bioinformática. Aunque Gentoo Linux es una de las distribuciones más complicadas (todo paquete lo compila el sistema antes de ser instalado), me volví un radical entre los radicales al ver que buena parte del trabajo ya lo tenía hecho, ¡dado que es el sistema y no yo quien tiene que compilar! ¿Alguno de vosotros ha intentado alguna vez instalar molmol? ¡Es una pesadilla hacerlo a mano! ¿Y mantener al día BioPerl o mySQL? Seguro que sí.

Todos los sistemas operativos disponen en mayor o menor medida de un sistema de gestión de paquetes. Casi todos los paquetes disponibles están en formato binario: los programas ya están compilados, y el sistema de paquetes tiene que plantar los ficheros y poco más. Una opción no tan conocida (disponible en casi todas las distribuciones Linux) es la posibilidad de usar paquetes-fuente: sólo contienen las instrucciones de compilación.

Tanto Gentoo Linux como FreeBSD optan por esta alternativa, para preparar los paquetes ‘a medida’ del sistema que tenemos. El gran inconveniente de este método es el tiempo que pierde el sistema compilando los programas y librerías. ¡Imaginaos cuánto tiempo puede llevar instalar un sistema completo, con todas las herramientas, programas y librerías! ¡Alrededor de una semana! Sin embargo, una vez hecho esto os puedo asegurar que R, BioPerl, NCBI Blast, ClustalW, etc… van a funcionar mejor de lo que pensais.

2. EMBnet

Continuando con la serie de artículos sobre la Bioinformática en su vertiente más ‘cacharrera’, me he encontrado con que EMBnet genera periódicamente un DVD con un sistema Linux completo. Dicho DVD contiene el software más usado en bioinformática (en todas sus vertientes), preinstalado en el mismo. Lo mejor de todo es que el DVD es Live, lo que permite que puedas usarlo sin necesidad de instalar nada en tu ordenador. La noticia me llegó a través de un correo del reponsable del nodo EMBnet en España, J.R. Valverde:

Hola a todos,

está disponible una nueva versión del DVD 'en vivo' de EMBnet. Quiendesée una copia puede solicitarla (bajando un DVD virgen) en el servicio deInformática Científica, EMBnet/CNB.

Para usuarios externos, hay una copia disponible en nuestro servidorWWW y FTP:

ftp://ftp.es.embnet.org/pub/EMBnet/LiveDVD/http://www.es.embnet.org/Services/ftp/EMBnet/LiveDVD/

El DVD 'en vivo' de EMBnet está disponible solamente para trabajar conordenadores PC. Contiene un sistema operativo Linux y una multitud de programastanto científicos como de oficina.

Para usarlo basta arrancar el ordenador con el DVD dentro. Al hacerloinicia un sistema Linux (independientemente de lo que contenga nuestro PC),reconoce las particiones de Windows y da acceso a las mismas, y proporcionaacceso a una gran variedad de herramientas configuradas para trabajardirectamente que incluyen

- análisis de secuencias (EMBOSS...)- análisis de estructura molecular (TINKER, Gromacs, SPDBV...)- análisis de imagen y geles (ImageJ, GIM...)- análisis químico (MPQC, PSI3, Ghemical...)- matemáticas (R, MuPAD, SciLab...)- software de ofimática (OpenOffice, Ximian Office...)- servidor Web integrado con portal de trabajo en grupo- software de videoconferencia

y mucho más.

El DVD 'en vivo' de EMBnet será la herramienta base que usaremos en lospróximos cursos de informática científica.

Muchas de estas herramientas están disponibles también para Mac. Sinecesitáis información, consultad con el servicio de Informática CientíficaEMBnet/CNB.

Me lo acabo de descargar para probarlo, y nada más arrancar con él me he encontrado con una agradable sorpresa: ¡está basado en Gentoo! Nada más arrancar, pregunta el kernel que queremos usar. Si teneis problemas con los gráficos al arrancar, os recomiendo que useis ‘gentoo-nofb’, y en caso contrario, ‘gentoo’. En ese momento se inicia el proceso de puesta en marcha del LiveDVD, que consiste en reconocer todos los dispositivos del sistema, autoconfigurar la red y el sonido. A partir de ese instante empieza a arrancar un sistema completo: mysql (bases de da
tos), apache2 (servidor web), cups (servidor de impresión), entorno gráfico, etc…

He de reconocer que para probarlo lo he sometido a condiciones extremas, porque he usado una máquina virtual creada con qemu para evitar quemar el DVD en cuestión. La máquina virtual era equivalente a un Pentium II con 1.2GHz y 128MB de memoria, y aunque el arranque ha sido muy lento (principalmente por las limitaciones que le he impuesto) ¡ha superado la prueba! Obviamente recomiendo usar un ordenador real, y que dicho ordenador tenga como mínimo 256MB o 512MB de memoria. El principal inconveniente de este LiveDVD es que sólo funciona en los PCs (ya sea con procesadores Intel o AMD), con lo que los usuarios actuales de ordenadores Apple (o arquitecturas más exóticas) quedan fuera.

En definitiva, si teneis miedo a que vuestro ordenador deje de funcionar al instalar Linux y sois usuarios esporádicos de programas bioinformáticos, este LiveDVD puede ser la solución para vosotros, al ser una de las soluciones menos invasivas.

Enlaces relacionados:

3. Bio-Linux

Revisando correos y entradas de blog antiguos, me he encontrado con que prometí hablar hace casi dos años de Bio-Linux, y no lo hice (¡mea culpa!). Además es un buen momento, viendo algunos de los comentarios preguntando dónde encontrar software bioinformático.
Bio-Linux, como muchas distribuciones Linux de hoy en día, está disponible tanto en formato Live-DVD como para instalar en cualquier ordenador. Desde la versión 4.0, esta distribución está basada en Debian, añadiendo muchísimo software bioinformático, tal como se puede consultar en la lista online. Buena parte del software en la lista es:

Todavía no he tenido tiempo de descargarme y evaluar el Live-DVD, pero por lo que contó Jan-Jaap (un compañero de trabajo) está muy bien para temas didácticos, al llevar tantas herramientas bioinformáticas en un solo DVD. Se quejó de que era un poco lento el uso del Live-DVD en portátiles, por tener que estar leyendo cada dos por tres. En cualquier caso, el reconocimiento de hardware funciona bastante bien, porque le reconoció el hardware del portátil sin problemas.

Con este DVD teneis la posibilidad de probar muchas herramientas bioinformáticas sin el engorro de tener que instalarlas. ¡Que lo disfruteis!

08
Ago
07

Dos bioextensiones

Biobar: barra para biólogos y bioinformáticos que permite buscar información rápidamente en distintas bases de datos. Instalación

BioFox: barra muy potente para trabajos bioinformáticos. Instalación




Contacto

Cuestiones, sugerencias, criticas,...

Manual LyX: Con “L” de LaTeX

Descarga el manual ya



¡Lanzado! Descarga la versión 0.1

¡Ya van más de 325 descargas!

Ubuntu Karmic Koala

Ciencia Sin Tijeras

No al recorte en I+D

Firefox 3

Firefox 3

Feed RSS

Feed RSS



To translate / Traduire

Frases

Busco frases para realizar una colección sobre Linux, software libre e informática en general

 

Noviembre 2009
L M X J V S D
« Oct    
 1
2345678
9101112131415
16171819202122
23242526272829
30  

Han pasado (+130000)

  • 175,268 bioinformatiquillos

Archivos

USE FIREFOX

No al soporte gratuito a Microsoft

No use Windows, los gatitos se la agradecerán

Creative Commons License

Esta obra está bajo una licencia de Creative Commons.