Aplicación de algoritmos evolutivos a la búsqueda

  • Carlos I. Jordán Escuela Superior Politécnica del Litoral
  • Carlos J. Jordán Escuela Superior Politécnica del Litoral

Resumen

El control en la producción de proteínas en las células es un problema importante de la biología molecular,  del  cual  dependen  un  sinnúmero  de  aplicaciones  en  los  campos  de  la  medicina, la agricultura y ganadería.  Esta  producción  está  regulada  al  interior de  la  célula   por  un interruptor  biológico basado en  la  fijación de una  proteína (el  factor de transcripción)  sobre  sitios determinados al interior de los genes portadores de la información genética. Este sitio de fijación se conoce como el motivo de una proteína. Existen métodos en  la biología para identificar estos sitios  de  fijación, pero son procedimientos  muy costosos  y toman mucho tiempo. Los métodos basados   en la computación evolutiva han demostrado ser  algoritmos más eficientes y eficaces a la hora de identificar las  posiciones del motivo que todo otro método desarrollado hasta la fecha. En este trabajo se implementaron dos métodos propios de búsqueda de motivos, uno basado en los algoritmos genéticos (MBMAG) y otro en la  estimación de distribuciones (MBMEDA), los cuales evalúan  el contenido de información de los individuos de la población para discriminar las mejores soluciones en cada generación. Los resultados obtenidos sobre bases de ADN fueron  evaluados  utilizando  métricas  estándar  para medir  el  desempeño  de    métodos  computacionales  de  búsquedas.  Estos  resultados muestran  que  los  métodos  evolutivos  son  superiores respecto  a  otros  métodos  conocidos,  en  cuanto  a  encontrar  un  mayor  número  de secuencias correctas que constituyen el motivo.

Citas

CHAN, TALK MING, KWONG SAK LEUNG, AND KIN HONG LEE. (2008). "TFBS Identification Basen on
Genetic Algorithm with Combined Representations and Adaptive Post­ processing'. Bioinformatics 24.3 (2008): 341-49.

DAS MK, DAI HK. (2007). "A survey of DNA motif finding algorithms". BMC Bioinformatics. Nov 1;8 Suppl. 7:S21.

EIBEN, AGOSTON E., AND J. E. SMim. (2003). "¿What is an Evolutionary Algorithm? " Introduction to Evolutionary Computing. New York: Springer, 2003. 15- 35

EIBEN, AGOSTON E., AND J. E. SMim. (2003). "Genetic Algorithms ". Introduction to Evolutionary Computing. New York: Springer, 2003. 37-69

GALAS, DAVID J., AND ALBERT SCHMITZ. (1978). "DNAase Footprinting a Simple Method for the Detection of Protein­ DNA Binding Specificity'. Nucleic Acids Research 5.9 (1978): 3157-170.

GARNER, MARK M., AND ARNOLD REVZIN. ( 1 9 8 1 ) . "A Gel Electrophoresis Method for QuantifYing the Binding of Proteins to Specific DNA Regions: Application to Components of the Escherichia Coli Lactose Operon Regulatory System" Nucleic Acids Research 9.13: 3047-060.

JONES, NEIL C., AND PAVEL PEVZNER. (2004). "Molecular Biology Primer" An Introduction to Bioinformatics Algorithms. Cambridge, MA: MIT, 2004. 57- 68.

LARRAÑAGA, PEDRO, AND JOSÉ A. LOZANO. (2002). "Estimation of Distribution Algorithms: a New Too! for Evolutionary Computation". Boston: Kluwer Academic.

LI, GANG, TAK MING CHAN, KWONG SAK LEUNG, AND KIN HONG. (2008). "An Estimation of Distribution Algorithm for Motif Discover]l'.Evolutionary Computation (2008): 2411-418.

LUKE, SEAN. ( 2 O O 9 ) . " Essencials of Metaheuristics".lst ed. Washington: Lulu.

MANNING, CHRISTOPHER D., PRABHAKAR RAGHAVAN, AND HINRICH SCHUTZE. (2008). "lntroduction to lnformation RetrievaI". New York: Cambridge UP. 151-158.

SCHNEIDER, T., G. STORMO, L. GOLD, AND A. EHRENFEUCHT. "lnformation Content of Binding Sites on Nucleotide Sequences" Journal of Molecular Biology 188.3 (1986): 415-31.

SCHNEIDER, IBOMAS D., AND R.MICHAEL STEPHENS. (1990). "Sequence Logos: a New Way to Display Consensus Sequences". Nucleic Acids Research 18.20: 6097-100.

USSERY, DAVID W., TRUDY M. WASSENAAR, AND STEFANO BORINI. (2009). "Sequences as Biological
Information: Cells Obey the Laws of Chemistry and Physics" Computing for Comparative Microbial Genomics Bioinformatics for Microbiologists. London: Springer. 3-17.

WEI, Z. ( 2 O O 6 ) . "GAME: Detecting Cis-regulatory Elements Using a Genetic Algorithm".Bioinformatics 22.13: 1577-584.

ESKIN, ELEAZAR, AND PAVEL A. PEVZNER. (2002). "Finding Composite Regulatory Patterns in DNA Sequences". Bioinformatics 18 (2002): 354-63.

BAILEY, TIMOIBY L., AND CHARLES ELKAN. (1993). "Unsupervised Learning of Multiple Motifs in Biopolymers Using Expectation Maximization". La Jolla, CA: Dept. of Computer Science and Engineering, University of California, San Diego.

LAWRENCE, C., S. ALTSCHUL, M. BOGUSKI, J. (1993). "Detecting Subtle Sequence Signals: a Gibbs Sampling Strategy for Mu/tiple Alignment ". Science262.513l: 208-213

MANNING, CllRISTOPHER D., PRABHAKAR RAGHAVAN, AND HINRICH SCHUTZE. (2000). "Introduction to Information RetrievaI" New York: Cambridge UP.
Publicado
2012-10-01
Sección
Articulos