Aplicación de algoritmos evolutivos a la búsqueda
Resumen
El control en la producción de proteínas en las células es un problema importante de la biología molecular, del cual dependen un sinnúmero de aplicaciones en los campos de la medicina, la agricultura y ganadería. Esta producción está regulada al interior de la célula por un interruptor biológico basado en la fijación de una proteína (el factor de transcripción) sobre sitios determinados al interior de los genes portadores de la información genética. Este sitio de fijación se conoce como el motivo de una proteína. Existen métodos en la biología para identificar estos sitios de fijación, pero son procedimientos muy costosos y toman mucho tiempo. Los métodos basados en la computación evolutiva han demostrado ser algoritmos más eficientes y eficaces a la hora de identificar las posiciones del motivo que todo otro método desarrollado hasta la fecha. En este trabajo se implementaron dos métodos propios de búsqueda de motivos, uno basado en los algoritmos genéticos (MBMAG) y otro en la estimación de distribuciones (MBMEDA), los cuales evalúan el contenido de información de los individuos de la población para discriminar las mejores soluciones en cada generación. Los resultados obtenidos sobre bases de ADN fueron evaluados utilizando métricas estándar para medir el desempeño de métodos computacionales de búsquedas. Estos resultados muestran que los métodos evolutivos son superiores respecto a otros métodos conocidos, en cuanto a encontrar un mayor número de secuencias correctas que constituyen el motivo.
Citas
Genetic Algorithm with Combined Representations and Adaptive Post processing'. Bioinformatics 24.3 (2008): 341-49.
DAS MK, DAI HK. (2007). "A survey of DNA motif finding algorithms". BMC Bioinformatics. Nov 1;8 Suppl. 7:S21.
EIBEN, AGOSTON E., AND J. E. SMim. (2003). "¿What is an Evolutionary Algorithm? " Introduction to Evolutionary Computing. New York: Springer, 2003. 15- 35
EIBEN, AGOSTON E., AND J. E. SMim. (2003). "Genetic Algorithms ". Introduction to Evolutionary Computing. New York: Springer, 2003. 37-69
GALAS, DAVID J., AND ALBERT SCHMITZ. (1978). "DNAase Footprinting a Simple Method for the Detection of Protein DNA Binding Specificity'. Nucleic Acids Research 5.9 (1978): 3157-170.
GARNER, MARK M., AND ARNOLD REVZIN. ( 1 9 8 1 ) . "A Gel Electrophoresis Method for QuantifYing the Binding of Proteins to Specific DNA Regions: Application to Components of the Escherichia Coli Lactose Operon Regulatory System" Nucleic Acids Research 9.13: 3047-060.
JONES, NEIL C., AND PAVEL PEVZNER. (2004). "Molecular Biology Primer" An Introduction to Bioinformatics Algorithms. Cambridge, MA: MIT, 2004. 57- 68.
LARRAÑAGA, PEDRO, AND JOSÉ A. LOZANO. (2002). "Estimation of Distribution Algorithms: a New Too! for Evolutionary Computation". Boston: Kluwer Academic.
LI, GANG, TAK MING CHAN, KWONG SAK LEUNG, AND KIN HONG. (2008). "An Estimation of Distribution Algorithm for Motif Discover]l'.Evolutionary Computation (2008): 2411-418.
LUKE, SEAN. ( 2 O O 9 ) . " Essencials of Metaheuristics".lst ed. Washington: Lulu.
MANNING, CHRISTOPHER D., PRABHAKAR RAGHAVAN, AND HINRICH SCHUTZE. (2008). "lntroduction to lnformation RetrievaI". New York: Cambridge UP. 151-158.
SCHNEIDER, T., G. STORMO, L. GOLD, AND A. EHRENFEUCHT. "lnformation Content of Binding Sites on Nucleotide Sequences" Journal of Molecular Biology 188.3 (1986): 415-31.
SCHNEIDER, IBOMAS D., AND R.MICHAEL STEPHENS. (1990). "Sequence Logos: a New Way to Display Consensus Sequences". Nucleic Acids Research 18.20: 6097-100.
USSERY, DAVID W., TRUDY M. WASSENAAR, AND STEFANO BORINI. (2009). "Sequences as Biological
Information: Cells Obey the Laws of Chemistry and Physics" Computing for Comparative Microbial Genomics Bioinformatics for Microbiologists. London: Springer. 3-17.
WEI, Z. ( 2 O O 6 ) . "GAME: Detecting Cis-regulatory Elements Using a Genetic Algorithm".Bioinformatics 22.13: 1577-584.
ESKIN, ELEAZAR, AND PAVEL A. PEVZNER. (2002). "Finding Composite Regulatory Patterns in DNA Sequences". Bioinformatics 18 (2002): 354-63.
BAILEY, TIMOIBY L., AND CHARLES ELKAN. (1993). "Unsupervised Learning of Multiple Motifs in Biopolymers Using Expectation Maximization". La Jolla, CA: Dept. of Computer Science and Engineering, University of California, San Diego.
LAWRENCE, C., S. ALTSCHUL, M. BOGUSKI, J. (1993). "Detecting Subtle Sequence Signals: a Gibbs Sampling Strategy for Mu/tiple Alignment ". Science262.513l: 208-213
MANNING, CllRISTOPHER D., PRABHAKAR RAGHAVAN, AND HINRICH SCHUTZE. (2000). "Introduction to Information RetrievaI" New York: Cambridge UP.