Este trabajo computacional representa un avance sorprendente en el problema del plegamiento de proteínas, un gran desafío de 50 años en biología.
DeepMind, la inteligencia artificial de Alphabet y Google, parece haber resuelto un problema científico que parecía “imposible”.
Este lunes, DeepMind hizo el anuncio que sus científicos lograron el desarrollo del algoritmo AlphaFold 2 con el que descifran el problema del plegamiento de proteínas, identificándolas basándose solo con su composición.
La producción de proteínas a partir de genes sustenta cada proceso celular, cada diferencia en la apariencia de una persona, cada movimiento que realiza. La producción de estas proteínas se basa en un complejo sistema de plegamiento de aminoácidos (los bloques de construcción producidos por nuestro código genético) una y otra vez para crear estructuras intrincadas que determinan cómo actuará la proteína y sobre qué actuará.
A pesar de los grandes avances y avances tecnológicos en el estudio de las proteínas, la comprensión de cómo se pliegan las proteínas y qué forma producirá un código de aminoácidos simple ha eludido a los científicos. Esto se llama el "problema del plegamiento de proteínas" y era uno de los mayores desafíos de la biología.
Sin embargo, ahora AlphaFold 2 pudo predecir la estructura con una puntuación media de 92,4 sobre 100 puntos, según la investigación previa a la impresión del equipo. Eso está lejos de ser perfecto, pero supera con creces el enfoque de adivinar y verificar que dominó el campo durante décadas.
“Hemos estado estancados en este problema, cómo se pliegan las proteínas, durante casi 50 años. Ver a DeepMind producir una solución para esto, después de haber trabajado personalmente en este problema durante tanto tiempo y después de tantas paradas y arranques, preguntándonos si alguna vez llegaríamos allí, es un momento muy especial”, dijo John Moult, cofundador y presidente de CASP, en el blog de la organización.
"Entrenamos este sistema con datos disponibles públicamente que constan de aproximadamente 170.000 estructuras de proteínas del banco de datos de proteínas junto con grandes bases de datos que contienen secuencias de proteínas de estructura desconocida", afirman los desarrolladores de AlphaFold. "Utiliza aproximadamente 128 núcleos TPUv3 (aproximadamente equivalentes a ~ 100-200 unidades de procesamiento gráfico) que se ejecutan durante unas pocas semanas, lo cual es una cantidad relativamente modesta de procesamiento en el contexto de la mayoría de los grandes modelos de vanguardia utilizados en máquinas aprendiendo hoy".
Sin embargo, por el momento aún no se publican los datos oficiales del estudio, algo que mantiene en vela a la comunidad. Sin embargo, de ser correcto, estaríamos ante uno de los mayores saltos de la inteligencia profunda.
Te recomendamos METADATA, el podcast de tecnología de RPP. Noticias, análisis, reseñas, recomendaciones y todo lo que debes saber sobre el mundo tecnológico.
Comparte esta noticia