Cognition Labs, un emprendimiento de Sillicon Valley, presentó un modelo de Inteligencia Artificial (IA) bautizado como Devin, un sistema capaz de resolver problemas y realizar tareas de ingeniería complejas de manera totalmente autónoma.

El equipo de desarrolladores de Cognition detalló que Devin puede ejecutar tareas que requieren miles de decisiones, recordando el contexto de cada paso y aprendiendo a corregir los problemas que se presenten. Además, la herramienta puede integrarse a equipos de trabajo con otros programadores.

Aunque hay otras herramientas de IA –como Copilot X o ChatGPT– que son capaces de generar sugerencias de código, Devin se diferencia por el hecho de que sirve para desarrollar un proyecto por completo gracias a que sus creadores lo equiparon con herramientas típicas para un trabajo de desarrollo, como un editor de código, shell y un navegador dentro de un entorno aislado.

La firma tecnológica publicó una serie de videos en los que se puede ver cómo funciona Devin. En líneas generales, la IA funciona de la misma manera que otras aplicaciones ya conocidas, dado que el usuario simplemente tiene que darle una indicación en texto simple (los llamados prompts) para que el modelo comience a trabajar. Las tareas que se pueden automatizar van desde el desarrollo de un juego, una aplicación o incluso pedirle que aprenda a utilizar una tecnología desconocida.

Las capacidades de esta herramienta son tales que incluso puede entrenar y perfeccionar a otros modelos de IA. En uno de los ejemplos, se le pide a Devin que configure una serie de ajustes para el modelo Llama 7B a partir de un repositorio de GitHub y una serie de instrucciones en texto. De esta manera, es capaz de detectar errores, solucionarlos y mejorar así el modelo en cuestión.

¿Puede la IA reemplazar a programadores?

Los avances logrados en materia de IA durante los últimos años han generado temor y dudas entre profesionales de distintos campos por la posibilidad de que sean reemplazados en sus respectivos trabajos, y los programadores no han sido la excepción. Sin embargo, Devin se presenta más como una herramienta de acompañamiento y asistencia para tareas relativamente sencillas que como una solución de programación completa.

El propio equipo de Cognition evaluó su inteligencia artificial a través de SWE-bench, un benchmark que mide el rendimiento para resolver problemas reales que se encuentran en repositorios de GitHub. Según los primeros datos, Devin solo resolvió correctamente de principio a fin el 13,86% de los problemas.

Y aunque en este aspecto supera a modelos de lenguaje como Claude 2, GPT-4, SWE-Llama 13 GB y 7B y ChatGPT 3.5, sigue siendo un porcentaje bajo.

Devin se ubicó por delante de otros modelos en cuanto a capacidades de resolución de problemas de ingeniería.

De momento Devin se encuentra en desarrollo, por lo que no está disponible abiertamente para todos los usuarios. Mientras tanto, Cognition está aceptando solicitudes para probarlo en entornos reales.

De acuerdo con Bloomberg, Cognition está conformado por ingenieros que ganaron medallas de oro en concursos de programación, y su trabajo con Devin les ha garantizado una inversión de 21 millones de dólares y el soporte de algunos líderes del sector.