¿Está GitHub Copilot mejorando realmente la productividad de los desarrolladores? Esa es la pregunta que ha intentado responder la compañía propiedad de Microsoft a través de un estudio reciente. Los resultados parecen indicar que sí, aunque, evidentemente, depende del uso que los usuarios le quieran dar. El asistente de código todavía no es la panacea, pero ayuda a crear una base sobre la que trabajar.
“Los comentarios que hemos escuchado y seguimos escuchando [sobre Copilot] confirman nuestra tesis central: la IA puede ayudar a que los desarrolladores sean más productivos y felices mientras programan. Aun así, queríamos probar nuestra teoría y ver si GitHub Copilot en sí genera tasas de productividad más altas entre los desarrolladores,” comenta Albert Ziegler, ingeniero de aprendizaje automático de GitHub.
Un lanzamiento no exento de polémicas
Hace un año, la plataforma anunció que se había asociado con OpenAI para desarrollar una herramienta capaz de convertir el lenguaje natural en código para ofrecer sugerencias a los programadores y, por ende, ahorrarles un tiempo significativo en su trabajo, especialmente en las tareas más repetitivas y tediosas.
Por lo general, la noticia fue bien recibida, ya que suponía un salto tecnológico sin precedentes, sin embargo, algunos desarrolladores de código abierto no se mostraron tan entusiasmados, dado que Copilot se nutrió de millones de líneas de código para desarrollar sus habilidades sin su consentimiento.
Ya hace casi un mes desde que el asistente de programación se encuentra disponible públicamente. En ese momento, descubrimos que Copilot solo sería gratuito para unos pocos afortunados, mientras que la mayoría tendría que pagar 10 dólares mensuales o 100 anuales para poder utilizarla.
Esto no hizo más que aumentar la indignación de gran parte de la comunidad, ya que consideran un ultraje que la compañía quiera lucrarse con un producto que bebe de líneas de código por las que ellos no han obtenido ningún beneficio. El caso más sonado fue el de la SFC (Software Freedom Conservancy), que, en su misión por defender a los contribuidores de código abierto, les recomendó abandonar la plataforma y alojar sus proyectos en otras plataformas.
Copilot no es la panacea, sino un compañero de trabajo
Dejando la polémica a un lado, GitHub ha querido demostrar que su herramienta mejora la productividad de los desarrolladores que la utilizan. Para ello, han realizado una encuesta, en la que han tenido en cuenta las respuestas de más de 2.000 desarrolladores de Estados Unidos. Y los resultados han sido bastante prometedores.
Para empezar, los investigadores han querido reforzar la idea de que programar en pareja es siempre mejor que hacerlo en solitario, ya que permite “alcanzar los objetivos de codificación más rápido, producir mejores productos finales y aprender algo nuevo mientras lo hacemos”. Básicamente, este es el objetivo que tenían en mente a la hora de crear Copilot. No querían desarrollar una herramienta capaz de crear todo el software por sí misma, sino ofrecer a los programadores una suerte de compañero de trabajo.
A modo de ejemplo, GitHub alude al uso que le damos a las calculadoras. En este sentido, todos queremos que los resultados que nos ofrezca sean precisos. Sin embargo, “pocas personas recurren a una calculadora en busca de inspiración”, algo que sí puede suceder con Copilot, que no siempre proporciona los resultados exactos que estamos buscando, pero aporta un punto de partida muy útil para no tener que buscar por Internet cómo resolver un determinado problema. Sin duda, esto se traduce en un mayor ahorro de tiempo y, por lo tanto, en una mayor productividad.
El punto fuerte de Copilot es el de brindar varias sugerencias de líneas de código, pero, en última instancia, es el desarrollador el que tiene que elegir la opción más adecuada para su proyecto. Por otro lado, el asistente también puede ser muy eficaz para subsanar algunos errores que los humanos solemos cometer con frecuencia, como no cerrar bien los corchetes o los paréntesis de nuestro código, evitando así más de un quebradero de cabeza.
Tres preguntas para medir la productividad
¿Podemos decir entonces que Copilot aumenta la productividad de los desarrolladores? GitHub opina que sí, pero con matices. Todo depende de cuál sea la intención del usuario al utilizarlo:
“La palabra “productividad” en el desarrollo contiene una amplia gama de posibles significados prácticos. ¿Lo ideal es que los desarrolladores guarden las pulsaciones de teclado o eviten las búsquedas en Google y StackOverflow? ¿Debería GitHub Copilot ayudarlos a mantenerse en el flujo brindándoles soluciones altamente precisas en tareas mecánicas, similares a las de una calculadora? ¿O debería inspirarlos con fragmentos especulativos que podrían ayudarlos a desbloquearlos cuando están atascados?,” se preguntan.
Con el fin de resolver estas cuestiones, la compañía decidió realizar este estudio. Como comentamos, los investigadores encuestaron a más de 2.000 desarrolladores, pero también compararon sus declaraciones con los datos de otros usuarios anónimos en el mismo periodo. El informe se basa en las respuestas a estas tres preguntas:
- ¿Siente la gente que GitHub Copilot los hace más productivos?
- ¿Se refleja ese sentimiento en alguna medida objetiva de uso?
- ¿Qué medidas de uso reflejan mejor esa sensación?
Aquellos que reportan una mayor productividad son los que suelen aceptar sus sugerencias con más frecuencia
Tras analizar las opiniones de estos usuarios, llegaron a una conclusión clara: “el uso de GitHub Copilot se correlaciona con una mejor productividad del desarrollador”. Para ello, tuvieron en cuenta algunos factores como la cantidad de caracteres ofrecidos por Copilot, la frecuencia con la que la herramienta hizo sugerencias o la cantidad de estas que fueron aceptadas.
De hecho, es en este último punto donde la relación entre Copilot y la mejora de la productividad es más clara. El equipo de la plataforma dividió el número de sugerencias aceptadas entre el número de sugerencias proporcionadas por la herramienta.
Y el resultado fue bastante favorable. Descubrieron que los desarrolladores que reportaron un mayor aumento en su productividad fueron los que dieron por buenas con mayor frecuencia las sugerencias mostradas por el asistente (29,73%); mientras que, por el contrario, aquellos para los que Copilot no supuso un gran cambio fueron los que menos sugerencias consideraron aceptables (23,16%).
Como sabemos, Copilot ha sido entrenado en varios lenguajes de programación, pero, obviamente, no es igual de hábil con todos. Así que esta mejora en la productividad también depende del idioma con el que se trabaje. Aparentemente, la mayor parte de los usuarios (24,7% de anónimos y 21,9% de encuestados) utilizan TypeScript, seguido de JavaScript (21,3% y 24,2%) y Python (14,1% y 14,5%). Sin embargo, son estos dos últimos los que muestran una mayor tasa de aceptación con respecto a las sugerencias. Según los investigadores, esto refleja que Copilot es mucho más útil cuando se trata “de herramientas neuronales que frente a herramientas deductivas para idiomas no tipificados”.
Imagen de Christina Morillo en Pexels