Large Language Models
Hace un año me topé por primera vez con ChatGPT y quedé maravillado. De inmediato intuí que los modelos de lenguaje a gran escala (LLMs) tendrían un impacto enorme, no solo en la industria tecnológica, sino también en nuestra vida cotidiana.
La IA generativa y los LLMs son dos conceptos fundamentales que todo el mundo debería conocer. Recomiendo esta conferencia de Matt Welsh, donde describe la situación actual de los LLMs y hace predicciones sobre hacia dónde se dirige el sector.
Explica cómo los LLMs seguirán evolucionando y cambiando la forma en que diseñamos arquitecturas para nuestras aplicaciones, lo que impactará a múltiples industrias. Aún estamos en una fase temprana, pero confío en que ese será el rumbo de muchos sectores.
Ollama: LLMs en tu máquina
Hace unas semanas descargué Ollama, una app de código abierto que simplifica la exploración, descarga y ejecución de LLMs de forma local.
Permite interactuar con el modelo mediante un endpoint HTTP, así que puedes usarlo desde cualquier dispositivo. Hay muchos modelos para probar —Gemma, Llama 2, Mistral, entre otros—. Probé el nuevo modelo ligero Gemma de Google y me impresionó lo rápido que es en comparación con Mistral.
Hace un año solo podíamos interactuar con LLMs a través de aplicaciones web; ahora podemos hacerlo directamente en nuestras computadoras, lo que abre la puerta a que los desarrolladores creen todo tipo de herramientas.
Por ahora he experimentado con Ollama porque facilita trabajar con modelos alojados de forma privada. Sin embargo, dos proyectos open source captaron mi atención y creo que ilustran muy bien cómo será la productividad en un futuro cercano.
Enchanted
Descubrí Enchanted navegando por X. Es una app para trabajar con modelos autoalojados (en mi caso, corriendo en Ollama). El objetivo principal es ofrecer una interfaz de chat y atajos configurables.
Configuré un atajo para resolver problemas de matemáticas.
Luego seleccioné los ejercicios y presioné ⌘ + ⌃ + M.
Creo que esta es una versión temprana de cómo se verán nuestros sistemas operativos: no solo resolverán problemas de matemáticas, sino todo tipo de tareas. Las posibilidades son infinitas.
Descarga Enchanted: https://github.com/AugustDev/enchanted
Continue
Según su web, Continue es un “autopiloto open source en tu IDE”. He usado GitHub Copilot en VSCode y es bastante bueno, pero es cuestión de tiempo para que quede obsoleto frente a modelos abiertos entrenados para programar.
Es una extensión de IDE que puede usarse junto con Ollama (eliges el modelo que prefieras) para generar código, encontrar bugs e interactuar en lenguaje natural.
La configuración del modelo se hace mediante un archivo JSON. He estado probando DeepSeek Coder 6.7 B y, hasta ahora, va muy bien.
Descarga Continue: https://continue.dev/
Reflexión final
Los LLMs están aquí para simplificar nuestra interacción con las máquinas y permitir que cualquiera aproveche la tecnología como nunca antes. Al fin y al cabo, la tecnología existe para ayudarnos a hacer más y hacer mejor. Estos modelos no son perfectos, por lo que es esencial seguir investigando y entender todo lo que pueden ofrecer. Estoy seguro de que estas herramientas continuarán avanzando a gran velocidad.
Publicado originalmente: 12 de marzo de 2024 en https://sebasnotes.substack.com/