Ayer Meta lanzó Llama 3. Si estás despistado y no sabes lo que es, es básicamente un modelo LLM como el que usa por debajo ChatGPT o Bing Chat, solo que libre. Cualquiera puede bajarlo, re-entrenarlo y ejecutarlo donde quiera.
Y ahora hablemos del hype 👇
En esa maravillosa comparativa, Meta lo pone por encima de otros modelos LLM como Gemini Pro o Claude 3. Según los benchmarks, Llama 3 es el "number one".
¡Pero! Los benchmarks no representan la vida real. Un ranking que se ajusta a la realidad es este: https://chat.lmsys.org/?leaderboard Ahí los usuarios, a ciegas, prueban modelos LLM y le dan una puntuación. Con miles y miles de puntuaciones, se crea ese ranking de los mejores LLM.
Así que cuando Llama 3 tenga suficientes votos, lo cual pasará a lo largo de los días, sabremos realmente cuál es su lugar en el ranking. A día de hoy, a menos de 24 horas de su lanzamiento, ya está en la séptima posición. Promete.
De todas formas, recuerda: Lo más importante del lanzamiento de Llama 3 no es si será el número uno o no. Es que gracias a él, la brecha de rendimiento entre los modelos privados y los modelos libres se estrecha. Y eso es muy bueno para todos.