Llama 3.1 405B

Llama 3.1 405B

Por @SoyFYDev el 24/07/2024

Enlace
Llama 3.1 405B
Categorías
chatbot
Licencias
libre

El modelo libre al nivel de GPT-4o

Llama 3.1 405B es el modelo de lenguaje más grande y avanzado desarrollado por Meta hasta la fecha. Aquí hay un resumen de sus características principales:

  • Es un modelo de lenguaje de gran escala con 405 mil millones de parámetros, lo que lo convierte en el modelo de código abierto más grande disponible públicamente.
  • Utiliza una arquitectura de transformador optimizada y atención de consulta agrupada (GQA) para mejorar la escalabilidad de inferencia.
  • Tiene una longitud de contexto de 128,000 tokens, lo que le permite procesar y comprender textos muy largos.
  • Es multilingüe, con soporte para 8 idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
  • Demuestra capacidades de vanguardia en una amplia gama de tareas, superando a muchos modelos propietarios en varios benchmarks.
  • Está diseñado para aplicaciones comerciales y de investigación, incluyendo generación de datos sintéticos, traducción multilingüe, asistencia al cliente, y más.
  • Se ofrece bajo una licencia más permisiva que permite a los desarrolladores usar las salidas del modelo para mejorar otros modelos.
  • Está disponible a través de varias plataformas en la nube como Amazon Bedrock, Azure AI y IBM watsonx.ai.
  • Representa un importante avance en los modelos de IA de código abierto, acercándose al rendimiento de modelos propietarios como GPT-4 en muchas tareas.