Llama 3.1 405B
Por @SoyFYDev el 24/07/2024
- Enlace
- Llama 3.1 405B
- Categorías
- chatbot
- Licencias
- libre
El modelo libre al nivel de GPT-4o
Llama 3.1 405B es el modelo de lenguaje más grande y avanzado desarrollado por Meta hasta la fecha. Aquí hay un resumen de sus características principales:
- Es un modelo de lenguaje de gran escala con 405 mil millones de parámetros, lo que lo convierte en el modelo de código abierto más grande disponible públicamente.
- Utiliza una arquitectura de transformador optimizada y atención de consulta agrupada (GQA) para mejorar la escalabilidad de inferencia.
- Tiene una longitud de contexto de 128,000 tokens, lo que le permite procesar y comprender textos muy largos.
- Es multilingüe, con soporte para 8 idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
- Demuestra capacidades de vanguardia en una amplia gama de tareas, superando a muchos modelos propietarios en varios benchmarks.
- Está diseñado para aplicaciones comerciales y de investigación, incluyendo generación de datos sintéticos, traducción multilingüe, asistencia al cliente, y más.
- Se ofrece bajo una licencia más permisiva que permite a los desarrolladores usar las salidas del modelo para mejorar otros modelos.
- Está disponible a través de varias plataformas en la nube como Amazon Bedrock, Azure AI y IBM watsonx.ai.
- Representa un importante avance en los modelos de IA de código abierto, acercándose al rendimiento de modelos propietarios como GPT-4 en muchas tareas.