Sin categoría

Meta se une a AI Race lanza nuevo modelo de lenguaje LLaMA

Meta IA Llama|  Meta se une a AI Race lanza nuevo modelo de lenguaje LLaMA

El año 2023 ha sido un año de desarrollo sin precedentes en el campo de la inteligencia artificial. Después del lanzamiento de ChatGPT y su integración con Microsoft Teams y Bing, el ambiente en el campo de la IA se está calentando. Para contrarrestar esta inclinación unilateral, Google ideó su propio modelo de IA, Bard, que resultó en alrededor de 12000 despidos. Ahora, el tercer contendiente Meta se une a la carrera de la IA y lanza un nuevo modelo de lenguaje LLaMA.

Meta IA Llama|  Meta se une a AI Race lanza nuevo modelo de lenguaje LLaMA

LLAMA o Modelo de lenguaje grande Meta AI, es un modelo de lenguaje grande que se dice que ayuda a los investigadores a avanzar en el trabajo en otras verticales de IA. No se trata de una sola entidad, sino de varias subversiones que son mucho más pequeñas. Para resumir es «una colección de modelos de lenguaje base que van desde parámetros 7B a 65B».

  • La idea detrás de LLaMA es que los modelos de lenguaje más pequeños aumentarán enormemente la velocidad de la investigación en IA, ya que una gran comunidad no tiene acceso a la infraestructura necesaria para estudiar estos modelos.
  • Este lanzamiento realmente no muestra su intención de competir con otros modelos de IA como ChatGPT o Bard que tienen la capacidad de comunicarse.

Meta también brindó una explicación en forma lúcida. por qué eligieron modelos más pequeños. Es porque son fáciles de volver a entrenar, ya que están entrenados en piezas de palabras o fichas. También dispuso que sus submodelos LLaMA 65B y LLaMA 33B estén entrenados en 1,4 billones de tokens, mientras que el modelo más pequeño LLaMA 7B está en un billón de tokens.

Debe leer: YouChat 2.0 podría rivalizar con Google Bard y ChatGPT

Aunque no estará disponible comercialmente en este momento por las razones expuestas en el Blog. “Para mantener la integridad y evitar el mal uso, estamos lanzando nuestro modelo bajo una licencia no comercial enfocada en casos de uso de investigación. El acceso al modelo se otorgará caso por caso a investigadores académicos; aquellos afiliados a organizaciones en el gobierno, la sociedad civil y la academia; y laboratorios de investigación de la industria en todo el mundo”.

Meta se une a AI Race lanza nuevo modelo de lenguaje LLaMA

En Trabajo de metainvestigaciónel resumen decía que,«En particular, LLaMA-13B supera a GPT-3 (175B) en la mayoría de los puntos de referencia, y LLaMA-65B es competitivo con los mejores modelos Chinchilla70B y PaLM-540B». Estos mejores modelos pertenecen a DeepMind y Google respectivamente. Además, reveló que la empresa solo hace uso de datos disponibles públicamente, lo que hace que el modelo sea compatible con el código abierto. Esto es diferente a los modelos de IA como DeepMind Chinchilla, Google PaLM u OpenAI GPT-3 que utilizan datos no documentados o no disponibles públicamente.

Recomendado: Cómo integrar ChatGPT en Microsoft Word

Después de que meta se une a la carrera de IA y lanza un nuevo modelo de lenguaje LLaMA, ha estado en desacuerdo con el lanzamiento de Google Bard con un poco de revuelo. Esto no es algo malo, ya que no está apresurando el lanzamiento que resultó en que Google Bard diera una respuesta incorrecta y muchas críticas. Esto es algo similar a Bing Chatbot que reveló demasiado sobre su sistema, como que su nombre real es Sydney. También resultó en que Microsoft restringiera el chat de Bing AI a 5 respuestas.

El anuncio de LLaMA también fue todo un éxito con solo una publicación en Facebook y un mensaje en Instagram de Meta Channel. declaró,” Hoy vamos a lanzar un nuevo modelo de lenguaje grande de IA de última generación llamado LLaMA diseñado para ayudar a los investigadores a avanzar en su trabajo. Los LLM se han mostrado muy prometedores en la generación de texto, tener conversaciones, resumir material escrito y tareas más complicadas como resolver teoremas matemáticos o predecir estructuras de proteínas. Meta está comprometida con este modelo abierto de investigación y pondremos nuestro nuevo modelo a disposición de la comunidad de investigación de IA”. Meta también está entusiasmado con la forma en que la comunidad aprenderá y construirá usando LLaMA.

¡Estén atentos para obtener más actualizaciones sobre tecnología y las últimas innovaciones en IA en TechCult!

Fuente: Blog de meta IA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *