Todo ingeniero dedicado a contruir sistemas NLP sabe de la existencia y el hito que ha supuesto GPT-3, así como todo amante de las tecnologías NLP.

GPT-2, creado por OpenAI, ya supuso un hito en su momento, muy importante. Pero GPT-3 marca la diferencia entre chapurrear un poco de lenguaje a veces coherente, a ser coherente casi siempre y respondes preguntas medianamente complejas con acierto, cuando digo acierto me refiero probalístico. Al fin y al cabo, hablamos de predictores de textos, no es la única tecnología que existe en este campo, pero si  es el State of Art en el campo del NLP.

Pues bien, GPT-3 ha sido superada, o al menos eso afirman Nvidia y Microsoft en su asociación, y por otr lado DeepMind, empresa británica comprada por Alphabet.

Apenas ha pasado tiempo y ya se ha superado una tecnología como GPT-3 la cual está en el mercado con muchas condiciones, por ejemplo, no se permite publicar en internet más de 4 artículos diarios por persona usando GPT-3, además de avisar explicitamente su autoría. En un intento para parar el spam, que lógicamente solo funcionará a corto plazo.

Estas dos IA superiores a GPT-3 son Gopher, de Deemind y Megatron-Turing de Nvidia y Microsoft.

Aqui os dejo esta gráfica del tamaño de cada modelo:

 

Mientras que Megatron dice haber conseguido más precisión que GPT-3 a través de un modelo más grande aún que este, siguiendo la tendencia de cada vez modelos más grandes. La IA de Deepmind, Gopher, afirm haber superado a GPT-3 sin aumentar el tamaño del modelo sino usando un método de verificación del contenido que este crea.

Aqui os dejo un gráfico que ha publicado en su estudio Deemind sobre el porcentaje de aciertos de Gopher con respecto a GPT-3.

Estos artículos te podrian interesar 🙂

Qué es la IA generadora de texto BLOOM y cómo usar... BLOOM es una IA "Autoregressive Large Language Model (LLM)", es decir un modelo del lenguaje autoregresivo. BLOOM ha sido creada por más de mil in...
Cómo probar y usar la IA generadora de imágenes St... Qué es la IA Stable Diffusion Stable Diffusión es un modelo neuronal, una inteligencia artificial que permite crear imágenes realistas a partir de te...
Entrevista a la IA GPT-3 sobre Bitcoin Atención: este artículo ha sido escrito por la IA GPT-3 y no ha sido corregido por ningún humano. En este artículo charlo con la Inteligencia Artific...
Alternativas a GPT-3 GPT-3 de OpenAI es una IA que es capaz de crear texto coherente, además de cumplir instrucciones, traducir, crear contenido HTML, programar un poco, e...
Relato: La chica en el bosque La chica en el bosque Una larga historia sobre una niña en el bosque que al final toma conciencia de que está en el metaverso: La niña deambul...
¡Cómparte este artículo si te ha gustado! :)