Qué es la IA generadora de texto BLOOM y cómo usarla
Contents
BLOOM es una IA “Autoregressive Large Language Model (LLM)”, es decir un modelo del lenguaje autoregresivo. BLOOM ha sido creada por más de mil investigadores de decenas de países trabajando en colaboración y ha sido entrenada por la supercomputadora Jean Zay, al sur de París, durante 117 días. Se estima que el costo de entrenarla ha sido entorno a los 3-5 millones de dólares. No hablamos del costo de pagar a los investigadores o sus herramientas, sino el coste eléctrico y de hardware. Y por sorprendente que sea la cantidad de recursos necesarias para entrenar una IA de este tipo, GPT-3, la que es posiblemente más avanzada en este campo, costó entorno a los 14 millones de dólares por este mismo concepto.
¿Es BLOOM la mejor IA de generación de texto del mundo?
Hay ciertas discrepancias, según que medio leas, encontrarás que GPT-3 es más avanzado que BLOOM y en otros dirán lo contrario. La realidad es que es tremendamente difícil evaluar este tipo de tecnologías cuando son de un nivel parecido, pues no hablamos de un programa que tiene que realizar una tarea concreta y podemos analizarla y debatir cuales son los potenciales fallos de ambas, cual es el rendimiento, consumo de recursos o satisfacción de la tarea o del cliente….no. Hablamos de unas tecnologías que abarcan tanto que es no tan difícil de evaluar como la inteligencia humana pero empieza a parecerse. Así pues, las pruebas se limitan no a analizar la tecnología en si, sino los resultados en distintas pruebas.
Y si, BLOOM es un modelo del lenguaje con más parámetros que GPT-3, el cual batió records con 175 billions, BLOOM cuenta con 176 billions. No olvides 1 Billion = mil millones no un billón.
Dado que es complejo no voy a decir nada desde un aspecto técnico que se me escapa, tan solo dar mi opinión personal pues he usado GPT-3 y BLOOM un tiempo.
GPT-3 en mi opinión es claramente superior a BLOOM, acierta mayor número de veces tus intenciones, esto no quiere decir que sea mejor pues podría ser solo que hay que ser más cuidadoso al introducir los inputs. Pero no es solo eso, GPT-3 es más fluido, falla menos veces y pilla cuestiones más complejas. Y en el caso de “la tarea chatbot” gana totalmente GPT-3, esto lo reconocen hasta la sociedad que ha creado BLOOM. Sin embargo, BLOOM se desenvuelve mejor en más idiomas, ya que ha sido entrenado con 59, buscando precisamente eso. Y en ciertas tareas concretas puede ganar BLOOM.
Aunque si lees hasta aqui, podría pensar que mi conclusión es “olvídate de BLOOM, GPT-3 es mejor”, no podría ser menos cierto, por dos motivos:
El primero es que BLOOM acaba de salir, y está de momento solo disponible en HuggingFace donde esta ciertamente capado, y el otro motivo es que no está del todo acabado. Así, pues espero una cierta mejoría para BLOOM en los próximos meses antes de acabar 2022 posiblemente. Mejora del software y mejora de las API/interfaz gráfica desde donde se ofrecen.
Pero hay una cosilla más por lo que BLOOM es muy importante…
Por qué BLOOM es tan importante
GPT-3 ha sido desarrollada por OpenAI, una fundación que cuenta como uno de sus fundadores al famoso Elon Musk. Como fundación su objetivo era liberar para el público las inteligencias artificiales que fueran desarrollando pero no fue así, GPT-2 la expusieron al público y rápidamente fue retirada. Luego salió GPT-3 y no es de código abierto ni libre pues tiene una licencia de uso muy restrictiva y limitada a su API.
Así pues no podemos usar GPT-3 para generar contenidos de adulto, para publicar como queramos, hasta hace poco solo se permitía escribir 4 artículos por persona y día con GPT-3 además de cumplir ciertas condiciones. Y si queremos crear una aplicación que use GPT-3 necesitamos aprobación expresa, es decir, no solo cumplir las normas sino que además les parezca bien a ellos, los cuales lo revisarán.
Además al no ser de código libre y abierto, no puede ocurrir “la magia de internet” que es cuando decenas de miles de individuos se coordinan espontáneamente de todas las maneras para mejorar el software, ya sean entusiastas, científicos, empresas, etc.
BLOOM lo cambia todo. Antes de BLOOM teníamos GPT-NEO, GPT-J y toda una ristra de inteligencias artificiales de código abierto y libres para la generación de texto, ninguna de ellas, siendo mal hablados, le llega a la suela de los zapatos a GPT-3, ni siquiera GPT-NeoX, la cual supera a GPT-2 que no es poca cosa.
Hasta la llegada de BLOOM, esta IA si bien puede que no supere a GPT-3 de momento, se queda muy cerca y…no tiene limitaciones de uso de ningún tipo ni hay que pagar por usarla en si, GPT-3 si, es de pago, y no es barata. De hecho, fue con la salida de BLOOM que OpenAI decidió recortar un 66% el precio de GPT-3, todos entendimos que por la competencia que supone BLOOM y que no supone los anteriores modelos como NeoX.
¿Por qué lo cambia todo? Pues lo cambia todo de manera rápida, ya que ahora hay una IA potente que puede suplir las carencias de GPT-3 que han estado limitadas de forma artificial: contenidos de adultos, ciertas apps, limites de uso, costo, etc.
Pero a medio plazo la revolución que puede provocar es bestial, pues ahora el planeta entero puede trabajar sobre una herramienta de manera libre, y como ya sabemos los que nos movemos en el mundo de GNU Linux, hay muchas cabezas pensantes que les gusta crear cosas y mejorarlas, por decirlo suavemente…
Cómo usar BLOOM
Hay 3 maneras a día de hoy de usar BLOOM. Espero que pronto aparezcan empresas privadas que compitan por ofrecer acceso a su API al mejor precio posible, pues el actual es resultado de la falta de competencia pues BLOOM acaba de nacer. Aún así, no sería justo decir que es excesivamente caro. No lo es.
HuggingFace
HuggingFace es una plataforma web dónde se recopilan modelos de IA’s de todo tipo, y a día de hoy ofrece acceso a muchos de esos modelos.
Es el caso de gpt-2 por ejemplo, de GPT-NeoX o de BLOOM. Podremos usar BLOOM gratuitamente, tan solo necesitamos un correo para registrarnos en HuggingFace. Y lo podremos usar desde su interfaz gráfica. También lo podremos usar mediante la API a través de cURL, de Nodejs, etc.
Si queremos hacer un uso muy intensivo, lo podremos hacer pagando 9$ al mes, así podremos hacer peticiones por un millón de caracteres al mes.
Acceder a la interfaz y a la API.
Pagar para uso masivo de la API.
Instalarla
Podemos instalar BLOOM nosotros mismos en nuestra propia computadora, pero requiere de un hardware excesivamente potente, el cual solo tienen gamers o investigadores, y personas así. Puede costar varios miles de dólares este equipo.
Pero hay otra manera, podemos alquilar estos recursos en sitios como Google Collab, AWS, etc.
Puedes descargarla usando el anterior enlace.
API’s profesionales
Aún no he encontrado ninguna, pues como mencioné BLOOM es muy nuevo y apenas ha habido integración todavía pero es cuestión de meses que muchos servicios del estilo de GooseAi ofrezca API a este modelo, igual que ya lo hacen para otros como GPT-NeoX.
Licencia de uso de BLOOM
Como he dicho, es libre, y su licencia muy abierta, casi no tiene limitación de uso alguna, puedes leer su licencia oficial aqui. Es un texto muy cortito.
Por otro lado tenemos una “licencia de uso ética”, es una llamada al uso responsable de los autores pero no un documento legal, más bien, sugerencias. Lo podéis encontrar aqui.
Enlaces y recursos
- Web de Bloom en HuggingFace.
- Web y blog de Bloom en Notion. (Contiene muchos recursos extras)
- Interfaz de Bloom para usarla, en HuggingFace. (Puedes usar la interfaz gráfica, la API e incluso descargar BLOOM).
- Otras mini aplicaciones de BLOOM.
- Licencia.