La empresa desarrolladora OpenAI permite a terceros utilizar su modelo de IA para crear nuevas herramientas, lo que ha provocado el nacimiento, en poco más de un año, de una multitud de servicios. Potencialmente, para miles de tareas.
Si esa compañía abrió la veda es porque cuenta con los recursos de computación de su principal inversor, Microsoft, con quien mantiene una alianza estratégica integral. Le tomó la delantera a Google, el otro gran actor, al lanzar a finales de 2022 ChatGPT, que se nutre de textos recopilados de internet para elaborar sus respuestas.
Lo cierto es que OpenAI no es muy transparente respecto a los datos de entrenamiento para sus IA, y se cree que el modelo de ChatGPT emplea contenido de Wikipedia o Twitter (ahora X), entre otras fuentes. Con su generador de imágenes, Dall-E, ocurre otro tanto, de hecho varios colectivos de creadores han denunciado a la empresa y la acusan de recurrir a material con derechos de autor para entrenar al modelo. La compañía se ha visto obligada a establecer una fórmula, bastante engorrosa, para que los artistas puedan sacar sus creaciones de la base de datos de esa IA. Midjourney, otro generador de imágenes, también tiene líos legales, aunque de momento los jueces no han dado la razón enteramente a ninguna de las dos partes.
Para aligerar el trabajo de oficina, en marketing, para traducir mejor que Google Translate, editar o programar. Incluso detectan (u ocultan) si tal trabajo lo ha hecho otra IA
Conclusión: la opacidad de las empresas desarrolladoras deja poco margen para conocer cómo el entrenamiento de sus sistemas logra unos resultados tan completos.
ChatGPT o el sistema de Google, Gemini, son todoterrenos: redactan mensajes, resumen documentos, proporcionan todo tipo de respuestas en texto y son capaces de crear imágenes y código informático. Otros modelos generan vídeos, convierten textos en locuciones, desarrollan fórmulas de Excel o sintetizan música. Vamos camino de una IA para cada tarea. Eso sí, conviene revisar el contenido generado, porque no siempre aciertan con lo que se les pide.
A continuación, una selección de algunas de las más populares.
Pixlr Express
Agiliza algunos procesos en edición de fotos, como eliminar objetos con una selección rápida, cambiarlos por otros, rellenar el fondo de manera predictiva y otras modificaciones útiles.
QuillBot
Este asistente de redacción reescribe textos a partir de las instrucciones del usuario, con un resultado más elaborado, sintético o literario, por ejemplo. Corrige la gramática y ofrece recomendaciones de estilo para mejorar el mensaje.
Jasper
Trata de abarcar todas las tareas posibles de marketing. Redacta artículos para blogs, eslóganes y mensajes publicitarios, genera imágenes para anuncios y publicaciones en redes sociales, incluso diseña estrategias de contenido.
GPTZero
Distingue si un texto ha sido generado con IA (por ejemplo ChatGPT, Google Gemini o Llama, que es el modelo de Meta) o lo ha escrito una persona.
WriteHuman
Evita que un texto generado con IA sea detectado por herramientas como GPTZero, al eliminar indicadores que permiten rastrear su origen no humano.
Otter.ai
Asistente integral para videorreuniones. Graba el audio y lo transcribe en tiempo real (también otros audios añadidos aparte), toma notas, genera un resumen de la videollamada y captura diapositivas de forma automática.
Ayudan a buscar empleo o contenidos de formación y crean música, poemas, diseños, webs o audios con una voz parecida a la del usuario
DeepL
Uno de los traductores automáticos más afinados, similar a Google Translate aunque generalmente con mayor nivel de precisión. Ofrece servicios en más de 30 lenguas.
AI Poem Generator
Si le proporcionamos un tema o varias indicaciones, separadas por comas, compondrá un poema rimado. Versos artificiales casi al instante.
Synthesia
A partir de un guion escrito, genera un vídeo con un avatar que narra el texto. Se puede usar para crear vídeos explicativos o formativos destinados a un grupo, como la plantilla de una empresa o los pasajeros de un avión.
ElevenLabs
Convierte cualquier texto en audio, en 29 idiomas. Pero va más allá. Permite elegir en una amplia biblioteca de voces sintéticas que imitan con acierto el tono vocal de una persona. Cualquiera puede entrenarla con su propia voz para que recite textos como si hablara el usuario.
MusicFX
Un desarrollo de Google que genera música a partir de una descripción más o menos exhaustiva en texto. Sirven desde indicaciones sencillas a otras más detalladas en conocimiento musical.
Gamma
A partir de unas instrucciones en texto y con unos pasos sencillos, genera una página web, con su estructura jerárquica, sus módulos y su temática previamente definida. También crea presentaciones basadas en diapositivas, tipo Power Point.
GitHub Copilot
Esta aplicación de Microsoft utiliza el modelo OpenAI Codex, del creador de ChatGPT, para proponer ajustes de código y hasta funciones enteras, buscar errores de programación u obtener sugerencias de mejora.
GPT Excel
Genera fórmulas para hojas de cálculo, como el programa Microsoft Excel o Google Sheets. Solo hay que describir qué tiene que hacer cada celda y proporciona el destilado matemático para ese encargo.
Una de las aplicaciones con mayor impacto potencial es la que da asistencia para la programación de código orientada a buscar errores o proponer ajustes y mejoras
SlideSpeak
Resume los archivos de tipo PowerPoint, de los más usados en la oficina. Si se le hacen preguntas concretas sobre una presentación, dará respuestas basadas en las diapositivas que ha procesado.
AI Apply
Su propósito es ayudar a buscar empleo al ocuparse de las tareas más pesadas. Por ejemplo, redacta una carta de presentación para cada oferta laboral y adapta el currículum en función de cada puesto.
TutorAI
Esta herramienta invita a aprender. Le sugieres un tema, ya sea la historia de la India o principios de la física cuántica, y te propone un curso con módulos divididos en áreas de estudio para que sean más digeribles.
DALL-E 3
El último sistema de OpenAI para la generación de imágenes, con toda la polémica asociada por los derechos de las que procesa. El usuario describe lo que quiere mediante un texto en lenguaje natural y puede obtener imágenes realistas o ilustraciones con el estilo indicado. Puede pedir una estética de cuadro impresionista, por ejemplo, o con los cánones del estudio Pixar.
Midjourney
También genera imágenes, pero está más orientado hacia profesionales del diseño. Basado en el modelo de IA Stable Diffusion (otro generador), cuenta con múltiples opciones para afinar el estilo, mejorar la composición y la coherencia visual de los resultados.
Runway
Crea vídeos realistas a partir de descripciones en texto y en cualquier entorno, desde un campo de olivos a las calles de Nueva York. También entrega animaciones y permite corregir el color o trabajar sobre la textura 3D.