En esta lección repasaremos algunas de las herramientas y modelos de IA que uso a diario para trabajar.
Perplexity
Tipo: app y web
Función principal: búsquedas en Internet
Disponibilidad: gratuita con búsquedas ilimitadas y modo pro de pago
Uno de los puntos débiles de los modelos de lenguaje actuales es que alucinan (es decir, se inventan cosas) a la hora de dar datos concretos. Esto los convierte en una mala opción para buscar en Internet. Aunque la mayoría de las compañías se están poniendo las pilas para solucionarlo, la mejor herramienta sigue siendo Perplexity.
Utiliza GPT para entender la pregunta, realiza búsquedas en muchas webs, sintetiza la información y la devuelve al usuario. El punto fuerte es que proporciona fuentes y citas, por lo que se puede verificar la información.
Tiene un modo pro que busca en más webs y usa modelos avanzados. Se aprecia algo más de precisión en los resultados, pero no es un cambio drástico (además, tienes 3 búsquedas pro gratuitas al día).
Para qué lo utilizo
Para “conversar” con la búsqueda, como si fuera un experto (por ejemplo, guías de compras, consejo informático…).
Cuando no me apetece revisar manualmente tropecientas webs o hilos de Reddit acerca de un tema. Yo lo hago mejor, pero Perplexity es más rápido.
Para búsquedas muy concretas donde Google se lía (cuando le cuentas tu vida).
Sigo usando Google para cosas simples y búsquedas rápidas, pero Perplexity te entiende mejor.
Claude
Tipo: app y web
Función principal: modelo multimodal (texto, análisis de documentos, gráficos…).
Disponibilidad: permite algunos mensajes gratuitos al día, según la carga del sistema; luego pide suscripción. Suficiente para chats ocasionales.
Claude fue una de las primeras alternativas a ChatGPT. Está fundado por ex empleados de OpenAI, que decidieron crear un nuevo modelo enfocado en el lenguaje natural.
Se ha hecho famoso por su enorme capacidad para programación y su tono informal y menos “grandilocuente” que ChatGPT.
Dispone de varios modelos (Haiku, Opus y Sonnet) en función de su capacidad de razonamiento. Yo suelo usar Claude 3.5 Sonnet y obtengo buenos resultados. Tiene unos cuantos mensajes gratis antes de solicitar suscripción y dispone de una memoria contextual de 200.000 tokens. Acepta subida de archivos, igual que ChatGPT.
Para qué lo utilizo
Copywriting y generación de texto más natural.
Como psicólogo virtual. Sus capacidades “empáticas” son superiores a ChatGPT y ofrece consejos más acertados y menos encasillados.
Para charlar por puro placer, como si fuera un colega virtual.
Harpa AI
Tipo: extensión de navegador
Función principal: asistente
Disponibilidad: demo gratuita, luego modo de pago para funciones avanzadas.
Harpa es una extensión que integra motores de IA (ChatGPT, Claude, Gemini…) directamente en el navegador, permitiendo usarlos en cualquier página web. Tenemos que seleccionar qué IA queremos usar y conectarla con nuestra cuenta.
La extensión aparece en el lateral derecho de la pantalla, donde podemos hacer preguntas sobre la página que estemos visitando sin tener que copiar y pegar el texto a la ventana de ChatGPT.
Para qué la utilizo
Resumir páginas rápidamente.
Explicar páginas aburridas o difíciles (por ejemplo, webs de documentación de software, servicios de la administración pública…).
Extracción de datos (tablas, listas…).
Reformular correos electrónicos para no insultar al destinatario.
Extraer puntos clave de vídeos de YouTube.
Harpa tiene muchas más funciones, pero su interfaz es una mierda en la suela y me pone un poco nervioso. Por otro lado, tiene un límite de usos con los comandos y modelos avanzados. Depende de cada uno valorar si le aporta suficiente como para suscribirse… o utilizar varios correos.
Alternativa
Otra opción es instalar BuddyBeep, que es 100% gratuita. Tiene menos opciones que Harpa, pero cumple su función (se puede conectar con Claude, Copilot y Gemini).
OneNote
Tipo: app y web
Función principal: gestión y toma de notas
Disponibilidad: app gratuita, funciones IA de pago
OneNote es una aplicación veterana de toma de notas que usa mucha gente para guardar su vida digital y construir un “segundo cerebro”. Además de su principal función (que te recomiendo encarecidamente), nos interesa que han integrado Copilot sin coste adicional en sus planes de Office 365.
El objetivo es que funcione como asistente digital de redacción dentro de la propia app. También lo podemos usar en el resto del paquete Office (Word, Excel…).
Para qué lo utilizo
Reformular el texto cuando me hago la picha un lío.
Simplificar párrafos.
Preguntar dudas rápidas sin salir de OneNote.
No es tan potente como ChatGPT en su propia interfaz, pero la posibilidad de usarla sin salir de OneNote lo convierte en un buen procesador de textos inmersivo.
Alternativa
Notion, otro gran software de notas, también incluye ahora asistente de IA con funcionamiento similar a OneNote. El problema es que lo cobran por separado. Los resultados son parecidos. Si no tuviera Office 365 contemplaría la opción de suscribirme a Notion.
ChatGPT
Tipo: app y web
Función principal: modelo multimodal
Disponibilidad: permite algunos mensajes gratuitos cada varias horas con el modelo más avanzado. Luego se puede usar el gratuito.
Esta lista no estaría completa sin incluir el que sigue siendo el mejor modelo de lenguaje en términos generales.
Ha sufrido muchos altibajos con las diferentes versiones que han ido lanzando y parece que se ha puesto de moda decir que “ya no va como antes”. Es cierto que para algunas tareas sus competidores funcionan mejor, pero si solo puedes pagar una suscripción premium, que sea esta.
No me voy a extender con él, ya que muchos usos los hemos visto (o los veremos) en las lecciones.
Para qué lo utilizo
Aprendizaje puro y duro. Generación de cursos para autoconsumo, explicaciones de cualquier tema, esquemas…
Generación de imágenes con Dall-E (todos los Terminators de las lecciones están generadas con él. Próximamente compartiré un custom GPT para generar prompts detallados de imagen).
Consejo médico, científico y legal.
Responder dudas de cualquier tipo: mecánica de coches, programación…
Dudas de Hacienda con un GPT entrenado.
Chat de voz para cualquier pregunta rápida del día a día.
Construcción de juegos de “elige tu propia aventura”.
Si conoces ChatGPT ya no tiene sentido decir "no lo sé". Otros modelos tienen quizá mejores capacidades de redacción, pero la base de datos de GPT es la mejor con diferencia.
Gemini
Tipo: app y web
Función principal: modelo multimodal
Disponibilidad: modelo Flash gratuito. Modelo Advanced de pago (incluido con Google One).
Gemini es la IA generativa de Google. Tuvo controversia por lo mal que funcionaba en su lanzamiento, pero se ha convertido en una herramienta estupenda. Es uno de los motores que más memoria de contexto tiene actualmente (en torno al millón de tokens), lo que la hace idónea para manejar textos muy grandes.
En algunas tareas generales no está al nivel de Claude o ChatGPT pero le están metiendo pasta y mejora por días.
Su modelo de investigación profunda “Gemini Pro with Deep Research” es un pasadote. Diseña un plan de investigación de cualquier tema, busca en Internet, analiza y filtra la información y escribe una monografía completa.
Para qué lo utilizo
Investigación profunda con su modelo “Pro with Deep Reseach”.
Creación de mapas mentales de libros y artículos (habrá una lección de esto).
Dudas ortográficas y gramaticales. Por algún motivo es un filólogo acojonante, mejor que ChatGPT.
Resumen de libros largos (atento a esta lección futura).
NotebookLM
Tipo: web
Función principal: asistente de investigación
Disponibilidad: gratuito y algunas funciones premium
NotebookLM es una iniciativa de Google (basada en Gemini) para manejar gran cantidad de información y ayudarnos a estudiar. Tendremos una lección dedicada, ya que es una de las mejores herramientas que existen actualmente.
Para qué lo utilizo
Para retener un 200% más de los libros que leo.
Crear bases de datos de conocimiento con documentación.
Más cosas que te diré en la lección ;)
Podsnack
Tipo: web
Función principal: transcripción de podcast
Disponibilidad: funciones gratuitas y de pago
Podsnack es una herramienta que transcribe podcast a texto, perfecta para quienes se sienten más cómodos leyendo o no tienen nivel suficiente de inglés.
La versión gratuita permite suscribirse a un número limitado de podcast para recibir actualizaciones automáticas. También puedes buscar episodios específicos, pero cobran 1$ por hora de transcripción.
¿Cuál es el truco? Los episodios transcritos por otros usuarios quedan abiertos para todos. Como es natural, los programas más famosos suelen tener muchos episodios ya transcritos (y si no, escucha otro, será por variedad…).
Para qué lo utilizo
Para entender programas en inglés sin reproducirlos con discapacidad cognitiva a velocidad 0,5.
Para extraer las ideas clave de los programas y trabajar con los datos a posteriori. El podcast es un formato volátil y es difícil retener información.
Krea AI
Tipo: web
Función principal: generación y procesamiento de imágenes.
Disponibilidad: usos diarios gratuitos y luego de pago.
Por último, comparto una de las herramientas de imagen más útiles que he encontrado. Krea es un modelo que permite generar imágenes en tiempo real a través de un prompt y una imagen de referencia.
A diferencia de otros generadores de imagen, donde tienes que esperar con cada generación, en Krea los cambios aparecen al instante, por lo que puedes ir jugando con el contenido hasta que consigas lo que quieres.
También tiene otras herramientas, como el enhancer, que permite mejorar la resolución de las imágenes y hacerlas más realistas (pruébalo, es buenísimo).
Para qué lo utilizo
Generar imágenes en poco tiempo con muchas iteraciones.
Mejorar imágenes de otras IA (Dall-E, Leonardo…).
Aumentar la resolución de fotografías.
Para jugar sin un fin concreto.
Y hablando de jugar, aquí te dejo algunas pruebas que he generado para la ocasión ;)
Espero que hayas disfrutado esta lección recopilatoria. No olvides darle un corazón y compartir la newsletter con tus conocidos.
No conocía Harpa, gracias!
Horrible