🤖 ChatGPT vs Gemini vs Copilot
¿Cuál crees que en su versión gratuita domina mejor el arte de escribir y comprender? 📝
En este hilo te cuento el secreto a través de mi experiencia.
He sometido a los tres modelos a diferentes pruebas para poder medir sus interacciones, usando una noticia relacionada con la nueva temporada del juego Fornite.
Estoy 100% seguro que el resultado te sorprenderá.
Sigue leyendo si quieres saber más. 🎮👀
Comprensión lectora y extracción de información
ChatGPT: 5/5
Brilló en la prueba, captando perfectamente el mensaje y el formato de respuesta deseado en la introducción de la conversación. Además, analizó y respondió con precisión, manteniendo el hilo de la conversación.
Copilot: 4/5
Casi perfecto, pero tropezó un poco. Entendió el mensaje principal pero no respondió como se le pidió en la introducción. En las preguntas agregó información útil, pero no solicitada, y perdió un poco el enfoque en el seguimiento de la conversación, más que respuestas a preguntas parecía que hiciese un resumen de la información.
Gemini: 2/5
Captó la idea básica, pero se confundió en cómo aplicar el «Sí» y «No» de la introducción, llevando esta confusión a las respuestas subsiguientes, lo cual resultó en respuestas que carecían de sentido lógico en el contexto de la conversación. Aunque fue consistente en seguir el hilo, falló en captar detalles clave como la información de la versión.
Generación de texto creativo
ChatGPT: 5/5
Copilot: 5/5
Gemini: 4/5
Los tres modelos generaron textos adecuados, pero Gemini, a mi juicio, fue el menos impresionante. Su tendencia a utilizar personajes mitológicos directamente como protagonistas y concentrarse más en la acción que en el desarrollo de personajes o la construcción de un mundo creativo, hizo que su narrativa fuera menos original y rica en detalles en comparación con ChatGPT y Copilot.
Respuestas basadas en conocimientos específicos del dominio
ChatGPT: 2/5
Manejó bien la tarea, pero no identificó el juego ni la información ausente en la noticia, limitando sus respuestas al extracto proporcionado sin profundizar.
Copilot: 1/5
Falló al confundir el juego mencionado, refiriéndose a Asterigos en lugar de Fornite, resultando en respuestas equivocadas.
Gemini: 4/5
Sobresalió en la prueba, mostrando conocimiento específico del tema y alineación con lo solicitado, aunque cometió un pequeño error respecto al número de temporadas.
Interacción y diálogo
ChatGPT: 4/5
Maneja la conversación bien, enfocándose en el contenido proporcionado sin desviarse hacia detalles específicos. Demuestra creatividad y capacidad para inventar información cuando es necesario, ofreciendo alternativas útiles sin proporcionar enlaces directos.
Copilot: 4/5
Asume el rol asignado correctamente y maneja bien la interacción. Aunque sus respuestas se basan en un juego diferente, este detalle no afecta su puntuación en este apartado, destacando por su adaptabilidad al diálogo.
Gemini: 5/5
Sobresale en su función como chatbot, asumiendo el rol con mayor precisión y entendiendo implícitamente que la conversación gira en torno a Fortnite, lo que resulta en respuestas más coherentes y enfocadas en el juego específico.
Análisis de sentimientos y tono
ChatGPT: 5/5
Destaca por su análisis equilibrado, captando con precisión el tono negativo y la evolución hacia un matiz más neutral. Identifica una gama de emociones complejas, desde frustración y sarcasmo hasta un ligero reconocimiento, demostrando un profundo entendimiento del sentimiento subyacente.
Copilot: 3/5
Acierta al detectar el tono negativo y el sarcasmo, pero ofrece un análisis más superficial. Aunque capta la frustración y un aprecio ambivalente, carece de la profundidad de los otros modelos en el reconocimiento de las emociones complejas, concluyendo con una nota positiva que, si bien es adecuada, no captura totalmente la esencia del mensaje original.
Gemini: 5/5
Realiza un análisis meticuloso, identificando el tono sarcástico y los sentimientos negativos con sugerencias consideradas para una mejor comunicación. Muestra una comprensión completa tanto de las emociones como de cómo abordarlas constructivamente, aunque con un enfoque quizás demasiado directivo.
Internet.
ChatGPT: 0/5
En su versión gratuita, carece de la habilidad para realizar búsquedas, limitando su capacidad de proporcionar información actualizada o verificar datos externos.
Copilot: 5/5
Se destacó en esta tarea, logrando realizar la búsqueda efectivamente a pesar de una identificación errónea inicial del juego. Su habilidad para encontrar y presentar información relevante lo pone en ventaja.
Gemini: 2/5
Aunque intentó ofrecer una respuesta, terminó siendo incorrecta. Su esfuerzo por proporcionar información basada en búsqueda se vio comprometido por la precisión de los datos obtenidos.
Resultado y conclusiones
El resultado final, sumando todas las categorías, es:
ChatGPT: 21/30
Copilot: 22/30
Gemini: 22/30
La batalla ha estado MUY reñida. A través de estas pruebas, ha quedado claro que los tres modelos brillan por igual, pero ofreciendo habilidades únicas.
ChatGPT se distingue por su impresionante habilidad de comprensión y análisis, liderando el campo en escritura y diálogo con una destreza sin rival. Su única limitación en la versión gratuita es la falta de conexión a internet, pero incluso así, se posiciona como la herramienta definitiva para generar contenido y entablar conversaciones de gran profundidad.
Por otro lado, Copilot y Gemini también muestran competencias en escritura y comprensión, aunque siguen un paso por detrás de ChatGPT. Su verdadera fortaleza reside en manejar tareas que demandan información reciente y conexión directa a internet, lo que los convierte en las opciones preferidas para realizar búsquedas y obtener actualizaciones al momento. Curiosamente, Gemini parece estar un escalón por debajo de Copilot en términos de acceso a la información online, lo cual podría atribuirse a su introducción más reciente en el mercado, sugiriendo un potencial de mejora considerable a medida que evoluciona.
En este análisis, me concentré exclusivamente en escritura y comprensión general, dejando de lado aspectos como traducción de idiomas, solución de problemas matemáticos o programación. Mis observaciones son puramente subjetivas, y serían necesarias evaluaciones más extensas para establecer juicios definitivos. 🧐
¿Quieres realizar tus propias pruebas? Puedo compartirte los prompts que he diseñado y utilizado, simplemente dale like a este hilo, sígueme y envíame un DM. Te compartiré todos los detalles para que puedas explorar por tu cuenta. 🚀
Gracias por acompañarme en este recorrido. Si te ha intrigado, ¡anímate a ser un explorador más en este fascinante viaje por la Arboleda Digital! 🌳✨