Janus Pro vs. DALL·E 3: ¿El nuevo rey de la IA generativa?

Janus Pro: ¿El nuevo rey de la generación de imágenes con IA?

Si pensabas que ya habías visto todo en el mundo de la inteligencia artificial, prepárate para cambiar de opinión. La compañía DeepSeek acaba de lanzar Janus Pro, un modelo de IA que promete superar a gigantes como DALL·E 3 y Stable Diffusion en la creación de imágenes a partir de texto. ¿Será verdad o solo otro nombre más en la lista de promesas exageradas del mundo tech? Vamos a descubrirlo.

¿Qué es Janus Pro y por qué debería importarnos?

Para ponerlo en términos sencillos, Janus Pro es un modelo avanzado diseñado para interpretar imágenes y textos, combinando ambas habilidades para generar contenido visual basado en descripciones escritas. Es como ese amigo que siempre entiende lo que quieres sin necesidad de explicárselo tres veces.

Más inteligencia: Janus Pro es una versión mejorada del modelo original Janus y ha sido entrenado con más datos, mejores técnicas y ajustes finos para mejorar su rendimiento.
Mejor calidad visual: Puede generar imágenes más detalladas, con mejores colores y elementos complejos, además de ser más estable cuando se le dan instrucciones cortas.
Capacidad para escribir texto visible: Algo que muchos modelos actuales aún luchan por hacer bien.

Pon esto en perspectiva: si alguna vez usaste una IA generadora de imágenes y terminaste con letras deformes dignas de una pesadilla tipográfica, sabrás lo importante que es esta mejora.

Análisis técnico: ¿qué hace especial a Janus Pro?

No todo es marketing. DeepSeek asegura que su nuevo juguete digital emplea métodos avanzados para procesar imágenes y texto sin los típicos conflictos entre ambos procesos. Traducido al lenguaje humano: debería entender mejor lo que quieres decir y plasmarlo sin errores.

Sistema dual: Usa un sistema separado para entender imágenes (SigLIP encoder) y otro para generarlas (VQ tokenizer), evitando así interferencias molestas.
Doble tamaño disponible: Hay versiones con 1 billón y 7 billones de parámetros, ajustándose a diferentes necesidades y potencias computacionales.
Licencia flexible: Puedes usarlo tanto en entornos académicos como comerciales sin muchas restricciones legales molestas.

Poniendo a prueba a Janus Pro

Aquí no nos conformamos con palabras bonitas; queremos resultados reales. Así que pongámoslo a prueba frente a sus competidores.

Ejemplo 1: “El rostro de una chica hermosa”

A simple vista, la imagen generada por Janus Pro tiene mejoras notables frente a su predecesor Janus, pero sigue mostrando algunos problemas con proporciones faciales. La competencia aún tiene ventaja aquí.

Ejemplo 2: “Un pizarrón verde oscuro con la palabra ‘Hello' escrita claramente en tiza blanca.”

Aquí se ve un buen progreso en la generación de texto dentro de las imágenes. Sin embargo, todavía no alcanza el nivel suficiente para competir al 100 % contra AI líderes como DALL·E 3.

¿Realmente supera a DALL·E 3 o Stable Diffusion?

Aquí entramos en lo bueno. Según los benchmarks internos proporcionados por DeepSeek, Janus Pro obtiene puntuaciones superiores en pruebas como GenEval, superando supuestamente a OpenAI en ciertas áreas clave… Pero si confiáramos ciegamente en los benchmarks internos de cada empresa tecnológica, todos serían el “mejor modelo jamás creado”.

Poniendo los números bajo el microscopio:

Puntuación GenEval: Janus-Pro-7B marca un sólido 0.80, mientras que sus competidores se quedan atrás.
Puntuación en DPG-Bench: Una calificación impresionante de 84.19 coloca este modelo como líder teórico… aunque ya sabemos que las pruebas internas pueden estar “ligeramente infladas”.

Nuestra verificación práctica dice otra cosa…

Aunque los números puedan sonar impactantes, las pruebas prácticas sugieren algo diferente. Aquí hay algunas comparaciones visuales:

Ejemplo 3: “Un rebaño de ovejas rojas sobre un campo verde.”

Ejemplo 4: “Mujer con vestido rosa posando frente a la Torre Eiffel.”

Ejemplo 5: “Niño sosteniendo una pizarra donde se lee ‘AI is awesome!' ”

Aquí tenemos un problema evidente: los rostros generan inconsistencias extrañas, las proporciones corporales aún necesitan ajustes serios y la claridad del texto deja mucho que desear… Si esperabas resultados impecables desde el primer intento, tal vez sea mejor esperar futuras actualizaciones.

Entonces… ¿es Janus Pro revolucionario o solo otra promesa vacía?

No se puede negar que DeepSeek está haciendo avances importantes en la generación multimodal con IA. Sin embargo, basándonos en nuestras pruebas independientes (y no solo en los benchmarks internos), queda claro que aún tiene camino por recorrer antes de destronar a OpenAI o Stability AI.

Puntos positivos:

Creciente capacidad para generar textos dentro de imágenes (aunque aún imperfecto).

<li <li

Puntos negativos:

”
<li

”
<li<Aún necesita ajustes significativos antes de volverse una opción realista para producción masiva.” </ul”

Aunque el futuro luce prometedor para “los nuevos jugadores del mercado”, hoy todavía estamos lejos del reemplazo definitivo de modelos ya establecidos.”