Google presenta Gemini, la inteligencia artificial que supera a ChatGPT

La omnipresencia de la inteligencia artificial y la competencia en la vanguardia de esta tecnología están en boca de todos. Aunque gigantes como Google o Microsoft llevan años trabajando en el ámbito científico, OpenAI decidió destacar en la esfera pública con su IA GPT y la herramienta ChatGPT. Google, por su parte, respondió primero con Bard y ahora busca liderar el campo de la inteligencia artificial con Gemini, su modelo más ambicioso hasta la fecha.

La contraofensiva de Google ante OpenAI comenzó con Bard, una alternativa a ChatGPT. Ahora, con Gemini, la intención es ofrecer un modelo de IA que compita con GPT, el modelo de inteligencia artificial de OpenAI. El anuncio fue hecho por Sundar Pichai, CEO de Google y Alphabet, y Demis Hassabis, CEO y cofundador de DeepMind, empresa adquirida por Google. La declaración de intenciones se resume en el titular: «Presentamos Gemini: nuestro modelo de IA más grande y capaz». Pero, ¿qué es exactamente Gemini y qué ofrece Google con este nuevo modelo de IA?

La IA generativa más avanzada de Google Cuando Microsoft integró la IA GPT de OpenAI en el buscador Bing, quedó claro que la siguiente fase era agregar inteligencia artificial generativa a otros productos y servicios de Microsoft, como Office y Windows. Google ahora busca hacer lo mismo con su catálogo de servicios y productos en línea. Según el anuncio de Gemini, millones de personas ya utilizan la IA generativa de Google para encontrar respuestas a preguntas complejas y realizar tareas creativas y colaborativas.

Gemini nace como un producto vinculado a Google DeepMind y se presenta como el modelo de IA más ambicioso y potente de la empresa. Es multimodal, lo que significa que puede trabajar con texto, imagen, video, audio y código. Google afirma que Gemini supera a GPT-4 en tareas como respuestas a preguntas, razonamiento, cuestiones matemáticas y programación de código, así como en procesamiento de imagen, video y audio.

Tres versiones de Gemini Gemini se presenta en tres versiones para satisfacer diversas necesidades. Gemini Ultra es la versión más completa para tareas complejas, Gemini Pro es un modelo intermedio orientado tanto al público general como a profesionales, y Gemini Nano es la versión eficiente diseñada para tareas que se ejecutan en dispositivos locales, como computadoras y teléfonos móviles. Entre las capacidades de Gemini se incluyen la escritura de código, la generación de texto e imágenes, y el análisis de imágenes, como partituras musicales.

Inteligencia artificial fiable, escalable y eficiente La eficiencia en el consumo de recursos es crucial, considerando que Google integra su modelo de IA en servicios populares como Google Search, YouTube, Gmail y otros. Para optimizar el rendimiento, Google ha desarrollado la máquina Cloud TPU v5p, un hipercomputador de inteligencia artificial basado en la red de computación en la nube Google Cloud.

Cómo empezar a usar Gemini Gemini 1.0 ya está disponible en varios productos y servicios de Google, como Bard, que integra Gemini Pro. Aunque actualmente limitado al idioma inglés, se puede utilizar en más de 170 países. También se encuentra en los teléfonos Pixel, como el Pixel 8 Pro, diseñado para ejecutar Gemini Nano. En los próximos meses, Gemini se implementará en el buscador Google, Google Ads, Google Chrome y Due AI. Los desarrolladores y empresas podrán utilizar Gemini Pro a través de su API con Google AI Studio o Google Cloud Vertex AI.

Finalmente, Gemini Ultra estará disponible en los próximos meses para un grupo selecto de clientes y desarrolladores. Además, se espera que el próximo año se lance Bard Advanced, una versión más completa que integrará Gemini Ultra.