En la conferencia anual Google I/O 2024, Google presentó Gemini 1.5 Pro, la última versión de su IA conversacional, destacada por su comprensión avanzada del lenguaje natural y nuevas funcionalidades. La compañía también introdujo avances en tecnología generativa con Imagine 3 y Veo, así como mejoras en la búsqueda de Google.
Por Fast Check CL
La conferencia anual Google I/O 2024, celebrada recientemente, se centró en los avances de la inteligencia artificial (IA), destacando la presentación de Gemini 1.5 Pro, la última versión de la IA conversacional de Google.
En este sentido, se estableció que Gemini 1.5 Pro se caracteriza por su capacidad mejorada para comprender el lenguaje natural, proporcionando respuestas más precisas y sugerencias más relevantes según el contexto y las necesidades del usuario. Una novedad importante es su disponibilidad para desarrolladores y usuarios avanzados en más de 35 idiomas, lo que amplía significativamente su accesibilidad y potencial de integración en diversas aplicaciones y proyectos.
Además, durante el evento, Google presentó los Agentes de IA, una funcionalidad que permite a Gemini realizar acciones en nombre del usuario. Por ejemplo, un agente podría enviar una foto de un producto a un servicio de atención al cliente para solicitar un reembolso o reservar un viaje y organizar los detalles del itinerario.
En la misma línea, se introdujo el Proyecto Astra, una iniciativa experimental que combina la IA de Gemini con cámaras para interpretar el entorno. En una demostración, Astra identificó y describió objetos en una habitación, leyó y explicó código, y respondió preguntas sobre un video en reproducción.
Google también avanzó en la tecnología de IA generativa con Imagine 3 y Veo, dos nuevos modelos que crean imágenes y videos HD a partir de descripciones textuales, respectivamente. Estas herramientas se integrarán en ImageFX y VideoFX, permitiendo a los usuarios crear contenido multimedia de alta calidad de manera sencilla.
Por otro lado, se anunciaron nuevas funciones de IA para Gmail, como la capacidad de resumir correos largos, responder preguntas y realizar acciones basadas en mensajes. Sumado a esto, Google presentó una nueva aplicación de Gemini que permite interacciones conversacionales y multimodales utilizando texto, voz y video, además de “Gemini Live” para conversaciones más naturales y fluidas.
En cuanto a Android, Gemini actúa como asistente de IA estándar, comprendiendo contextualmente el contenido de la pantalla, creando imágenes para respuestas, respondiendo preguntas sin salir de la aplicación y describiendo imágenes en detalle para personas con problemas de visión. También se señaló que Gemini puede ayudar a identificar y bloquear llamadas de spam y estafas.
Finalmente, Google también presentó “LearnLM“, un modelo de lenguaje basado en Gemini para una experiencia de aprendizaje personalizada, que se integrará en Gemini, el Buscador, YouTube y Google Classroom. La compañía está comprometida con la seguridad y la educación en el uso de IA, introduciendo prácticas de investigación como marcas de agua para textos y videos generados por IA y colaboraciones con otras organizaciones para proteger a los usuarios.