
Google presentó una función que permite transformar fotos estáticas en videos dinámicos dentro de la aplicación Gemini. La herramienta está disponible para suscriptores de Google AI Ultra y Pro en Argentina y otras regiones seleccionadas.
La función se activa desde la opción “herramientas” en la caja de instrucciones de Gemini, donde el usuario debe seleccionar “video” para subir la foto que desea animar. Luego, puede describir el movimiento y el audio que imagina, incluyendo diálogos, efectos de sonido y ruido ambiental sincronizados con la imagen. Gemini genera un clip de ocho segundos en resolución 720p, con formato MP4 horizontal 16:9 y audio incorporado.
El despliegue de esta función comenzó en la versión web de Gemini y se extenderá a dispositivos móviles durante la semana. Paralelamente, Google anunció actualizaciones de Flow, su herramienta para creación de películas con inteligencia artificial, que ahora admite capacidades de imagen a video con audio.
Tecnología y alcance
En mayo, Google lanzó Veo 3, un modelo de generación de video de última generación que potencia estas herramientas. La compañía amplió recientemente el acceso a suscriptores de Google AI Pro en más de 150 países. En las últimas siete semanas, se produjeron más de 40 millones de videos con Veo 3 en Gemini y Flow.
Entre los usos reportados se encuentran reinterpretaciones de cuentos de hadas desde perspectivas modernas y videos ASMR que exploran sonidos poco convencionales. David Sharon, multimodal generation lead de Gemini Apps, indicó: “Puedes ser creativo animando objetos cotidianos, dándole vida a tus dibujos y pinturas, o añadiendo movimiento a escenas de la naturaleza”.
La generación de video mediante inteligencia artificial requiere especificar tanto la imagen como la ambientación sonora, lo que amplía las posibilidades creativas y narrativas. La herramienta facilita la creación de contenido audiovisual sin necesidad de conocimientos técnicos avanzados.
Seguridad y políticas de contenido
Google implementa un extenso proceso de “red teaming” para probar la seguridad de sus sistemas y prevenir posibles problemas relacionados con la generación de videos. Además, aplica políticas contra contenido inseguro para evitar usos indebidos de la tecnología.
Cada video generado incluye una marca de agua visible que indica su origen en inteligencia artificial y una marca digital invisible denominada SynthID, que permite rastrear su procedencia. Estas medidas buscan mantener la transparencia y mitigar riesgos asociados a la desinformación o manipulación.
Los usuarios pueden proporcionar retroalimentación mediante botones de “pulgar arriba” o “pulgar abajo”, lo que contribuye a la mejora continua de la experiencia y las medidas de seguridad implementadas.
Disponibilidad y acceso
La función de foto a video puede probarse en la dirección gemini.google.com/veo. Las mismas capacidades están integradas en Flow, la herramienta de creación de películas con inteligencia artificial de Google.
Según informó la compañía, la implementación de esta tecnología representa un avance en la generación de contenido audiovisual mediante inteligencia artificial, facilitando el acceso a usuarios con distintos niveles de experiencia en producción multimedia.
—