Copiar enlace

Google ha aprovechado su evento Cloud Next 24 para presentar un buen número de novedades que incorporará a sus herramientas profesionales en las próximas semanas o meses, y que se caracterizan por aplicar la IA para promover la eficiencia en distintas tareas del trabajo. Estas son algunas de las más relevantes.

Google Google Cloud Next 24Vids

“Hoy anunciamos la próxima ola de innovaciones y mejoras para Google Workspace, comenzando con Google Vids, nuestra nueva aplicación de creación de videos impulsada por IA para el trabajo. Hace más de 15 años, introdujimos al mundo una nueva forma de trabajar con los primeros editores de texto nativos de la nube en Docs, Sheets y Slides. Todo lo que necesitabas era un navegador para crear y colaborar en documentos en línea ricos. Ahora estamos trayendo la misma magia de la colaboración en tiempo real al vídeo, permitiendo a personas de todo el mundo aprovechar la narración de historias inmersiva en el trabajo”.

Así ha presentado Aparna Pappu, Vicepresidenta de Google Workspace, el nuevo producto de Google basado en IA, que se lanzará en Workspace Labs en junio. Como puedes ver en el vídeo, Google Vids será una herramienta pensada para optimizar la creación de presentaciones en vídeo en el ámbito profesional, con un proceso que aprovechará las utilidades de inteligencia artificial que Google ha ido incorporando en los últimos meses.

Así, con Vids podrás generar un guion, elegir un estilo, componer tu primer borrador con escenas sugeridas de vídeos de stock, imágenes y música de fondo. Y todo ello utilizando la información que el usuario tenga en otros formatos del Workspace de Google, como Docs o Sheets. Vids también puede incorporar voces sintéticas o emplear la del utilizado: “es tu asistente de vídeo, escritura, producción y edición, todo en uno”, explica Google. Además, todo el proceso, como sucede con Docs, será colaborativo y en tiempo real, con varias personas del equipo pudiendo trabajar en él al mismo tiempo.

Entrada de voz en Gmail

Entre las novedades anunciadas en Gemini para Workspace destaca la posibilidad de enviar electrónicos a través de entrada de voz, con una nueva función (“Ayúdame a escribir”) que también permitirá convertir notas preliminares en un correo electrónico completo con un solo clic.

Plantillas en Sheets

En las próximas semanas Google incluirá una nueva función en Sheets que permitirá formatear y organizar datos “con un diseño elegante”. Seleccionando una plantilla del nuevo conjunto de bloques, desde gestión de proyectos hasta planificación de eventos, Google promete que nunca tendremos que volver a crear una hoja de datos desde cero.

También introducirá notificaciones condicionales, que son alertas automáticas basadas en desencadenantes personalizados, como un cambio en un campo de estado.

Pestañas en Docs

Las nuevas pestañas permitirán organizar la información en un solo documento en lugar de enlazar a múltiples documentos o buscar en Drive para encontrar lo que estás buscando.

Mejoras en los sistemas de comunicación de Google

Google incrementará la capacidad de los espacios de Google Chat hasta 500,000 personas. También facilitarán la interoperabilidad de los servicios de mensajería para Slack y Teams.  Además, “Traduce para mí” en Meet, que estará disponible en junio, detectará automáticamente y traducirá los subtítulos de cualquier conversación en vídeo a tu idioma preferido, aumentando el número de idiomas soportados a 69.

Gemini 1.5 Pro llega a Vertex AI

Vertex AI, la plataforma de aprendizaje automático de Google que permite entrenar e implementar modelos de IA, ya alberga una versión preliminar de Gemini 1.5 Pro. Este modelo, lanzado en febrero, se trata de la IA más potente de Google, habiendo alcanzado grandes capacidades de comprensión mientras utiliza menos recursos que sistemas anteriores.

Gemini 1.5 Pro es multimodal, lo que significa que puede comprender texto, imágenes, vídeo y audio. Así mismo, permite una ventana de contexto estándar de 128.000 tokens, pero esta puede alcanzar el millón, lo cual equivaldría a que el conjunto inicial de datos que le daremos a la IA, y que esta considerará antes de arrojar resultados, se situará en unas 700.000 palabras, un estimado de 30.000 líneas de código, 1 hora de vídeo u 11 horas de audio. Esto implica que el modelo cuenta con una capacidad ocho veces mayor que la del contexto máximo que es capaz de procesar GPT4 Turbo de OpenAI.

Dadas las grandes capacidades de esta IA, no es de extrañar que se esté introduciendo poco a poco en otros servicios del ecosistema de Google. Y es que recientemente se anunció que este modelo, en vista privada, potenciará nuevas funciones de Code Assist, su herramienta de asistencia de codificación de IA.

Imagen 2 te permitirá crear clips de vídeo de 4 segundos

A pesar de aún estar esperando por las mejoras de generación de imágenes con Gemini, Google no se rinde y sigue apostando por la IA generativa de Imagen 2, que ahora también podrá crear clips de vídeo a partir de texto y se incorporará dentro de la plataforma de Vertex AI de Google Cloud.

Esta herramienta permite a los usuarios crear y editar imágenes a partir de texto, tal y como lo hacen otras herramientas de inteligencia artificial como Dalle y Midjourney. También puede renderizar textos, emblemas y logos en diferentes idiomas. Además también puedes añadir o eliminar elementos de las fotos generadas o incluso expandirlas para crear una vista de la imagen mucho más amplia.

Sin embargo, lo realmente llamativo de Imagen 2 es que te permitirá crear vídeos de 4 segundos a partir de prompts de texto al igual que hacen otras herramientas de IA como Runway, Pika o Irreverent Labs. Desde Google declaran que las imágenes pueden capturar una amplia gama de ángulos de cámara y movimientos a la vez que mantiene la coherencia en toda la secuencia.

¿La única pega? Su baja resolución (360×640 píxeles) en comparación con otras herramientas como Runway la cual permite crear clips de 18 segundos con resoluciones más altas, desde la tecnológica prometen mejorar esto en el futuro.

Para evitar deep fakes, Google asegura que usará SynthID, el método desarrollado por Google DeepMind para aplicar marcas de agua criptográficas invisibles a imágenes en directo.

 

Mantente informado de las noticias más relevantes en nuestro canal de Telegram