
Google ha mejorado recientemente su modelo de IA Gemini con una nueva y emocionante función llamada Audio Overview (Resumen de audio). Esta innovadora función permite a los usuarios convertir diversos tipos de documentos, diapositivas e informes en interesantes debates de audio con dos presentadores de IA, adoptando un formato similar al de un podcast.
Cómo generar resúmenes de audio en Google Gemini
Para iniciar tu proceso de transformación de audio, visita el sitio web de Gemini o abre la aplicación correspondiente. Busca el icono «+», junto al botón «Investigación Profunda», y haz clic en él para seleccionar «Archivos».
Es importante tener en cuenta que Gemini admite una amplia gama de formatos de archivo, incluyendo documentos de texto estándar como .DOC
y .PDF
, así como representaciones de datos como .CSV
. Si trabaja con archivos de código, como .PHP
o .JAVA
, es posible que necesite la versión Gemini Advanced.

Una vez cargado y procesado tu archivo, verás un nuevo botón llamado «Generar resumen de audio». Haz clic en él para iniciar el proceso de generación.
La creación de tu Resumen de Audio puede tardar unos minutos, dependiendo de la longitud de tu documento. No te preocupes: puedes seguir trabajando en la ventana de chat o incluso salir de Gemini mientras esperas.
Una vez listo, aparecerá una notificación en tu PC o dispositivo móvil (siempre que hayas habilitado las notificaciones desde el sitio web de Gemini) para que puedas comenzar a disfrutar de tu contenido de audio.

Para escuchar el resumen de audio, simplemente pulsa el botón de reproducción en el reproductor multimedia. El reproductor de audio de Gemini ofrece funciones prácticas como una barra de progreso para facilitar la navegación, botones para avanzar y retroceder 10 segundos y opciones de ajuste de velocidad según tus preferencias de escucha.

Si está utilizando la aplicación Gemini, toque el botón Más para agregar el archivo que desea transformar.

Una vez cargado el archivo elegido, presione el botón Generar descripción general de audio que aparece.

Una vez creada la vista general del audio, haga clic en el resultado. Esto le llevará a su navegador predeterminado, donde podrá acceder al reproductor de audio para que presione «Reproducir» y comience a escuchar.


Actualmente, tenga en cuenta que no es posible reproducir descripciones generales de audio directamente dentro de la aplicación.
Cómo compartir y descargar sus resúmenes de audio
Tu podcast recién generado está listo para compartirse o guardarse para escucharlo más adelante. Para compartirlo, haz clic en el menú desplegable (tres puntos) y selecciona «Compartir conversación».

Aparecerá una ventana emergente; simplemente copie el enlace para compartir resultante y distribúyalo donde quiera.

Si desea disfrutar del audio sin conexión, descargar su Resumen de Audio es muy sencillo. Seleccione el botón Descargar en el Menú de Desbordamiento y la descarga comenzará al instante.

La función Audio Overviews de Google Gemini es una herramienta excelente para quienes gestionan grandes volúmenes de información. A medida que la funcionalidad de Gemini evoluciona, considere explorar sus extensiones para mejorar aún más su productividad.
Crédito de la imagen: Unsplash. Todas las capturas de pantalla son de Jay Kakade.
Preguntas frecuentes
1.¿Qué tipos de archivos puedo cargar para generar resúmenes de audio en Google Gemini?
Puedes subir varios tipos de archivos, como DOC, PDF y CSV. Si quieres trabajar con archivos de programación como PHP o JAVA, necesitarás Gemini Advanced.
2.¿Cómo puedo compartir mi descripción general de audio con otros?
Para compartir su descripción general de audio, simplemente haga clic en el menú adicional (tres puntos), seleccione «Compartir conversación» y copie el enlace para compartir provisto.
3.¿Puedo reproducir mi resumen de audio directamente dentro de la aplicación Gemini?
No, actualmente no se puede reproducir el resumen de audio directamente en la aplicación. Te redirigirá a tu navegador predeterminado, donde podrás acceder al reproductor de audio.
Deja una respuesta ▼