Cómo crear tu propio podcast en unos minutos con inteligencia artificial

Está claro que los avances de la inteligencia artificial [IA] son cada vez más rápidos y más sorprendentes. Y hoy he probado una nueva funcionalidad que se acaba de incorporar a Gemini, la IA de Google.

Te cuento cómo crear tu podcast con IA, paso a paso

He creado un podcast sobre esta tecnología en cuestión de segundos [en lo que se refiere a mi labor] o minutos [si tienes también en cuenta el tiempo de proceso de información].

Te cuento cómo hacerlo paso a paso, para que puedas crear el tuyo propio, sobre los temas que te dé la gana, sin saber nada de nada sobre ellos.

Crea tu propio podcast

Antes de ponerte a trastear con las herramientas, tienes que es elegir un tema, por supuesto. Yo he optado por la propia IA. Ahora ya puedes dar el primer paso, que es ir a Gemini y pedirle una bibliografía sobre los avances de esta tecnología y las previsiones de futuro.

Para evitar “ruido”, siempre le digo que utilice solo fuentes oficiales de universidades, empresas e instituciones de reconocido prestigio, porque si no, ya sabemos que estas herramientas suelen “tirar” de lo primero que se les pone por delante y no se les da bien eso de jerarquizar las fuentes.

Notebook LM

Una vez que tienes un buen número de fuentes [en mi caso, he pedido 15, pero verás que al final han quedado reducidas a 13], hay que depurarlas. He eliminado la Wikipedia, porque ya sabemos que no sirve de mucho a estas alturas.

Ahora tienes que abrir Notebook LM. Esta funcionalidad no es nueva. De hecho, Google la lanzó en septiembre pasado, pero ahora se ha incorporado a Gemini, lo que hace que sea mucho más útil para gente como tú y como yo.

Fuentes

El siguiente paso es copiar los enlaces de las fuentes que te ha dado Gemini y los vas añadiendo en la sección de fuentes de Notebook LM. Seguro que pillas la pista del botón de “Añadir fuente”.

Puedes poner las que quieras. En mi caso, se ve que las propias IA no se llevan muy bien, porque no me ha dejado incluir a OpenAI que, como sabes, es la competencia directa de Gemini. Pero puede ser por cualquiera de las dos partes [o ambas], así que, no culpemos a nadie.

Funcionalidades

A partir de aquí puedes jugar con la información para hacer casi lo que quieras. Puedes chatear con la IA para que te responda a preguntas o te haga un resumen en texto o en formato audio.

Incluso, te crea un mapa mental con los puntos más importantes y, si haces clic en alguno de ellos, te ofrece la información completa.

Más herramientas

En mi caso, he aprovechado para generar unas preguntas frecuentes [esto te puede servir bastante bien si tienes que crear una web, por ejemplo] y una guía de estudio. Esta opción crea un cuestionario de diez preguntas con sus correspondientes respuestas breves. Te puede ser bastante útil si tienes que estudiar un tema, sobre todo para fijar conceptos.

Pero te aviso que a mí, personalmente, no me convence mucho, porque las preguntas que ha generado se refieren específicamente a cada enlace y no a conclusiones globales del análisis.

Crea tu podcast

Y aquí viene lo que estabas esperando: cómo crear el podcast. No tiene ninguna ciencia, la verdad. Fíjate en la parte superior derecha, en la zona “Studio”. Ahí tienes un simple botón para generar el resumen de audio en formato de conversación entre dos “contertulios”.

En mi caso, ha creado uno de más de 24 minutos, así que parece una buena opción. De hecho, con las mismas fuentes podría haberle pedido que generase dos distintos, uno sobre situación actual y otro sobre previsiones de futuro, pero para el ejemplo no me hacía falta.

Resultado

El resultado es bastante aceptable, la verdad. Los he escuchado peores y con menos conocimiento, eso seguro. Pero tampoco te emociones, porque no es perfecto.

Solo tiene una pega: es en inglés. Como explica Biao Wang, de Google Labs, la funcionalidad Audio Overwiew “todavía es experimental y tiene limitaciones conocidas”. Por ejemplo, en el caso de cuadernos [que es como se llaman los proyectos en esta herramienta, no te lo había dicho antes] “puede tardar varios minutos en generar un resumen de audio. También, los presentadores ahora mismo solo hablan inglés, algunas veces no son exactos y todavía no los puedes interrumpir”.

Pero en esa declaración puedes ver claramente hacia dónde va el modelo: acelerar la generación del audio, incrementar los idiomas y la exactitud y hacerlo interactivo. Esperemos que esos avances lleguen pronto.