Puede que la mitad del hemisferio norte esté de vacaciones, pero la inteligencia artificial [IA] no descansa. Google acaba de anunciar las últimas funcionalidades de su asistente de investigación y escritura, NotebookLM.
La IA no descansa ni en vacaciones
Desde su concepción como "Project Tailwind" en 2022, esta herramienta ha evolucionado rápidamente. Las últimas actualizaciones que se acaban de presentar incluyen resúmenes en vídeo, un Studio mejorado y la introducción de cuadernos temáticos seleccionados por expertos.
Novedades
Entre las actualizaciones más impactantes se encuentra la introducción de los resúmenes en vídeo (Video Overviews). Google explica que los resúmenes en audio permiten absorber información mientras se realizan otras tareas; pero, a menudo se necesita una ayuda visual para comprender conceptos complejos.
Para que te hagas una idea, he metido el texto de este artículo en NotebookLM y le he pedido que genere un resumen de vídeo. Aquí te lo dejo, para que veas cómo es más o menos el resultado. Ya te aviso que no es para tirar cohetes, pero es verdad que en alguna ocasión puede que venga bien. Eso sí, de momento, los hace en inglés, así que puede que tampoco sea tan útil para todo el mundo, hasta que lo amplíen a más idiomas.
Más eficaz
Google explica que el formato inicial consiste en diapositivas narradas, como una alternativa visual a los resúmenes en audio. Un presentador de IA crea nuevas imágenes para ilustrar conceptos importantes. Se incorporan también imágenes, diagramas, citas y números de los documentos originales. Esto hace que sean más eficaces para explicar datos, demostrar procesos y hacer que algunos conceptos abstractos sean más fáciles de entender.
Al igual que sucede en los resúmenes de audio, se pueden personalizar para enfocarlos en temas específicos, indicar objetivos de aprendizaje, describir la audiencia objetivo e incluso hacer preguntas genéricas o muy específicas.
Nuevo Studio
También se ha actualizado el panel de Studio. Antes, solo podías crear un tipo de resultado [como un resumen de audio, mapa mental o guía de estudio] por cada cuaderno, lo que limitaba bastante las posibilidades.
Ahora, el Studio permite crear y almacenar múltiples resultados del mismo tipo en un solo cuaderno. Además, la nueva interfaz permite la multitarea, lo que significa que puedes escuchar un resumen de audio mientras exploras simultáneamente un mapa mental o revisas una guía de estudio. Según Google, esto mejora significativamente la productividad y facilita la generación de una colección completa de formatos para comprender y compartir el material de origen.
Cuadernos seleccionados
Otra novedad es la implementación de cuadernos temáticos destacados, creados en colaboración con autores, investigadores, publicaciones y organizaciones sin ánimo de lucro de renombre internacional. Cubren un amplio abanico de temas, desde exploraciones científicas detalladas hasta guías de viaje prácticas y consejos de expertos.
Desarrollo
La historia de NotebookLM arrancó a mediados de 2022, cuando un pequeño equipo dentro de Google Labs tuvo una gran idea: una aplicación que desplegaría los modelos de lenguaje avanzados de Google para ayudar a las personas con la investigación, el pensamiento y la escritura, siempre fundamentada en las fuentes que el usuario tuviera a mano.
Esta aplicación, que entonces era conocida como "Project Tailwind", ayudaría a encontrar y sintetizar la información necesaria al rastrear documentos, diapositivas y enlaces considerados relevantes para un proyecto. El primer prototipo fue construido en tan solo seis semanas por un equipo de cuatro o cinco personas a tiempo parcial, demostrando un potencial claro desde el principio. Este proyecto se materializaría como NotebookLM en julio siguiente.
Las ideas de los usuarios han sido el motor principal de su evolución. Desde antes de su lanzamiento, el equipo ha estado solicitando comentarios a través de pruebas internas y un chat a nivel de toda la empresa.
Para recopilar experiencias y sugerencias de funcionalidades, el equipo también incluyó formularios en la aplicación y, en sus primeras etapas, incluso estableció un servidor de Discord para comunicarse directamente con los usuarios.
Estas conversaciones iniciales fueron fundamentales y provocaron la inclusión de las primeras innovaciones, como la capacidad de guardar respuestas como notas, el uso de Gemini para sugerir automáticamente preguntas basadas en las fuentes y las citas en línea.
Steven Johnson, que ha estado involucrado en el desarrollo desde el principio, señala que era evidente para los usuarios que el equipo los escuchaba de verdad, ya que sus solicitudes aparecían en las hojas de ruta del producto, lo que hacía que NotebookLM fuera "más útil para ellos y sus necesidades específicas".