Actualización pesada: Dify v0.10.0 introduce la carga de archivos, fácil de construir NotebookLM AI Podcasts

Dify Dify se dedica a ayudar a los desarrolladores a poner en marcha rápidamente sus ideas de IA, ya sea validando prototipos de productos o creando herramientas de productividad. Flujo de trabajo Todas las mejores opciones.En la última versión v0.10.0, hemos introducido la tan esperada función de carga de archivos, que permite a Workflow manejar documentos y audio/vídeo en múltiples formatos, ampliando aún más los límites del desarrollo de aplicaciones de IA.

Esta función es especialmente adecuada para los siguientes casos.

  • Preguntas y respuestas sobre documentación: Responda a las preguntas basándose en los documentos cargados con fuentes fiables.
  • Resumen del informe: Extraiga rápidamente los puntos principales de documentos extensos para generar resúmenes.
  • Tratamiento de formularios: Recupere y procese rápidamente contenidos específicos de varios documentos u hojas de cálculo.

Además, la función de carga de archivos allana el camino para las aplicaciones multimodales de IA.Ahora, los desarrolladores pueden crear fácilmente flujos de trabajo complejos que comprenden y procesan imágenes, audio y vídeo, mejorando drásticamente la funcionalidad y la experiencia de usuario de sus aplicaciones.

Función de carga de archivos fácil de usar

1. Habilitar la carga directa de archivos

Activar la carga de archivos es muy sencillo, basta con activar el interruptor de carga de archivos en la lista de funciones (por defecto es una variable del sistema). archivos.sys ). Los usuarios pueden cargar archivos directamente a través del cuadro de diálogo y el último archivo cargado sobrescribirá automáticamente el anterior. Si se necesita una gestión flexible del contexto, los desarrolladores pueden activar la función de memoria.

2. Creación de variables personalizadas

Otra forma es crear variables personalizadas en el nodo de inicio para admitir la carga de uno o varios archivos. Una vez configuradas, la interfaz de usuario mostrará el formulario de carga de archivos y el diálogo posterior y el procesamiento del flujo de trabajo girarán siempre en torno a los archivos cargados.

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Después de cargar un archivo, también es necesario preprocesarlo según el tipo de archivo para que LLM pueda comprender y analizar eficazmente el contenido. Los archivos de tipo documento (por ejemplo, TXT, PDF, HTML, etc.) requieren la extracción de texto en Workflow mediante el nodo Document Extractor, que los convierte en variables de cadena disponibles para LLM. Los archivos de audio y vídeo deben codificarse con herramientas adicionales, como la extracción de audio a texto o de fotogramas clave de vídeo. (Cabe mencionar que el modelo "gpt-40-audio-preview" de OpenAI, recientemente publicado, admite el procesamiento directo de audio para inferencia y diálogo, que se adaptará en una iteración posterior de la versión).

En esta actualización no sólo hemos añadido un nuevo nodo Extractor de Documentos y Manipulación de Listas para extraer y filtrar archivos respectivamente, sino que también hemos mejorado la mayoría de los nodos de Flujo de Trabajo, consulte la ayuda para más detalles:

https://docs.dify.ai/zh-hans/guides/workflow/file-upload

Construir rápidamente un podcast de IA utilizando cargas de archivos

NotebookLM, la herramienta de inteligencia artificial de Google lanzada recientemente, ha llamado mucho la atención por su nueva función de "audio". Puede analizar rápidamente contenidos largos, extraer información clave y generar resúmenes de audio conversacionales similares a los podcasts. Esto no sólo ahorra a los usuarios mucho tiempo de lectura, sino que también les facilita llegar a lo esencial del contenido.

A continuación, le mostraremos cómo puede utilizar la función de carga de archivos y los nodos asociados para convertir documentos en podcasts conversacionales de IA a través de Workflow, permitiendo algo como lo siguiente CuadernoLM La función del

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Configuración de parámetros del nodo de inicio

Cree un nuevo Chatflow y, en el nodo de inicio, configure la carga de archivos y defina las variables clave (como el tono, el anfitrión, los invitados y el idioma).

  • ** archivo : **Seleccione el tipo de campo "Archivo único" para permitir la carga de archivos de tipo documento.
  • ** tono :: Permite a los usuarios personalizar el estilo de comunicación del podcast de IA mediante tipos de "opción desplegable", como Casaul, Formal, Humorístico, etc.
  • ** nombre_de_host Seleccione el tipo "Texto" para introducir el nombre del facilitador.
  • ** nombre_huésped Seleccione el tipo "Texto" para introducir el nombre del invitado.
  • ** idioma :: **Utilice un tipo de "opción desplegable", que ofrezca opciones de chino, inglés, japonés, etc., para facilitar a los usuarios la elección del idioma del podcast.

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Generación de scripts de podcast mediante el extractor de archivos con nodos LLM

Tras una carga correcta del archivo, el extractor de documentos extrae el texto en la variable ***archivo ***, convirtiendo los datos no estructurados en contenido de texto procesable. A continuación, el contenido extraído se procesa a través de tres nodos LLM para generar gradualmente el guión completo del podcast.

1. LLM Analizar la entrada

El texto extraído se analiza para destilar la información clave necesaria para el podcast, incluidos temas importantes, puntos de la historia, datos, etc., sentando las bases para la posterior generación del contenido del podcast.

2. Nodo de generación de guiones LLM (Craft the Dialogue)

A partir del contenido extraído y de variables predefinidas (como tono, idioma, nombre_anfitrión y nombre_invitado), se generan guiones de diálogo de podcast naturales y personalizados para garantizar que las interacciones entre anfitrión e invitado se ajusten a los roles y estilos establecidos.

3. Nodo de conclusiones LLM (Conclusión)

Genere un resumen del podcast que recapitule los puntos clave a través de un diálogo entre el presentador y el invitado, asegurándose de que la sección de resumen deja una impresión duradera en el oyente y conduce a algunos elementos de reflexión o sugerencias para la acción.

Con el procesamiento de los nodos LLM, obtenemos el diálogo y el resumen del podcast.

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Fusión de bloques de texto mediante nodos de conversión de plantillas

El nodo de conversión de plantillas combina el contenido parcial generado por cada nodo LLM en una salida completa y lo convierte en un formato uniforme utilizable por las herramientas posteriores.

  • Entrada: Obtener los fragmentos de texto de los dos nodos LLM Diálogo y Conclusión, a través de las variables *** arg1*** y arg2 Haz una citación.
  • Salida: fusiona *** arg1*** (contenido del diálogo) y *** arg2*** (sección de resumen) para generar un guión de podcast completo y coherente, que se emite en formato de cadena para facilitar su procesamiento por herramientas posteriores.

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Configuración y salida del generador de audio Podcast

Tras completar la fusión del texto, el script pasa el nodo de conversión de plantilla salida se pasa al generador de audio del podcast para iniciar la etapa final de generación de audio.

La herramienta genera el audio del podcast a partir de un guión de texto, y los desarrolladores pueden seleccionar las voces del anfitrión y los invitados (por ejemplo, "Alloy" y "Shimmer") para determinar cómo sonarán los personajes. El generador de podcasts convierte el guión completo recibido en un archivo de audio y lo pone a disposición para su descarga.

重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

Con estos pasos, podrás dominar fácilmente cómo generar podcasts de AI utilizando la función de carga de archivos. También hemos creado una plantilla de esta aplicación y la hemos colocado en la página Explorar para que te resulte más fácil empezar rápidamente y seguir explorando más funciones.

Otras cosas que debe saber

Función de carga de imágenes declaración fuera de línea

1. Para la aplicación Chatflow:

En la versión v0.10.0, hemos ampliado la función original de carga de imágenes a la carga de archivos, lo que permite a la aplicación gestionar más formatos de documentos y archivos de audio/vídeo.

  • La función de carga de imágenes se ha integrado como parte de la carga de archivos. Cuando la función de carga de archivos está activada, puede hacer referencia a archivos como imágenes cargadas en la ventana de chat seleccionando ***sys.file *** a través del selector de variables visuales en el nodo LLM.
  • 重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

  • Hemos realizado un procesamiento de compatibilidad en versiones anteriores de la aplicación para garantizar que las aplicaciones que utilizaban la función de carga de imágenes en versiones anteriores sigan siendo estables.

2. para aplicaciones Workflow:

  • Recomendamos personalizar la variable de tipo de archivo en el nodo de inicio de la carga de archivos para manejar más tipos de archivos.
  • 重磅更新:Dify v0.10.0 推出文件上传功能,轻松构建 NotebookLM AI 播客

 

  • Nota: en una próxima versión dejaremos de utilizar la antigua función de carga de imágenes y las variables del sistema. archivo.sys .

Consulte el archivo de ayuda para obtener más información:

https://docs.dify.ai/zh-hans/guides/workflow/bulletin

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...