Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

89.6K 00

Introducción general

Linly-Talker es un innovador sistema digital de diálogo humano que combina grandes modelos lingüísticos (LLM) con modelos visuales para crear un novedoso enfoque de la interacción persona-ordenador. El sistema integra múltiples tecnologías como Whisper, Linly, Microsoft Speech Services y SadTalker Linly-Talker permite a los usuarios cargar imágenes para el diálogo y mejora la interactividad y el realismo mediante un sistema de diálogo multirronda. El proyecto ha sido desarrollado por Kedreamix y es de código abierto en GitHub para que desarrolladores e investigadores puedan utilizarlo y mejorarlo.

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

Lista de funciones

Sistema de diálogo múltiple: Admite el diálogo multirronda sensible al contexto para mejorar la interactividad y el realismo.
Diálogo de carga de imágenes: Los usuarios pueden subir imágenes y entablar un diálogo con personas digitales.
Síntesis y reconocimiento de voz: Se integra con Microsoft TTS y FunASR para proporcionar múltiples tipos de habla y un rápido reconocimiento del habla.
Generación de subtítulos de vídeo: Admite la generación de subtítulos de vídeo para mejorar los efectos visuales.
clonación de vozCon el modelo GPT-SoVITS, las voces pueden clonarse utilizando un minuto de datos de voz.
Generación de personajes personalizados: Admite la generación de roles personalizados con múltiples modelos y opciones.
diálogo en tiempo realIntegración con MuseTalk para funciones básicas de diálogo en tiempo real.

Utilizar la ayuda

Proceso de instalación

proyecto de clonaciónEjecute el siguiente comando en el terminal para clonar el proyecto:

   git clone https://github.com/Kedreamix/Linly-Talker.git

Instalación de dependenciasVaya al directorio del proyecto e instale las dependencias necesarias:

   cd Linly-Talker
pip install -r requirements_app.txt
pip install -r requirements_webui.txt

Entorno de configuraciónConfigure las variables de entorno y los certificados necesarios para garantizar el correcto funcionamiento del sistema.

Normas de uso

Iniciar la WebUIEjecute el siguiente comando para iniciar la WebUI:

   python webui.py

Abra su navegador para acceder a http://localhost:7860Si desea acceder a la interfaz web de Linly-Talker, puede hacerlo pulsando en el siguiente enlace.

Cargar imágenes para el diálogo::
- En la interfaz WebUI, haga clic en el botón "Cargar imagen" y seleccione el archivo de imagen que desea cargar.
- Una vez cargada la imagen, el sistema genera automáticamente contenidos de diálogo y el usuario puede interactuar con la persona digital.
Síntesis y reconocimiento de voz::
- Introduce el texto en el cuadro de diálogo, selecciona el tipo de voz, pulsa el botón "Generar voz", el sistema sintetizará la voz y la reproducirá.
- Los usuarios también pueden introducir su voz a través del micrófono y el sistema reconocerá y generará automáticamente el texto.
Generación de subtítulos de vídeo::
- Sube un archivo de vídeo, el sistema generará automáticamente los subtítulos y los incrustará en el vídeo, y los usuarios podrán descargar el archivo de vídeo con subtítulos.
clonación de voz::
- Cargue una muestra de voz de la persona objetivo y el sistema utilizará el modelo GPT-SoVITS de clonación de voz para generar una voz similar a la de la persona objetivo.
Generación de personajes personalizados::
- En la interfaz WebUI, seleccione la opción "Generación de persona personalizada", introduzca la información de la persona y el sistema generará una persona personalizada.
diálogo en tiempo real::
- Al seleccionar el módulo MuseTalk, el sistema activará la función de diálogo en tiempo real, que permite al usuario interactuar con la persona digital en tiempo real.

Instalador de Windows All-in-One

Quark: https://pan.quark.cn/s/cc8f19c45a15

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Petal: utiliza la IA para analizar y gestionar documentos, recuperando múltiples documentos para generar respuestas bien documentadas.

Últimos recursos sobre IA # AI Escritura # Recuperación de conocimientos y marco RAG

hace 1 año

062.9K

ChatFree（ChatAnywhere-2）：使用GPT API创建的本地Copilot，支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Aplicación de chat localizada

hace 1 año

071.4K

Seekdb - Ant OceanBase base de datos de búsqueda híbrida nativa de IA de código abierto

Últimos recursos sobre IA

hace 5 meses

027.7K

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

Últimos recursos sobre IA

hace 5 meses

023.5K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Normas de uso

Instalador de Windows All-in-One

Airweave: aplicaciones que integran rápidamente bases de conocimiento para búsquedas inteligentes

GPT Researcher: Genere informes de investigación completos y detallados utilizando datos locales y de Internet.

Artículos relacionados

Petal: utiliza la IA para analizar y gestionar documentos, recuperando múltiples documentos para generar respuestas bien documentadas.

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Seekdb - Ant OceanBase base de datos de búsqueda híbrida nativa de IA de código abierto

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

Sin comentarios

Últimas colecciones

Últimos artículos

Linly-Talker: sistema de diálogo inteligente para personas digitales que combina grandes modelos lingüísticos y modelos visuales para nuevas experiencias interactivas.

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Normas de uso

Instalador de Windows All-in-One

Airweave: aplicaciones que integran rápidamente bases de conocimiento para búsquedas inteligentes

GPT Researcher: Genere informes de investigación completos y detallados utilizando datos locales y de Internet.

Artículos relacionados

Petal: utiliza la IA para analizar y gestionar documentos, recuperando múltiples documentos para generar respuestas bien documentadas.

ChatFree (ChatAnywhere-2): Copiloto nativo creado utilizando la API GPT, con soporte para diálogos complementarios en cualquier ventana.

Seekdb - Ant OceanBase base de datos de búsqueda híbrida nativa de IA de código abierto

ChatTutor - Ayuda pedagógica de AI de código abierto para visualizar el aprendizaje interactivo

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos