Kotaemon: una herramienta multimodal de código abierto para cuestionarios sobre documentos, fácil de implantar
Últimos recursos sobre IAActualizado hace 11 meses Círculo de intercambio de inteligencia artificial 13.5K 00
Introducción general
Kotaemon es una herramienta de código abierto de preguntas y respuestas sobre documentos diseñada para proporcionar a los usuarios finales y a los desarrolladores una funcionalidad de preguntas y respuestas basada en la Generación Aumentada de Recuperación (RAG). Desarrollado por Cinnamon, el proyecto soporta una variedad de proveedores de API LLM (por ejemplo, OpenAI, AzureOpenAI, Cohere, etc.), así como LLMs nativos. Kotaemon proporciona una interfaz de usuario limpia y personalizable para el cuestionamiento de documentos y para la construcción de... RAG Tuberías.

Lista de funciones
- Soporte para múltiples inicios de sesión de usuario, organización de archivos en colecciones privadas/públicas
- Compatibilidad con LLM nativo y proveedores de API populares
- Se suministra con tuberías RAG mixtas para garantizar una calidad de recuperación óptima
- Soporte multimodal de preguntas y respuestas para documentos con gráficos y tablas
- Proporciona guiones fáciles de instalar sin necesidad de configurar el entorno.
Funciones
- Hospedaje de su propia interfaz de usuario web de Documentation Quiz (RAG). Admite varios inicios de sesión de usuario, organiza archivos por colecciones privadas/públicas, colabora con otros y comparte tus chats favoritos.
- Organice su LLM y los modelos de integración. Compatibilidad con LLM nativo y proveedores de API populares (OpenAI, Azure, Ollama, Groq).
- Tubos RAG mixtos. Proporciona una canalización RAG predeterminada razonable combinada con un buscador híbrido (texto completo y vectorial) + reordenación para garantizar una calidad de búsqueda óptima.
- Soporte multimodal de preguntas y respuestas. Preguntas y respuestas para múltiples documentos, con soporte para gráficos y tablas. Compatibilidad con el análisis sintáctico multimodal de documentos (opción disponible en la interfaz de usuario).
- Citas avanzadas con vista previa del documento. El sistema proporciona referencias detalladas por defecto para garantizar que las respuestas del LLM son correctas. Esto puede hacerse directamente en elVisor de PDFVisualice las citas (incluidas las puntuaciones de relevancia) y resáltelas. Avisa cuando el proceso de búsqueda devuelve artículos poco relevantes.
- Soporte para métodos de razonamiento complejos. Utiliza la descomposición de preguntas para responder a preguntas complejas/múltiples. Admite el razonamiento basado en agentes mediante ReAct, ReWOO y otros agentes.
- Interfaz de usuario configurable. Puede ajustar la mayoría de los aspectos importantes del proceso de recuperación y generación (incluidos los avisos) en la interfaz de usuario.
- escalabilidad. Construido sobre Gradio, usted es libre de personalizar/añadir los elementos de interfaz de usuario que desee. Además, nuestro objetivo es soportar múltiples estrategias de indexación y recuperación de documentos.
GraphRAG
A modo de ejemplo, se ofrece la canalización de índices.
Utilizar la ayuda
Proceso de instalación para usuarios habituales
Descargar:a través de (un hueco)Novedadesdescargandokotaemon-app.zip
Documentación.
Instalación:
- Descomprima el archivo descargado.
- entrar en
scripts
e inicie el instalador correspondiente a su sistema operativo:- Ventanas.
run_windows.bat
. Basta con hacer doble clic en el archivo. - macOS.
run_macos.sh
- Haga clic con el botón derecho del ratón en su archivo y seleccione "Abrir con otra aplicación".
- Activa "Todas las aplicaciones" y selecciona "Terminal".
- Nota: Si desea abrir siempre el fichero utilizando el terminal, marque la casilla "Abrir siempre con esta aplicación".
- A partir de ahora, haz doble clic en tu archivo y debería funcionar correctamente.
- Linux.
run_linux.sh
. Utilice elbash run_linux.sh
Ejecuta el script.
- Ventanas.
- Una vez finalizada la instalación, el instalador preguntará si se inicia la interfaz de usuario de ktem, responda para continuar.
- Si el lanzamiento se realiza correctamente, la aplicación se abrirá automáticamente en su navegador.
Proceso de instalación para desarrolladores
Despliegue en Docker (recomendado)
docker run \ -e GRADIO_SERVER_NAME=0.0.0.0 \ -e GRADIO_SERVER_PORT=7860 \ -p 7860:7860 -it --rm \ taprosoft/kotaemon:v1.0
Vaya a http://localhost:7860/ para acceder a la interfaz web.
Implantación del código fuente
Clona e instala los paquetes necesarios en tu nuevo entorno Python.
# optional (setup env) conda create -n kotaemon python=3.10 conda activate kotaemon # clone this repo git clone https://github.com/Cinnamon/kotaemon cd kotaemon pip install -e "libs/kotaemon[all]" pip install -e "libs/ktem"
Vea y edite sus variables de entorno (claves de API, puntos finales) en la sección .env
Medio.
(Opcional) Para activar el visor PDF_JS en su navegador, descargue el archivo PDF_JS_DIST y lo extrae al libs/ktem/ktem/assets/prebuilt
Iniciar el servidor web
python app.py
El nombre de usuario/contraseña por defecto es: admin / admin. Puedes configurar otros usuarios directamente en la interfaz de usuario.
Normas de uso
- Inicio de sesión y gestión de documentos::
- Los usuarios pueden acceder a la plataforma a través de un sistema de inicio de sesión multiusuario para organizar y gestionar sus fondos documentales.
- Admite la categorización de archivos en colecciones privadas o públicas para facilitar la colaboración y el uso compartido.
- Función de preguntas y respuestas::
- Los usuarios pueden cargar documentos y realizar operaciones de preguntas y respuestas en la interfaz.
- Soporte multimodal de preguntas y respuestas y posibilidad de trabajar con contenidos de documentos que contengan gráficos y tablas.
- Personalización de tubos RAG::
- Los desarrolladores pueden personalizar y visualizar la canalización RAG utilizando la interfaz de usuario proporcionada.
- Al admitir LLM nativo y proveedores de API populares, los usuarios pueden elegir el modelo adecuado según sus necesidades.
- búsqueda híbrida::
- El sistema proporciona un canal de búsqueda híbrido que combina búsquedas de texto completo y vectoriales para garantizar una calidad de búsqueda óptima.
- Soporta la función de reordenación para mejorar la relevancia de los resultados de búsqueda.
- apoyo multimodal::
- La plataforma admite preguntas y respuestas multimodales y es capaz de manejar documentos que contengan gráficos y tablas para ofrecer una experiencia de preguntas y respuestas más completa.
Funciones avanzadas
- gestión de modelos::
- Los usuarios pueden organizar y gestionar sus propios LLM y modelos integrados.
- Al admitir modelos nativos y proveedores de API populares, los usuarios pueden elegir el modelo adecuado según sus necesidades.
- Colaborar y compartir::
- Los usuarios pueden compartir sus chats favoritos con otros para facilitar la colaboración y la comunicación.
- El inicio de sesión multiusuario permite a los usuarios colaborar y compartir en la plataforma.
- Comentarios y contribuciones::
- El proyecto está en desarrollo activo y agradecemos los comentarios de los usuarios, los informes de problemas y las propuestas de relaciones públicas.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...