Introdução geral
O UltraRAG é uma solução de sistema RAG (Retrieval Augmented Generation) proposta em conjunto pelo grupo THUNLP da Universidade de Tsinghua, pelo grupo NEUIR da Universidade Northeastern, pela Modelbest.Inc e pela equipe 9#AISoft. A estrutura baseia-se na implantação ágil e na construção modular, fornecendo um sistema automatizado de construção de dados, ajuste fino do modelo e técnicas de avaliação de inferência. O UltraRAG simplifica significativamente todo o processo, desde a construção de dados até o ajuste fino do modelo, e ajuda os pesquisadores e desenvolvedores a lidar com tarefas complexas de forma altamente eficaz. Sua WebUI de programação sem código ajuda os usuários a operar facilmente toda a cadeia de processos de configuração e otimização, incluindo a solução RAG multimodal VisRAG.
Lista de funções
- Programação sem código Suporte à WebUIOs usuários podem operar o processo completo de configuração e otimização de links sem experiência em programação.
- Soluções de composição e ajuste fino com um cliqueBaseado em métodos proprietários, como o KBAlign e o RAG-DDR, o sistema suporta a construção e a recuperação sistemática de dados com um clique e a otimização do desempenho por meio de diversas estratégias de ajuste fino do modelo.
- Avaliação robusta multidimensional e em vários estágiosA metodologia central do RAGEval, combinada com uma abordagem de avaliação em vários estágios, aumenta significativamente a robustez da "avaliação do modelo".
- Pesquisa amigável Explore a integração do trabalhoInclui a metodologia proprietária do grupo THUNLP-RAG e outros métodos RAG de ponta para apoiar a exploração e o desenvolvimento contínuos em nível de módulo.
- Implementação rápidaSuporte à implementação rápida por meio do Docker e do Conda, facilitando o início rápido dos usuários.
Usando a Ajuda
dependência ambiental
- É necessária a versão 12.2 ou superior do CUDA.
- A versão do Python precisa ser 3.10 ou superior.
Implementação rápida
Implementação via Docker
- Execute o seguinte comando:
docker-compose up --build -d
- Acesso no navegador
http://localhost:8843
.
Implementação via Conda
- Crie o ambiente do Conda:
conda create -n ultrarag python=3.10
- Ative o ambiente Conda:
conda activate ultrarag
- Instale as dependências relevantes:
pip install -r requirements.txt
- Execute o script a seguir para fazer o download do modelo (download padrão para
recursos/modelos
(Catálogo):
python scripts/download_models.py
- Execute a página de demonstração:
streamlit run ultrarag/webui/webui.py --server.fileWatcherType none
Funções principais
Programação sem código WebUI
- Visite a página WebUI e selecione a solução RAG desejada (por exemplo, VisRAG).
- Configuração para construção de dados, ajuste fino do modelo e avaliação de inferência com base em prompts.
- Ao clicar no botão "One-click Synthesis and Fine-tuning" (Síntese e ajuste fino com um clique), o sistema concluirá automaticamente a construção dos dados e o ajuste fino do modelo.
Avaliação robusta multidimensional e em vários estágios
- Selecione o método de avaliação RAGEval na WebUI.
- Defina os parâmetros de avaliação e clique no botão "Start Evaluation" (Iniciar avaliação).
- O sistema executará automaticamente uma avaliação em vários estágios e gerará um relatório de avaliação.
Pesquisa amigável Explore a integração do trabalho
- Selecione o método RAG desejado na WebUI (por exemplo, THUNLP-RAG).
- Siga os avisos para exploração e desenvolvimento em nível de módulo.
- Clique no botão "Start Exploring" e o sistema explorará e desenvolverá automaticamente.