Introdução geral ao QAnything
O QAnything (Question and Answer based on Anything) é um sistema local de perguntas e respostas de base de conhecimento lançado pela NetEase, que suporta todos os tipos de formatos de arquivos e bancos de dados e pode ser instalado e usado off-line. Ele é compatível com PDF, Word, PPT, XLS e outros formatos de documentos, suporta perguntas e respostas em vários idiomas e oferece suporte a perguntas e respostas com grande volume de dados, com alto desempenho, facilidade de uso, recursos de perguntas e respostas em várias bases de conhecimento e recursos de segurança de dados.
O sistema é baseado no mecanismo RAG (Retrieval Augmented Generation) de desenvolvimento próprio, que oferece serviços de Q&A eficientes e precisos. O QAnything é adequado para vários cenários, como gerenciamento de documentos internos, consultoria jurídica e serviços governamentais, para ajudar as empresas a aumentar a eficiência da aquisição de informações e da tomada de decisões.
Lista de funções
- Suporta vários formatos de arquivo: PDF, Word, PPT, Excel, Markdown, TXT, imagens, etc.
- Implementação local: não há necessidade de conexão com a Internet para uso, garantindo a segurança dos dados
- Recuperação eficiente: com base no mecanismo RAG, oferece recuperação semântica de alta precisão
- Fluxo de trabalho flexível: automatizando tarefas com agentes
- Geração de conteúdo: gere esboços completos e conteúdo de artigos com base em referências
- Personalização de cenários: otimização de modelos e pesquisas com base nas necessidades da empresa
Ajuda do QAnything
Requisitos do sistema: Linux com pelo menos 4 GB de memória de GPU, o sistema Windows requer subsistemas WSL
Como instalar: clonagem via git e execução dos scripts de inicialização
Como usar: o Q&A pode ser operado por meio do front-end da Web ou da interface de API
FAQ: Fornece respostas às perguntas mais frequentes
Suporte técnico: fornecer suporte à comunidade e serviços de consultoria de e-mail para desenvolvedores
Processo de instalação
- Baixar o QAnything: AcessoGitHubpara fazer download da versão mais recente do QAnything.
- Preparação ambientalVerifique se o Docker e o Docker Compose estão instalados em seu sistema.
- Extração da base de códigoExecutar no terminal
git clone https://github.com/netease-youdao/QAnything.git
Comando. - Vá para o diretório do projeto: Implementação
cd QAnything
Vá para o diretório raiz do projeto. - Início dos serviços: Implementação
docker-compose up -d
para iniciar o serviço QAnything.
Processo de uso
- Carregamento de arquivosCarregar arquivos para serem analisados por meio da interface do QAnything, que é compatível com PDF, Word, PPT, Excel e muitos outros formatos.
- Pesquisar perguntas e respostasDigite uma pergunta na caixa de pesquisa e o QAnything recuperará e gerará uma resposta com base no conteúdo do arquivo carregado.
- Exibir resultadosO sistema exibe respostas e referências relevantes, nas quais o usuário pode clicar para ver os detalhes.
- Geração de conteúdoOs usuários podem optar por gerar esboços ou artigos, e o sistema gerará automaticamente o conteúdo com base nas referências.
Funções
- Upload de arquivosClique no botão "Upload Files" (Carregar arquivos) para selecionar os arquivos a serem analisados, com suporte para upload em lote.
- Recuperação de problemasDigite uma pergunta na caixa de pesquisa, clique no botão "Pesquisar" e o sistema exibirá a resposta relevante.
- Answer ViewClique nos cartões de resposta para obter respostas detalhadas e referências.
- Geração de conteúdoNo módulo de geração de conteúdo, insira palavras-chave ou referências, clique no botão "Generate" (Gerar) e o sistema gerará automaticamente um esboço ou artigo.
Habilidades essenciais do QAnything
Recuperação em um estágio (incorporação)
Nome do modelo | Recuperação | STS | PairClassification | Classificação | Reranking | Agrupamento | em média |
---|---|---|---|---|---|---|---|
bge-base-pt-v1.5 | 37.14 | 55.06 | 75.45 | 59.73 | 43.05 | 37.74 | 47.20 |
bge-base-zh-v1.5 | 47.60 | 63.72 | 77.40 | 63.38 | 54.85 | 32.56 | 53.60 |
bge-large-pt-v1.5 | 37.15 | 54.09 | 75.00 | 59.24 | 42.68 | 37.32 | 46.82 |
bge-large-zh-v1.5 | 47.54 | 64.73 | 79.14 | 64.19 | 55.88 | 33.26 | 54.21 |
jina-embeddings-v2-base-pt | 31.58 | 54.28 | 74.84 | 58.42 | 41.16 | 34.67 | 44.29 |
m3e-base | 46.29 | 63.93 | 71.84 | 64.08 | 52.38 | 37.84 | 53.54 |
m3e-grande | 34.85 | 59.74 | 67.69 | 60.07 | 48.99 | 31.62 | 46.78 |
bce-embedding-base_v1 | 57.60 | 65.73 | 74.96 | 69.00 | 57.29 | 38.95 | 59.43 |
- Uma análise mais detalhada dos resultados está detalhada emResumo das métricas do modelo de incorporação.
Pesquisa de segundo estágio (rerank)
Nome do modelo | Reranking | em média |
---|---|---|
bge-reranker-base | 57.78 | 57.78 |
bge-reranker-large | 59.69 | 59.69 |
bce-reranker-base_v1 | 60.06 | 60.06 |
- Uma análise mais detalhada dos resultados está detalhada emResumo dos indicadores do modelo Reranker
Cenários de aplicativos QAnything
- Entre idiomas: vários testes de papel em inglês
- Extração de informações
- Uma miscelânea de documentos
- Perguntas e respostas na Web