CleverBee : un assistant de recherche IA open source génère des études de citations

Introduction générale

CleverBee est un assistant de recherche en IA open source hébergé sur GitHub et développé par SureScaleAI. Il est conçu pour la recherche en IA à l'aide de grands modèles de langage (par ex. Gémeaux CleverBee est une solution de navigation web qui combine la technologie de navigation web avec la capacité de collecter, d'analyser et de résumer rapidement des informations pour produire des rapports de recherche cités. Les utilisateurs peuvent facilement accéder à un contenu précis à partir de pages web, de PDF, de vidéos YouTube ou de ressources universitaires. CleverBee prend en charge les modèles locaux et en nuage, et convient à la recherche universitaire, à l'analyse commerciale et à d'autres scénarios. Son interface est basée sur Chainlit, avec une utilisation simple et intuitive et une configuration flexible, adaptée aux individus et aux équipes de recherche.

CleverBee:开源AI研究助手,生成引证研究报告

 

Liste des fonctions

  • Prise en charge d'un large éventail de grands modèles linguistiques, y compris les modèles Gemini, Claude et GGUF natif.
  • Automatiser la navigation sur le web, extraire le contenu HTML et le nettoyer en données structurées.
  • Générer un document de recherche avec des citations, y compris des citations de sources et des notes de limitation.
  • Prise en charge de l'extraction des sous-titres des vidéos YouTube, de l'analyse des fichiers PDF et de la recherche académique PubMed.
  • Fournit un suivi en temps réel de l'utilisation des jetons et des coûts afin d'optimiser la gestion des ressources.
  • faire passer (un projet de loi, une inspection, etc.) config.yaml Documenter les modèles de personnalisation, le comportement des navigateurs et les outils de recherche.
  • Interface interactive Chainlit intégrée permettant à l'utilisateur de saisir des requêtes et de visualiser les résultats.
  • Améliorez les performances et réduisez les coûts en utilisant le cache NormalizingCache de la base de données SQLite.

 

Utiliser l'aide

Processus d'installation

CleverBee est facile à installer, avec des instructions détaillées disponibles via un dépôt GitHub. Voici les étapes à suivre :

  1. entrepôt de clones
    Ouvrez un terminal et exécutez la commande suivante pour cloner le dépôt CleverBee :

    git clone https://github.com/SureScaleAI/cleverbee.git
    cd cleverbee
  1. Exécuter le script d'installation
    Exécutez le script d'installation pour configurer l'environnement :

    bash setup.sh
    

    Le script automatise les tâches suivantes :

    • Vérifier les dépendances nécessaires (par ex. python3,jq,yq répondre en chantant cmake).
    • Créer un environnement virtuel Python (venv/).
    • montage requirements.txt Les dépendances Python dans le fichier
    • Détecte le matériel et demande si le modèle local est activé (GPU NVIDIA recommandé avec ≥ 24 Go de mémoire vidéo).
    • Si un modèle local est sélectionné, l'installation llama-cpp-python et activer l'accélération CUDA (pour les GPU NVIDIA).
    • Invite l'utilisateur à se connecter au Visage câlin (en cas d'utilisation d'un modèle local).
    • Aidez à configurer le modèle d'inférence principal et le modèle récapitulatif, mettez à jour le fichier config.yaml.
    • Télécharger les modèles locaux GGUF sélectionnés (le cas échéant).
  2. Configuration des clés API
    Si vous utilisez un modèle en nuage tel que Gemini ou Claude, une clé API est nécessaire. Le script d'installation vérifie la sélection du modèle et demande à l'utilisateur d'ajouter la clé au fichier .env Documentation :

    • Clé API Anthropic: A partir de Anthropique Acquisition de la console pour Claude Modèles.
    • Clé API Google Gemini: A partir de Google AI Studio Obtenir, pour les modèles Gemini.
      Après l'ajout de la clé, l'application doit être redémarrée pour prendre effet. Les utilisateurs peuvent modifier la .env Clé de mise à jour des fichiers.
  3. lancer une application
    Une fois l'installation terminée, lancez la commande suivante pour démarrer CleverBee :

    bash run.sh
    

    Cela lancera l'interface interactive Chainlit, à laquelle l'utilisateur peut accéder par l'intermédiaire d'un navigateur.

exigences du système

  • système d'exploitationPrise en charge de macOS (Intel et Apple Silicon, nécessite Rosetta 2) et de Linux.
  • logicielLes modèles en nuage ne nécessitent pas de matériel très performant ; les GPU NVIDIA (mémoire graphique ≥ 24 Go) sont recommandés pour les modèles locaux.
  • dépendances: S'assurer que l'installation python3,git,jq,cmake répondre en chantant nodeLes utilisateurs de macOS peuvent l'installer via Homebrew :
    brew install python cmake git jq node
    

Utilisation

La fonction principale de CleverBee est de générer des rapports de recherche avec des citations. La procédure détaillée est décrite ci-dessous :

  1. Interface de lancement
    être en mouvement run.sh Le navigateur ouvre alors l'interface Chainlit. L'utilisateur peut y saisir une question ou un sujet de recherche, tel que "Les progrès récents de l'informatique quantique" ou "L'impact économique de l'énergie durable".
  2. Saisir une requête
    En saisissant une question dans le champ de saisie de l'interface, CleverBee trace automatiquement un chemin de recherche, en faisant appel à des outils de navigation sur le web, à l'extraction de sous-titres sur YouTube ou à des modules de recherche académique pour recueillir des informations. Les utilisateurs peuvent visualiser l'avancement de leur recherche en temps réel.
  3. Voir le rapport
    A l'issue de l'étude, CleverBee génère un rapport contenant les éléments suivants :

    • Synthèse et résumé : tirer des conclusions succinctes sur la base des informations recueillies.
    • Citations des sources : liste des liens ou des sources pour toutes les références.
    • Note sur les limitations : décrit les limitations possibles de l'IA et rappelle aux utilisateurs de vérifier la source.
    • Utilisation des jetons : indique la consommation de ressources lors des appels au modèle.
  4. Configuration personnalisée
    Modifiable par l'utilisateur config.yaml Le fichier permet d'ajuster les paramètres, par exemple :

    • Modifier le modèle d'inférence principal (Gemini 2.5 Pro recommandé).
    • Réglage du comportement du proxy (par exemple, profondeur de navigation sur le web).
    • Ajustez les limites de jetons ou les politiques de mise en cache.
      La documentation relative à la configuration se trouve dans la section https://cleverb.ee/docs.
  5. Fonction en vedette Fonctionnement
    • Extraction des sous-titres de YouTubeCleverBee extrait automatiquement les sous-titres et les intègre dans le rapport, ce qui permet d'analyser des conférences ou des entretiens.
    • Analyse du PDFCleverBee extrait le texte et en résume les éléments clés, ce qui convient aux travaux universitaires ou aux rapports.
    • Recherche PubMedCleverBee recherche dans la base de données PubMed la littérature qui fait autorité en la matière.
    • Suivi des coûts en temps réelL'interface affiche la consommation de jetons par requête afin d'aider les utilisateurs à optimiser leur budget.

mise en garde

  • Les modèles locaux ont des exigences matérielles élevées et les modèles en nuage sont recommandés pour des performances optimales.
  • Vérifiez toujours les sources du rapport, l'IA peut avoir des hallucinations.
  • Le projet est destiné à un usage non commercial et suit la licence GNU Affero.

 

scénario d'application

  1. recherche universitaire
    Les étudiants ou les chercheurs peuvent utiliser CleverBee pour collecter rapidement des documents universitaires, des articles en ligne et des vidéos afin de produire une revue de la littérature entièrement citée. Par exemple, lors d'une recherche sur "l'éthique de l'intelligence artificielle", CleverBee peut extraire la littérature pertinente de PubMed et de sites web universitaires.
  2. Analyse de l'activité
    Les utilisateurs professionnels peuvent analyser les tendances du marché ou les informations sur les concurrents. Par exemple, si vous entrez "Prévisions du marché des véhicules électriques pour 2025", CleverBee parcourt les rapports et les actualités du secteur pour générer un résumé basé sur des données.
  3. Apprentissage personnel
    Pour les utilisateurs occasionnels qui explorent des sujets complexes tels que "Applications de la technologie Blockchain", CleverBee offre de multiples perspectives, y compris des tutoriels YouTube et des articles faisant autorité, pour aider les utilisateurs à acquérir une compréhension globale.

 

QA

  1. Quels sont les modèles pris en charge par CleverBee ?
    Prise en charge des modèles Gemini, Claude et GGUF natifs (par ex. Deepseek (R1, Llama). Les modèles en nuage sont plus stables en termes de performances et les modèles locaux sont adaptés aux exigences en matière de respect de la vie privée.
  2. Comment réduire les coûts de fonctionnement ?
    Réduisez les requêtes en double grâce à la mise en cache NormalisingCache. Choisissez un modèle peu coûteux tel que Gemini 2.5 Flash et surveillez l'utilisation des jetons via l'interface.
  3. Le rapport est-il fiable ?
    Les rapports sont basés sur des sources authentiques et des citations sont fournies, mais l'IA peut avoir des hallucinations. Il est conseillé aux utilisateurs de vérifier les informations clés.
  4. Une expérience en programmation est-elle nécessaire ?
    Aucune expérience en programmation n'est requise. Les scripts d'installation automatisent la configuration et l'interface Chainlit est facile à utiliser.
© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...