Together Open Deep Research : Générer des rapports de recherche approfondie indexés

Introduction générale

Open Deep Research est un programme de Ensemble Un outil de recherche approfondie développé et mis à disposition par l'équipe AI, hébergé sur GitHub. Il génère des rapports de recherche détaillés grâce à un flux de travail d'IA multi-agents qui imite le processus de recherche humain. Les utilisateurs entrent simplement un sujet de recherche et l'outil planifie, recherche, évalue automatiquement les informations et rédige un rapport avec des citations. Le projet prend en charge Python 3.12+ et nécessite la configuration de clés API pour utiliser des services externes de recherche et de modélisation linguistique. Il convient à la recherche universitaire, à l'analyse de marché et à d'autres scénarios. L'accent étant mis sur l'open source et l'extension communautaire, tout le monde peut obtenir le code gratuitement et le personnaliser en fonction de ses besoins.

Together Open Deep Research:生成带索引的深度研究报告

 

Liste des fonctions

  • Réalisation d'une étude approfondieLe logiciel de recherche : Il génère automatiquement de longs rapports de recherche contenant des citations sur la base des sujets saisis par l'utilisateur.
  • Collecte d'informations en plusieurs étapesLes objectifs du programme sont les suivants : assurer la qualité de l'information par les étapes de la planification, de la recherche et de l'auto-réflexion.
  • vérification des informations provenant de sources multiplesSupport pour les recherches sur le web via des API telles que Tavily, HuggingFace, etc., avec des citations de sources.
  • Conception d'une architecture flexibleLes utilisateurs peuvent personnaliser les modèles, les outils de recherche et la structure des rapports en fonction de leurs besoins.
  • Prise en charge des sorties multimodalesLes contenus supplémentaires tels que les images de couverture, les podcasts, etc. peuvent être créés automatiquement lors de la génération des rapports.
  • Source ouverte et communautéLe code est entièrement ouvert, ce qui permet aux utilisateurs de modifier et d'étendre les fonctionnalités.

 

Utiliser l'aide

Processus d'installation

Pour utiliser Open Deep Research, vous devez configurer l'environnement d'exécution localement ou sur un serveur. Vous trouverez ci-dessous les étapes détaillées de l'installation :

  1. Inspection des exigences environnementales
    Assurez-vous que Python 3.12 ou une version ultérieure est installé. Un environnement virtuel est recommandé pour éviter les conflits de dépendances. Vous devrez également installer uv(un peu plus de pip (Outil de gestion de paquets plus rapide et efficace).

    curl -LsSf https://astral.sh/uv/install.sh | sh
    
  2. Cloner le dépôt de code
    Cloner le code du projet localement à partir de GitHub :

    git clone https://github.com/togethercomputer/open_deep_research.git
    cd open_deep_research
    
  3. Créer et activer un environnement virtuel
    utiliser uv Créer un environnement virtuel et l'activer :

    uv venv --python=3.12
    source .venv/bin/activate
    
  4. Installation des dépendances
    Installez tous les paquets Python nécessaires à votre projet :

    uv pip install -r pyproject.toml
    uv lock --check
    

    Si vous devez exécuter le LangGraph il est possible d'installer des dépendances optionnelles :

    uv pip install -e ".[with-open-deep-research]"
    
  5. Configuration des clés API
    Le projet s'appuie sur des services externes tels que Together AI, Tavily et HuggingFace pour la recherche et l'inférence de modèles de langage. Les variables d'environnement suivantes doivent être définies :

    export TOGETHER_API_KEY=your_together_api_key
    export TAVILY_API_KEY=your_tavily_api_key
    export HUGGINGFACE_TOKEN=your_huggingface_token
    

    commandant en chef (militaire) your_together_api_key etc. sont remplacés par la clé API réelle. Vous pouvez créer un compte et obtenir la clé sur le site officiel du fournisseur de services.

  6. Projets en cours
    Une fois l'installation terminée, exécutez le programme principal pour lancer la tâche de recherche. Par exemple, générer un rapport sur "l'éthique de l'intelligence artificielle" :

    python main.py --topic "人工智能伦理"
    

    Le programme effectue automatiquement la planification, la recherche et la génération de rapports, le résultat étant sauvegardé sous forme de fichier Markdown.

Principales fonctions

La principale caractéristique d'Open Deep Research est la génération automatique de rapports de recherche. La procédure détaillée est décrite ci-dessous :

  1. Entrer un sujet de recherche
    L'utilisateur spécifie le sujet de la recherche via la ligne de commande ou un script. Exemple :

    python main.py --topic "气候变化的影响"
    

    Les sujets doivent être aussi clairs que possible pour que l'outil génère des rapports ciblés.

  2. phase de planification
    L'outil utilise d'abord un modèle linguistique (par ex. Claude ou GPT) pour générer une structure de rapport. L'utilisateur peut choisir d'accepter la structure par défaut ou de fournir manuellement une structure personnalisée. Par exemple, une structure personnalisée pourrait être la suivante

    {
    "title": "气候变化影响研究",
    "sections": ["引言", "环境影响", "经济影响", "社会影响", "结论"]
    }
    

    Enregistré dans un fichier JSON et spécifié sur la ligne de commande :

    python main.py --topic "气候变化的影响" --structure custom_structure.json
    
  3. Recherche et validation de l'information
    L'outil est passé par le Tavily L'API effectue des recherches sur le web pour obtenir du contenu web en rapport avec le sujet. Pour chaque recherche, le système se remet en question, évalue la qualité des informations et pose des questions complémentaires. Par exemple, si la recherche porte sur les "impacts environnementaux du changement climatique", le système peut générer des sous-questions telles que "données spécifiques sur l'élévation du niveau de la mer". Les résultats de la recherche sont automatiquement dédupliqués et les informations clés sont extraites.
  4. Génération de rapports
    Le système organise les informations collectées dans un rapport au format Markdown, comprenant le titre, le chapitre, l'introduction, le corps du texte et les références. Le rapport prend en charge la sortie multilingue, le rapport par défaut est généré en anglais, et l'utilisateur peut configurer le rapport pour générer des versions en chinois ou dans d'autres langues.
  5. Extensions multimodales
    L'outil permet de générer des images de couverture et des podcasts audio pour accompagner le rapport. L'image est créée par un modèle de génération d'images tel que DALL-E et le podcast est généré par un service de synthèse vocale. Ces fonctionnalités nécessitent une configuration supplémentaire de l'API, par exemple :

    export DALLE_API_KEY=your_dalle_api_key
    

    Une fois générés, les fichiers image et audio sont enregistrés dans le répertoire de sortie.

Fonction en vedette Fonctionnement

  • Collaboration multi-agents
    Open Deep Research utilise un flux de travail multi-agents, classé en agent de planification, agent de recherche et agent de rédaction. Les utilisateurs peuvent ajuster le comportement des agents par le biais de fichiers de configuration, par exemple en définissant la profondeur de recherche :

    python main.py --topic "人工智能伦理" --max_search_depth 3
    

    La commande ci-dessus augmente le nombre d'itérations de recherche à 3 pour obtenir des informations plus approfondies.

  • Expansion de la Communauté
    Le projet étant open source, les utilisateurs peuvent modifier le référentiel de code pour ajouter de nouvelles fonctionnalités. Par exemple, intégrer une nouvelle API de recherche (telle que Google Custom Search) ou prendre en charge davantage de modèles linguistiques. Après avoir modifié le code, exécutez à nouveau la commande d'installation pour qu'elle prenne effet.

mise en garde

  • Assurez-vous que les connexions réseau sont stables et que la recherche et l'inférence de modèles reposent sur des API externes.
  • Les clés d'API doivent être stockées correctement pour éviter les fuites.
  • Si vous rencontrez un conflit de dépendance, essayez de mettre à niveau uv ou exécuter le projet à l'aide de Docker.

 

scénario d'application

  1. recherche universitaire
    Les étudiants et les chercheurs peuvent utiliser Open Deep Research pour générer rapidement une analyse documentaire ou un rapport de recherche. Par exemple, tapez "récentes avancées en informatique quantique" et l'outil recherchera des bases de données académiques et des ressources web pour générer un rapport détaillé avec des citations.
  2. analyse du marché
    Les analystes commerciaux peuvent utiliser l'outil pour étudier les tendances du secteur. Par exemple, entrez "Electric Vehicle Market Forecast 2025" et l'outil recueillera des données sur le marché, des nouvelles et des rapports pour générer un document d'analyse structuré.
  3. Éducation et formation
    Les enseignants peuvent préparer du matériel pédagogique pour le cours. Par exemple, tapez "Les bases de la programmation Python" et l'outil générera un syllabus avec des tutoriels, des exemples de code et des ressources.
  4. création de contenu
    Les créateurs de contenu peuvent rapidement accéder à des sources d'inspiration ou à des informations de fond. Par exemple, si vous tapez "l'avenir du métavers", l'outil génère un rapport sur les tendances technologiques et les implications sociales de l'écriture.

 

QA

  1. Quels sont les modèles de langage pris en charge par Open Deep Research ?
    Les modèles de Together AI, OpenAI et HuggingFace sont pris en charge par défaut. Les utilisateurs peuvent ajouter d'autres modèles via des fichiers de configuration, tels que DeepSeek Ou Claude.
  2. Dois-je payer pour l'utiliser ?
    Le projet lui-même est gratuit, mais les services API dépendants (par exemple Tavily, Together AI) exigent le paiement de clés. Les utilisateurs peuvent choisir entre un service alternatif gratuit ou un modèle local.
  3. Comment améliorer la qualité des rapports ?
    Augmenter la profondeur de recherche (--max_search_depth) ou d'utiliser un modèle linguistique plus puissant (par exemple, GPT-4). La fourniture d'une description détaillée du sujet peut également permettre de générer des rapports plus précis.
  4. Peut-il être utilisé hors ligne ?
    Actuellement, une connexion internet est nécessaire pour accéder aux API de recherche et de modèle. À l'avenir, il pourra prendre en charge des modèles locaux fonctionnant complètement hors ligne.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...