AI-Scientist-v2 : Recherche scientifique autonome et rédaction d'articles
Introduction générale
AI-Scientist-v2 est un système intelligent développé par l'entreprise japonaise SakanaAI qui vise à automatiser la recherche scientifique du début à la fin par des machines. Il peut proposer des idées de recherche, concevoir des expériences, exécuter du code, analyser des données et enfin rédiger des articles scientifiques. En avril 2025, l'outil a été mis en open source sur GitHub, mis à jour avec une première version qui a ajouté la technologie Agentic Tree Search pour rendre l'exploration plus intelligente. AI-Scientist-v2 ne s'appuie pas sur des modèles humains et s'applique à un large éventail de domaines d'apprentissage automatique, ce qui le rend adapté aux chercheurs et aux développeurs.

Liste des fonctions
- Présentation des idées de rechercheLes outils de recherche : générer automatiquement des idées de recherche réalisables sur la base des orientations données.
- Rédiger un code expérimentalLes activités de recherche et de développement : Générer le code nécessaire à l'exécution des expériences, à la mise au point et à l'optimisation.
- Réalisation d'expériences et d'analysesLe système d'information sur la santé : Il exécute automatiquement le code, recueille les données et génère des graphiques.
- Rédaction d'articles scientifiquesLes résultats de l'expérience sont présentés sous forme d'un document bien formaté.
- Optimisation intelligente des trajetsRecherche de l'arbre Agentic : Explorez les meilleures options de recherche grâce à la recherche de l'arbre Agentic.
- Soutien à la recherche documentaireAccès facultatif à l'API de Semantic Scholar pour vérifier la nouveauté et ajouter des citations.
- source ouverteLe code complet est fourni, et les utilisateurs sont libres de le modifier et de l'étendre.
Utiliser l'aide
AI-Scientist-v2 nécessite un certain nombre de connaissances techniques, mais une fois configuré, il peut simplifier considérablement la recherche scientifique. Vous trouverez ci-dessous des étapes détaillées pour aider les utilisateurs à démarrer rapidement.
Processus d'installation
- Préparation de l'environnement
- Nécessite Linux et un GPU NVIDIA prenant en charge CUDA et PyTorch.
- Créer un environnement Python 3.11 :
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- Installer PyTorch et CUDA :
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- Installation des dépendances
- Code de téléchargement :
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- Installer des outils supplémentaires :
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- Code de téléchargement :
- Configuration de l'API
- Définissez la clé API du Big Model (par exemple, OpenAI) :
export OPENAI_API_KEY='你的密钥'
- Si vous utilisez Claude en installant un support supplémentaire :
pip install anthropic[bedrock]
Configurer les clés et les régions AWS :
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- Configurer éventuellement l'API Semantic Scholar :
export S2_API_KEY='你的密钥'
- Définissez la clé API du Big Model (par exemple, OpenAI) :
- environnement de test
- Vérifier si le GPU est disponible :
python -c "import torch; print(torch.cuda.is_available())"
- exportations
True
Indique que l'installation a réussi.
- Vérifier si le GPU est disponible :
Comment utiliser les principales fonctionnalités
1. générer des idées de recherche
- Allez dans le répertoire du code et exécutez :
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- Le système génère un fichier JSON contenant le titre et la description de l'étude.
2) Expériences en cours
- Une fois l'idée générée, le système crée le code de l'expérience (par ex.
experiment.py
). - Réaliser des expériences :
python experiment.py
- Les résultats sont enregistrés dans le fichier
experiments
dans le journal, y compris les données et les graphiques.
3. la rédaction de documents
- Une fois l'expérience terminée, rédigez un article :
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- Produit des fichiers LaTeX, qui sont stockés dans le fichier
experiments/timestamp_ideaname/latex
dossier. Compilez avec l'éditeur LaTeX pour le visualiser.
4. utilisation de la recherche arborescente agentique
- Il s'agit d'une fonctionnalité essentielle de la v2 qui permet d'optimiser les parcours d'études.
- Ajouter des paramètres au moment de l'exécution :
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- générant
unified_tree_viz.html
Si vous disposez d'un navigateur, vous pouvez l'ouvrir pour visualiser le processus de recherche.
5. paramètres de recherche de l'arbre de configuration
- compilateur
bfts_config.yaml
Documentation : num_workers
Nombre de nœuds pour le traitement parallèle, par exemple 3.steps
Nombre maximal de nœuds à explorer, par exemple 21.num_drafts
Nombre d'orientations de recherche initiales.max_debug_depth
Nombre de tentatives de débogage.
mise en garde
- la sécuritéLe code exécute des programmes écrits par l'IA, peut appeler des paquets dangereux ou être mis en réseau, et il est recommandé de l'exécuter avec Docker.
- les coûts (de fabrication, de production, etc.)Coût : Environ 15 à 20 dollars par expérience, plus 5 dollars pour la rédaction de la thèse.
- taux de réussiteLa v2 est très exploratoire, a un taux de réussite plus faible que la v1 et convient à la recherche ouverte.
- Problèmes de mémoireSi le message "CUDA Out of Memory" s'affiche, modifiez le petit modèle dans le fichier JSON.
Ces étapes vous permettent d'acquérir une expérience complète des capacités d'automatisation de la recherche d'AI-Scientist-v2.
scénario d'application
- recherche universitaire
Les chercheurs l'utilisent pour valider de nouveaux algorithmes, générer des premières ébauches d'articles et gagner du temps. - Apprentissage éducatif
Les élèves l'utilisent pour simuler des recherches scientifiques, produire des rapports et apprendre la conception expérimentale. - l'innovation technologique
Les développeurs l'utilisent pour tester de nouvelles idées et générer rapidement des prototypes de code.
QA
- Quels sont les modèles pris en charge ?
Prise en charge de Claude 3.5 Sonnet, GPT-4o, o1-preview, etc.llm.py
Documentation. - Combien l'expérience a-t-elle coûté ?
Avec Claude 3.5, c'est environ 15 à 20 dollars par session, plus 5 dollars pour l'écriture. - Que dois-je faire si je ne parviens pas à produire une thèse ?
Le taux de réussite varie en fonction du modèle et de la complexité de l'idée, et les paramètres peuvent être ajustés ou réessayés avec un modèle différent. - Comment ajouter une nouvelle direction de recherche ?
existentai_scientist/ideas/
Ajoutez un nouveau fichier JSON dans le répertoire et modifiez-le en vous référant à l'exemple.
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...