AI-Scientist-v2 : Recherche scientifique autonome et rédaction d'articles

Dernières ressources sur l'IAPosté il y a 5 mois Cercle de partage de l'IA

22.4K 00

Introduction générale

AI-Scientist-v2 est un système intelligent développé par l'entreprise japonaise SakanaAI qui vise à automatiser la recherche scientifique du début à la fin par des machines. Il peut proposer des idées de recherche, concevoir des expériences, exécuter du code, analyser des données et enfin rédiger des articles scientifiques. En avril 2025, l'outil a été mis en open source sur GitHub, mis à jour avec une première version qui a ajouté la technologie Agentic Tree Search pour rendre l'exploration plus intelligente. AI-Scientist-v2 ne s'appuie pas sur des modèles humains et s'applique à un large éventail de domaines d'apprentissage automatique, ce qui le rend adapté aux chercheurs et aux développeurs.

Liste des fonctions

Présentation des idées de rechercheLes outils de recherche : générer automatiquement des idées de recherche réalisables sur la base des orientations données.
Rédiger un code expérimentalLes activités de recherche et de développement : Générer le code nécessaire à l'exécution des expériences, à la mise au point et à l'optimisation.
Réalisation d'expériences et d'analysesLe système d'information sur la santé : Il exécute automatiquement le code, recueille les données et génère des graphiques.
Rédaction d'articles scientifiquesLes résultats de l'expérience sont présentés sous forme d'un document bien formaté.
Optimisation intelligente des trajetsRecherche de l'arbre Agentic : Explorez les meilleures options de recherche grâce à la recherche de l'arbre Agentic.
Soutien à la recherche documentaireAccès facultatif à l'API de Semantic Scholar pour vérifier la nouveauté et ajouter des citations.
source ouverteLe code complet est fourni, et les utilisateurs sont libres de le modifier et de l'étendre.

Utiliser l'aide

AI-Scientist-v2 nécessite un certain nombre de connaissances techniques, mais une fois configuré, il peut simplifier considérablement la recherche scientifique. Vous trouverez ci-dessous des étapes détaillées pour aider les utilisateurs à démarrer rapidement.

Processus d'installation

Préparation de l'environnement
- Nécessite Linux et un GPU NVIDIA prenant en charge CUDA et PyTorch.
- Créer un environnement Python 3.11 :
```
conda create -n ai_scientist python=3.11
conda activate ai_scientist
```
- Installer PyTorch et CUDA :
```
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
```

Installation des dépendances

Code de téléchargement :

git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2

Installer des outils supplémentaires :

conda install anaconda::poppler  # 处理 PDF
conda install conda-forge::chktex  # 检查论文格式
pip install -r requirements.txt

Configuration de l'API
- Définissez la clé API du Big Model (par exemple, OpenAI) :
```
export OPENAI_API_KEY='你的密钥'
```
- Si vous utilisez Claude en installant un support supplémentaire :
```
pip install anthropic[bedrock]
```
  Configurer les clés et les régions AWS :
```
export AWS_ACCESS_KEY_ID='你的ID'
export AWS_SECRET_ACCESS_KEY='你的密钥'
export AWS_REGION_NAME='us-west-2'
```
- Configurer éventuellement l'API Semantic Scholar :
```
export S2_API_KEY='你的密钥'
```
environnement de test
- Vérifier si le GPU est disponible :
```
python -c "import torch; print(torch.cuda.is_available())"
```
- exportations True Indique que l'installation a réussi.

Comment utiliser les principales fonctionnalités

1. générer des idées de recherche

Allez dans le répertoire du code et exécutez :

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"

Le système génère un fichier JSON contenant le titre et la description de l'étude.

2) Expériences en cours

Une fois l'idée générée, le système crée le code de l'expérience (par ex. experiment.py).
Réaliser des expériences :

python experiment.py

Les résultats sont enregistrés dans le fichier experiments dans le journal, y compris les données et les graphiques.

3. la rédaction de documents

Une fois l'expérience terminée, rédigez un article :

python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"

Produit des fichiers LaTeX, qui sont stockés dans le fichier experiments/timestamp_ideaname/latex dossier. Compilez avec l'éditeur LaTeX pour le visualiser.

4. utilisation de la recherche arborescente agentique

Il s'agit d'une fonctionnalité essentielle de la v2 qui permet d'optimiser les parcours d'études.
Ajouter des paramètres au moment de l'exécution :

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search

générant unified_tree_viz.htmlSi vous disposez d'un navigateur, vous pouvez l'ouvrir pour visualiser le processus de recherche.

5. paramètres de recherche de l'arbre de configuration

compilateur bfts_config.yaml Documentation :
num_workersNombre de nœuds pour le traitement parallèle, par exemple 3.
stepsNombre maximal de nœuds à explorer, par exemple 21.
num_draftsNombre d'orientations de recherche initiales.
max_debug_depthNombre de tentatives de débogage.

mise en garde

la sécuritéLe code exécute des programmes écrits par l'IA, peut appeler des paquets dangereux ou être mis en réseau, et il est recommandé de l'exécuter avec Docker.
les coûts (de fabrication, de production, etc.)Coût : Environ 15 à 20 dollars par expérience, plus 5 dollars pour la rédaction de la thèse.
taux de réussiteLa v2 est très exploratoire, a un taux de réussite plus faible que la v1 et convient à la recherche ouverte.
Problèmes de mémoireSi le message "CUDA Out of Memory" s'affiche, modifiez le petit modèle dans le fichier JSON.

Ces étapes vous permettent d'acquérir une expérience complète des capacités d'automatisation de la recherche d'AI-Scientist-v2.

scénario d'application

recherche universitaire
Les chercheurs l'utilisent pour valider de nouveaux algorithmes, générer des premières ébauches d'articles et gagner du temps.
Apprentissage éducatif
Les élèves l'utilisent pour simuler des recherches scientifiques, produire des rapports et apprendre la conception expérimentale.
l'innovation technologique
Les développeurs l'utilisent pour tester de nouvelles idées et générer rapidement des prototypes de code.

QA

Quels sont les modèles pris en charge ?
Prise en charge de Claude 3.5 Sonnet, GPT-4o, o1-preview, etc. llm.py Documentation.
Combien l'expérience a-t-elle coûté ?
Avec Claude 3.5, c'est environ 15 à 20 dollars par session, plus 5 dollars pour l'écriture.
Que dois-je faire si je ne parviens pas à produire une thèse ?
Le taux de réussite varie en fonction du modèle et de la complexité de l'idée, et les paramètres peuvent être ajustés ou réessayés avec un modèle différent.
Comment ajouter une nouvelle direction de recherche ?
existent ai_scientist/ideas/ Ajoutez un nouveau fichier JSON dans le répertoire et modifiez-le en vous référant à l'exemple.