Allgemeine Einführung
AI-Scientist-v2 ist ein intelligentes System, das von dem japanischen Unternehmen SakanaAI entwickelt wurde und darauf abzielt, die wissenschaftliche Forschung von Anfang bis Ende durch Maschinen zu automatisieren. Es ist in der Lage, Forschungsideen zu entwickeln, Experimente zu planen, Code auszuführen, Daten zu analysieren und schließlich wissenschaftliche Arbeiten zu verfassen. Im April 2025 wurde das Tool als Open Source auf GitHub veröffentlicht und um eine erste Version erweitert, die die Agentic Tree Search-Technologie hinzufügte, um die Erforschung intelligenter zu machen. Das erste Papier, das vollständig von KI erstellt wurde, wurde auf dem ICLR 2025-Workshop einem Peer-Review unterzogen.AI-Scientist-v2 ist nicht auf menschliche Vorlagen angewiesen und lässt sich auf eine Vielzahl von Bereichen des maschinellen Lernens anwenden, so dass es sich für Forscher und Entwickler eignet.
Funktionsliste
- Präsentation von ForschungsideenAutomatische Generierung realisierbarer Forschungsideen auf der Grundlage von Eingaberichtungen.
- Experimentellen Code schreibenGenerierung des für die Durchführung von Experimenten erforderlichen Codes, Unterstützung bei der Abstimmung und Optimierung.
- Durchführung von Experimenten und AnalysenAutomatisches Ausführen von Code, Sammeln von Daten und Erstellen von Diagrammen.
- Verfassen wissenschaftlicher ArbeitenAusgabe eines gut formatierten Papiers mit den Ergebnissen des Experiments.
- Intelligente Trassenoptimierung: Erkunden Sie die besten Recherchemöglichkeiten mit der Agentic Tree Search.
- Unterstützung bei der LiteratursucheOptionaler Zugriff auf die Semantic Scholar-API, um auf Neuheit zu prüfen und Zitate hinzuzufügen.
- offene QuelleDer vollständige Code wird zur Verfügung gestellt und kann von den Benutzern geändert und erweitert werden.
Hilfe verwenden
AI-Scientist-v2 erfordert ein gewisses Maß an technischem Wissen, aber wenn es konfiguriert ist, kann es die wissenschaftliche Forschung drastisch vereinfachen. Nachfolgend finden Sie detaillierte Schritte, die den Benutzern einen schnellen Einstieg ermöglichen.
Einbauverfahren
- Vorbereiten der Umgebung
- Erfordert Linux und einen NVIDIA-Grafikprozessor mit CUDA- und PyTorch-Unterstützung.
- Erstellen Sie eine Python 3.11-Umgebung:
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- Installieren Sie PyTorch und CUDA:
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- Installation von Abhängigkeiten
- Code herunterladen:
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- Installieren Sie zusätzliche Werkzeuge:
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- Code herunterladen:
- Konfigurieren der API
- Legen Sie den Big Model API-Schlüssel fest (z. B. OpenAI):
export OPENAI_API_KEY='你的密钥'
- Wenn Sie Claude Modell, die Installation einer zusätzlichen Stütze:
pip install anthropic[bedrock]
Richten Sie AWS-Schlüssel und Regionen ein:
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- Optional können Sie die Semantic Scholar API konfigurieren:
export S2_API_KEY='你的密钥'
- Legen Sie den Big Model API-Schlüssel fest (z. B. OpenAI):
- Testumgebung
- Prüfen Sie, ob die GPU verfügbar ist:
python -c "import torch; print(torch.cuda.is_available())"
- Ausfuhren
True
Zeigt die erfolgreiche Installation an.
- Prüfen Sie, ob die GPU verfügbar ist:
Verwendung der wichtigsten Funktionen
1. die Entwicklung von Forschungsideen
- Wechseln Sie in das Code-Verzeichnis und führen Sie es aus:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- Das System erzeugt eine JSON-Datei, die den Titel und die Beschreibung der Studie enthält.
2. laufende Experimente
- Nachdem die Idee generiert wurde, erstellt das System den Experimentiercode (z. B.
experiment.py
). - Experimente durchführen:
python experiment.py
- Die Ergebnisse werden in der Datei
experiments
Ordner im Protokoll, einschließlich Daten und Grafiken.
3. das Schreiben von Papieren
- Sobald das Experiment abgeschlossen ist, erstellen Sie ein Papier:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- Gibt LaTeX-Dateien aus, die im Verzeichnis
experiments/timestamp_ideaname/latex
Ordner. Kompilieren Sie mit dem LaTeX-Editor, um es anzuzeigen.
4. die Agentische Baumsuche verwenden
- Dies ist ein zentrales Merkmal von v2, das die Studienwege optimiert.
- Parameter zur Laufzeit hinzufügen:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- Erzeugung von
unified_tree_viz.html
Wenn Sie einen Browser haben, können Sie ihn öffnen, um den Suchvorgang zu sehen.
5. die Suchparameter des Konfigurationsbaums
- Compiler
bfts_config.yaml
Dokumentation: num_workers
Anzahl der Knoten für die Parallelverarbeitung, z. B. 3.steps
Maximale Anzahl der zu untersuchenden Knoten, z.B. 21.num_drafts
Anzahl der ersten Forschungsrichtungen.max_debug_depth
Anzahl der Debugging-Versuche.
caveat
- SicherheitDer Code führt von KI geschriebene Programme aus, kann gefährliche Pakete aufrufen oder vernetzt sein, und es wird empfohlen, ihn mit Docker auszuführen.
- (Herstellungs-, Produktions- usw.) KostenUngefähr $15-$20 pro Experiment, plus $5 für das Verfassen der Arbeit.
- Erfolgsquotev2 ist in hohem Maße explorativ, hat eine geringere Erfolgsquote als v1 und ist für die offene Forschung geeignet.
- Probleme mit dem GedächtnisWenn die Meldung "CUDA Out of Memory" erscheint, ändern Sie das kleine Modell in der JSON-Datei.
Diese Schritte geben Ihnen einen vollständigen Einblick in die Möglichkeiten der Forschungsautomatisierung von AI-Scientist-v2.
Anwendungsszenario
- akademische Forschung
Forscher nutzen es, um neue Algorithmen zu validieren, erste Entwürfe von Arbeiten zu erstellen und Zeit zu sparen. - Pädagogisches Lernen
Die Schüler simulieren damit wissenschaftliche Forschung, erstellen Berichte und lernen etwas über Versuchsplanung. - technologische Innovation
Entwickler nutzen es, um neue Ideen zu testen und schnell Code-Prototypen zu erstellen.
QA
- Welche Modelle werden unterstützt?
Unterstützung für Claude 3.5 Sonnet, GPT-4o, o1-preview, usw., siehellm.py
Dokumentation. - Wie viel hat das Experiment gekostet?
Bei Claude 3.5 sind es etwa $15-$20 pro Sitzung, plus $5 für das Schreiben. - Was soll ich tun, wenn ich keine These erstellen kann?
Die Erfolgsquote variiert je nach Modell und Komplexität der Idee, und die Parameter können angepasst oder mit einem anderen Modell erneut versucht werden. - Wie kann ich eine neue Forschungsrichtung hinzufügen?
existierenai_scientist/ideas/
Fügen Sie eine neue JSON-Datei in das Verzeichnis ein und ändern Sie sie mit Bezug auf das Beispiel.