AI Personal Learning
und praktische Anleitung
Sitzsack Marscode1

AI-Scientist-v2: Autonome wissenschaftliche Forschung und Verfassen von Arbeiten

Allgemeine Einführung

AI-Scientist-v2 ist ein intelligentes System, das von dem japanischen Unternehmen SakanaAI entwickelt wurde und darauf abzielt, die wissenschaftliche Forschung von Anfang bis Ende durch Maschinen zu automatisieren. Es ist in der Lage, Forschungsideen zu entwickeln, Experimente zu planen, Code auszuführen, Daten zu analysieren und schließlich wissenschaftliche Arbeiten zu verfassen. Im April 2025 wurde das Tool als Open Source auf GitHub veröffentlicht und um eine erste Version erweitert, die die Agentic Tree Search-Technologie hinzufügte, um die Erforschung intelligenter zu machen. Das erste Papier, das vollständig von KI erstellt wurde, wurde auf dem ICLR 2025-Workshop einem Peer-Review unterzogen.AI-Scientist-v2 ist nicht auf menschliche Vorlagen angewiesen und lässt sich auf eine Vielzahl von Bereichen des maschinellen Lernens anwenden, so dass es sich für Forscher und Entwickler eignet.

AI-Scientist-v2: Autonome Durchführung wissenschaftlicher Forschung und Verfassen von Abschlussarbeiten-1


 

Funktionsliste

  • Präsentation von ForschungsideenAutomatische Generierung realisierbarer Forschungsideen auf der Grundlage von Eingaberichtungen.
  • Experimentellen Code schreibenGenerierung des für die Durchführung von Experimenten erforderlichen Codes, Unterstützung bei der Abstimmung und Optimierung.
  • Durchführung von Experimenten und AnalysenAutomatisches Ausführen von Code, Sammeln von Daten und Erstellen von Diagrammen.
  • Verfassen wissenschaftlicher ArbeitenAusgabe eines gut formatierten Papiers mit den Ergebnissen des Experiments.
  • Intelligente Trassenoptimierung: Erkunden Sie die besten Recherchemöglichkeiten mit der Agentic Tree Search.
  • Unterstützung bei der LiteratursucheOptionaler Zugriff auf die Semantic Scholar-API, um auf Neuheit zu prüfen und Zitate hinzuzufügen.
  • offene QuelleDer vollständige Code wird zur Verfügung gestellt und kann von den Benutzern geändert und erweitert werden.

 

Hilfe verwenden

AI-Scientist-v2 erfordert ein gewisses Maß an technischem Wissen, aber wenn es konfiguriert ist, kann es die wissenschaftliche Forschung drastisch vereinfachen. Nachfolgend finden Sie detaillierte Schritte, die den Benutzern einen schnellen Einstieg ermöglichen.

Einbauverfahren

  1. Vorbereiten der Umgebung
    • Erfordert Linux und einen NVIDIA-Grafikprozessor mit CUDA- und PyTorch-Unterstützung.
    • Erstellen Sie eine Python 3.11-Umgebung:
      conda create -n ai_scientist python=3.11
      conda activate ai_scientist
      
    • Installieren Sie PyTorch und CUDA:
      conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
      
  2. Installation von Abhängigkeiten
    • Code herunterladen:
      git clone https://github.com/SakanaAI/AI-Scientist-v2.git
      cd AI-Scientist-v2
      
    • Installieren Sie zusätzliche Werkzeuge:
      conda install anaconda::poppler  # 处理 PDF
      conda install conda-forge::chktex  # 检查论文格式
      pip install -r requirements.txt
      
  3. Konfigurieren der API
    • Legen Sie den Big Model API-Schlüssel fest (z. B. OpenAI):
      export OPENAI_API_KEY='你的密钥'
      
    • Wenn Sie Claude Modell, die Installation einer zusätzlichen Stütze:
      pip install anthropic[bedrock]
      

      Richten Sie AWS-Schlüssel und Regionen ein:

      export AWS_ACCESS_KEY_ID='你的ID'
      export AWS_SECRET_ACCESS_KEY='你的密钥'
      export AWS_REGION_NAME='us-west-2'
      
    • Optional können Sie die Semantic Scholar API konfigurieren:
      export S2_API_KEY='你的密钥'
      
  4. Testumgebung
    • Prüfen Sie, ob die GPU verfügbar ist:
      python -c "import torch; print(torch.cuda.is_available())"
      
    • Ausfuhren True Zeigt die erfolgreiche Installation an.

Verwendung der wichtigsten Funktionen

1. die Entwicklung von Forschungsideen

  • Wechseln Sie in das Code-Verzeichnis und führen Sie es aus:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
  • Das System erzeugt eine JSON-Datei, die den Titel und die Beschreibung der Studie enthält.

2. laufende Experimente

  • Nachdem die Idee generiert wurde, erstellt das System den Experimentiercode (z. B. experiment.py).
  • Experimente durchführen:
python experiment.py
  • Die Ergebnisse werden in der Datei experiments Ordner im Protokoll, einschließlich Daten und Grafiken.

3. das Schreiben von Papieren

  • Sobald das Experiment abgeschlossen ist, erstellen Sie ein Papier:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
  • Gibt LaTeX-Dateien aus, die im Verzeichnis experiments/timestamp_ideaname/latex Ordner. Kompilieren Sie mit dem LaTeX-Editor, um es anzuzeigen.

4. die Agentische Baumsuche verwenden

  • Dies ist ein zentrales Merkmal von v2, das die Studienwege optimiert.
  • Parameter zur Laufzeit hinzufügen:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
  • Erzeugung von unified_tree_viz.htmlWenn Sie einen Browser haben, können Sie ihn öffnen, um den Suchvorgang zu sehen.

5. die Suchparameter des Konfigurationsbaums

  • Compiler bfts_config.yaml Dokumentation:
  • num_workersAnzahl der Knoten für die Parallelverarbeitung, z. B. 3.
  • stepsMaximale Anzahl der zu untersuchenden Knoten, z.B. 21.
  • num_draftsAnzahl der ersten Forschungsrichtungen.
  • max_debug_depthAnzahl der Debugging-Versuche.

caveat

  • SicherheitDer Code führt von KI geschriebene Programme aus, kann gefährliche Pakete aufrufen oder vernetzt sein, und es wird empfohlen, ihn mit Docker auszuführen.
  • (Herstellungs-, Produktions- usw.) KostenUngefähr $15-$20 pro Experiment, plus $5 für das Verfassen der Arbeit.
  • Erfolgsquotev2 ist in hohem Maße explorativ, hat eine geringere Erfolgsquote als v1 und ist für die offene Forschung geeignet.
  • Probleme mit dem GedächtnisWenn die Meldung "CUDA Out of Memory" erscheint, ändern Sie das kleine Modell in der JSON-Datei.

Diese Schritte geben Ihnen einen vollständigen Einblick in die Möglichkeiten der Forschungsautomatisierung von AI-Scientist-v2.

 

Anwendungsszenario

  1. akademische Forschung
    Forscher nutzen es, um neue Algorithmen zu validieren, erste Entwürfe von Arbeiten zu erstellen und Zeit zu sparen.
  2. Pädagogisches Lernen
    Die Schüler simulieren damit wissenschaftliche Forschung, erstellen Berichte und lernen etwas über Versuchsplanung.
  3. technologische Innovation
    Entwickler nutzen es, um neue Ideen zu testen und schnell Code-Prototypen zu erstellen.

 

QA

  1. Welche Modelle werden unterstützt?
    Unterstützung für Claude 3.5 Sonnet, GPT-4o, o1-preview, usw., siehe llm.py Dokumentation.
  2. Wie viel hat das Experiment gekostet?
    Bei Claude 3.5 sind es etwa $15-$20 pro Sitzung, plus $5 für das Schreiben.
  3. Was soll ich tun, wenn ich keine These erstellen kann?
    Die Erfolgsquote variiert je nach Modell und Komplexität der Idee, und die Parameter können angepasst oder mit einem anderen Modell erneut versucht werden.
  4. Wie kann ich eine neue Forschungsrichtung hinzufügen?
    existieren ai_scientist/ideas/ Fügen Sie eine neue JSON-Datei in das Verzeichnis ein und ändern Sie sie mit Bezug auf das Beispiel.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " AI-Scientist-v2: Autonome wissenschaftliche Forschung und Verfassen von Arbeiten
de_DEDeutsch