AI-Scientist-v2: Investigación científica autónoma y redacción de artículos

Últimos recursos sobre IAPublicado hace 11 meses Círculo de intercambio de inteligencia artificial

81.5K 00

Introducción general

AI-Scientist-v2 es un sistema inteligente desarrollado por la empresa japonesa SakanaAI que pretende automatizar la investigación científica de principio a fin mediante máquinas. En abril de 2025, la herramienta se puso en código abierto en GitHub y se actualizó con una primera versión que añadía la tecnología Agentic Tree Search para hacer más inteligente la exploración. El primer artículo que generó, escrito íntegramente por la IA, ha sido revisado por expertos en el taller ICLR 2025. AI-Scientist-v2 no depende de plantillas humanas y es aplicable a una amplia gama de dominios de aprendizaje automático, lo que la hace adecuada para investigadores y desarrolladores.

Lista de funciones

Presentación de ideas de investigaciónGeneración automática de ideas de investigación viables a partir de las instrucciones de entrada.
Escribir código experimentalGenerar el código necesario para realizar experimentos y apoyar el ajuste y la optimización.
Realización de experimentos y análisisEjecuta automáticamente el código, recopila datos y genera gráficos.
Redacción de artículos científicos: Elabora un documento bien formateado basado en los resultados del experimento.
Optimización inteligente de rutas: Explore las mejores opciones de investigación a través de Agentic Tree Search.
Apoyo a la búsqueda de bibliografíaAcceso opcional a la API de Semantic Scholar para comprobar la novedad y añadir citas.
código abiertoSe proporciona el código completo, y los usuarios son libres de modificarlo y ampliarlo.

Utilizar la ayuda

AI-Scientist-v2 requiere ciertos conocimientos técnicos, pero una vez configurado puede simplificar enormemente la investigación científica. A continuación se detallan los pasos para ayudar a los usuarios a empezar rápidamente.

Proceso de instalación

Preparar el entorno

Requiere Linux y una GPU NVIDIA compatible con CUDA y PyTorch.

Crea un entorno Python 3.11:

conda create -n ai_scientist python=3.11
conda activate ai_scientist

Instala PyTorch y CUDA:

conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

Instalación de dependencias

Descargar código:

git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2

Instalar herramientas adicionales:

conda install anaconda::poppler  # 处理 PDF
conda install conda-forge::chktex  # 检查论文格式
pip install -r requirements.txt

Configuración de la API
- Establezca la clave de la API de Big Model (por ejemplo, OpenAI):
```
export OPENAI_API_KEY='你的密钥'
```
- Si utiliza Claude modelo, instalando un soporte adicional:
```
pip install anthropic[bedrock]
```
  Configurar claves y regiones de AWS:
```
export AWS_ACCESS_KEY_ID='你的ID'
export AWS_SECRET_ACCESS_KEY='你的密钥'
export AWS_REGION_NAME='us-west-2'
```
- Opcionalmente, configure la API de Semantic Scholar:
```
export S2_API_KEY='你的密钥'
```
entorno de prueba
- Comprueba si la GPU está disponible:
```
python -c "import torch; print(torch.cuda.is_available())"
```
- exportaciones True Indica que la instalación se ha realizado correctamente.

Cómo utilizar las principales funciones

1. Generar ideas de investigación

Vaya al directorio de código y ejecútelo:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"

El sistema genera un archivo JSON que contiene el título y la descripción del estudio.

2. Realización de experimentos

Una vez generada la idea, el sistema crea el código del experimento (por ejemplo experiment.py).
Realizar experimentos:

python experiment.py

Los resultados se guardan en el archivo experiments en el registro, incluidos los datos y los gráficos.

3. Redacción de documentos

Una vez finalizado el experimento, elabora un documento:

python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"

Genera archivos LaTeX, que se almacenan en la carpeta experiments/timestamp_ideaname/latex carpeta. Compílelo con el editor LaTeX para visualizarlo.

4. Utilización de la búsqueda automática en árbol

Se trata de una función esencial de la v2 que optimiza las rutas de estudio.
Añadir parámetros en tiempo de ejecución:

python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search

generando unified_tree_viz.htmlSi tiene un navegador, puede abrirlo para ver el proceso de búsqueda.

5. Parámetros de búsqueda en el árbol de configuración

compilador bfts_config.yaml Documentación:
num_workersNúmero de nodos para el procesamiento paralelo, por ejemplo 3.
stepsNúmero máximo de nodos a explorar, por ejemplo 21.
num_draftsNúmero de líneas de investigación iniciales.
max_debug_depthNúmero de intentos de depuración.

advertencia

seguridad: El código ejecuta programas escritos por AI, puede llamar a paquetes peligrosos o estar en red, y se recomienda ejecutarlo con Docker.
costes (fabricación, producción, etc.)Precio: Aproximadamente entre 15 y 20 dólares por experimento, más 5 dólares por la redacción de la tesis.
porcentaje de éxitoLa v2 es muy exploratoria, tiene un índice de éxito inferior a la v1 y es adecuada para la investigación abierta.
Problemas de memoriaSi aparece el mensaje "CUDA Out of Memory", cambie el modelo pequeño en el archivo JSON.

Estos pasos le ofrecen una experiencia completa de las capacidades de automatización de la investigación de AI-Scientist-v2.

escenario de aplicación

investigación académica
Los investigadores lo utilizan para validar nuevos algoritmos, generar primeros borradores de artículos y ahorrar tiempo.
Aprendizaje educativo
Los estudiantes lo utilizan para simular investigaciones científicas, generar informes y aprender sobre diseño experimental.
innovación tecnológica
Los desarrolladores lo utilizan para probar nuevas ideas y generar rápidamente prototipos de código.

CONTROL DE CALIDAD

¿Qué modelos son compatibles?
Compatibilidad con Claude 3.5 Sonnet, GPT-4o, o1-preview, etc., véase llm.py Documentación.
¿Cuánto costó el experimento?
Con Claude 3.5 son unos 15-20 dólares por sesión, más 5 dólares por escribir.
¿Qué debo hacer si no consigo generar una tesis?
El porcentaje de éxito varía en función del modelo y la complejidad de la idea, y los parámetros pueden ajustarse o volver a intentarse con un modelo diferente.
¿Cómo añado una nueva dirección de investigación?
existe ai_scientist/ideas/ Añade un nuevo archivo JSON en el directorio y modifícalo con referencia al ejemplo.