AI-Scientist-v2: Investigación científica autónoma y redacción de artículos
Últimos recursos sobre IAPublicado hace 4 meses Círculo de intercambio de inteligencia artificial 2.5K 00
Introducción general
AI-Scientist-v2 es un sistema inteligente desarrollado por la empresa japonesa SakanaAI que pretende automatizar la investigación científica de principio a fin mediante máquinas. En abril de 2025, la herramienta se puso en código abierto en GitHub y se actualizó con una primera versión que añadía la tecnología Agentic Tree Search para hacer más inteligente la exploración. El primer artículo que generó, escrito íntegramente por la IA, ha sido revisado por expertos en el taller ICLR 2025. AI-Scientist-v2 no depende de plantillas humanas y es aplicable a una amplia gama de dominios de aprendizaje automático, lo que la hace adecuada para investigadores y desarrolladores.

Lista de funciones
- Presentación de ideas de investigaciónGeneración automática de ideas de investigación viables a partir de las instrucciones de entrada.
- Escribir código experimentalGenerar el código necesario para realizar experimentos y apoyar el ajuste y la optimización.
- Realización de experimentos y análisisEjecuta automáticamente el código, recopila datos y genera gráficos.
- Redacción de artículos científicos: Elabora un documento bien formateado basado en los resultados del experimento.
- Optimización inteligente de rutas: Explore las mejores opciones de investigación a través de Agentic Tree Search.
- Apoyo a la búsqueda de bibliografíaAcceso opcional a la API de Semantic Scholar para comprobar la novedad y añadir citas.
- código abiertoSe proporciona el código completo, y los usuarios son libres de modificarlo y ampliarlo.
Utilizar la ayuda
AI-Scientist-v2 requiere ciertos conocimientos técnicos, pero una vez configurado puede simplificar enormemente la investigación científica. A continuación se detallan los pasos para ayudar a los usuarios a empezar rápidamente.
Proceso de instalación
- Preparar el entorno
- Requiere Linux y una GPU NVIDIA compatible con CUDA y PyTorch.
- Crea un entorno Python 3.11:
conda create -n ai_scientist python=3.11 conda activate ai_scientist
- Instala PyTorch y CUDA:
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia
- Instalación de dependencias
- Descargar código:
git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2
- Instalar herramientas adicionales:
conda install anaconda::poppler # 处理 PDF conda install conda-forge::chktex # 检查论文格式 pip install -r requirements.txt
- Descargar código:
- Configuración de la API
- Establezca la clave de la API de Big Model (por ejemplo, OpenAI):
export OPENAI_API_KEY='你的密钥'
- Si utiliza Claude modelo, instalando un soporte adicional:
pip install anthropic[bedrock]
Configurar claves y regiones de AWS:
export AWS_ACCESS_KEY_ID='你的ID' export AWS_SECRET_ACCESS_KEY='你的密钥' export AWS_REGION_NAME='us-west-2'
- Opcionalmente, configure la API de Semantic Scholar:
export S2_API_KEY='你的密钥'
- Establezca la clave de la API de Big Model (por ejemplo, OpenAI):
- entorno de prueba
- Comprueba si la GPU está disponible:
python -c "import torch; print(torch.cuda.is_available())"
- exportaciones
True
Indica que la instalación se ha realizado correctamente.
- Comprueba si la GPU está disponible:
Cómo utilizar las principales funciones
1. Generar ideas de investigación
- Vaya al directorio de código y ejecútelo:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --model_writeup "claude-3-5-sonnet-20240620"
- El sistema genera un archivo JSON que contiene el título y la descripción del estudio.
2. Realización de experimentos
- Una vez generada la idea, el sistema crea el código del experimento (por ejemplo
experiment.py
). - Realizar experimentos:
python experiment.py
- Los resultados se guardan en el archivo
experiments
en el registro, incluidos los datos y los gráficos.
3. Redacción de documentos
- Una vez finalizado el experimento, elabora un documento:
python launch_scientist_bfts.py --load_code --add_dataset_ref --model_writeup "o1-preview-2024-09-12" --model_citation "gpt-4o-2024-11-20"
- Genera archivos LaTeX, que se almacenan en la carpeta
experiments/timestamp_ideaname/latex
carpeta. Compílelo con el editor LaTeX para visualizarlo.
4. Utilización de la búsqueda automática en árbol
- Se trata de una función esencial de la v2 que optimiza las rutas de estudio.
- Añadir parámetros en tiempo de ejecución:
python launch_scientist_bfts.py --load_ideas "ai_scientist/ideas/i_cant_believe_its_not_better.json" --tree-search
- generando
unified_tree_viz.html
Si tiene un navegador, puede abrirlo para ver el proceso de búsqueda.
5. Parámetros de búsqueda en el árbol de configuración
- compilador
bfts_config.yaml
Documentación: num_workers
Número de nodos para el procesamiento paralelo, por ejemplo 3.steps
Número máximo de nodos a explorar, por ejemplo 21.num_drafts
Número de líneas de investigación iniciales.max_debug_depth
Número de intentos de depuración.
advertencia
- seguridad: El código ejecuta programas escritos por AI, puede llamar a paquetes peligrosos o estar en red, y se recomienda ejecutarlo con Docker.
- costes (fabricación, producción, etc.)Precio: Aproximadamente entre 15 y 20 dólares por experimento, más 5 dólares por la redacción de la tesis.
- porcentaje de éxitoLa v2 es muy exploratoria, tiene un índice de éxito inferior a la v1 y es adecuada para la investigación abierta.
- Problemas de memoriaSi aparece el mensaje "CUDA Out of Memory", cambie el modelo pequeño en el archivo JSON.
Estos pasos le ofrecen una experiencia completa de las capacidades de automatización de la investigación de AI-Scientist-v2.
escenario de aplicación
- investigación académica
Los investigadores lo utilizan para validar nuevos algoritmos, generar primeros borradores de artículos y ahorrar tiempo. - Aprendizaje educativo
Los estudiantes lo utilizan para simular investigaciones científicas, generar informes y aprender sobre diseño experimental. - innovación tecnológica
Los desarrolladores lo utilizan para probar nuevas ideas y generar rápidamente prototipos de código.
CONTROL DE CALIDAD
- ¿Qué modelos son compatibles?
Compatibilidad con Claude 3.5 Sonnet, GPT-4o, o1-preview, etc., véasellm.py
Documentación. - ¿Cuánto costó el experimento?
Con Claude 3.5 son unos 15-20 dólares por sesión, más 5 dólares por escribir. - ¿Qué debo hacer si no consigo generar una tesis?
El porcentaje de éxito varía en función del modelo y la complejidad de la idea, y los parámetros pueden ajustarse o volver a intentarse con un modelo diferente. - ¿Cómo añado una nueva dirección de investigación?
existeai_scientist/ideas/
Añade un nuevo archivo JSON en el directorio y modifícalo con referencia al ejemplo.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...