일반 소개
Paper2Code는 머신러닝 논문에 대한 코드 구현의 부족을 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 대규모 언어 모델링(LLM) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획, 분석, 코드 생성의 3단계 프로세스를 채택하고 있으며, 전문 에이전트가 개별적으로 처리하여 논문에 충실한 고품질 코드 구현을 생성합니다. 이 프로젝트는 유명한 "주의만 있으면 됩니다" 논문을 예로 들어 논문에서 다음과 같은 프로세스를 보여줍니다. 트랜스포머 Paper2Code는 PDF 및 LaTeX 형식의 종이 입력을 지원합니다. 머신러닝 연구자, 개발자, 학생을 위해 PDF 및 LaTeX 형식의 종이 입력을 지원하며, Paper2Code는 PaperBench 벤치마크에서 우수한 성능을 보이며, 코드가 GitHub에 공개되어 있어 설치 및 사용이 간편합니다.

기능 목록
- 머신 러닝 문서를 실행 가능한 코드 저장소로 자동 변환합니다.
- PDF 및 LaTeX 형식의 종이 입력을 지원하여 구조화된 JSON 데이터를 생성할 수 있습니다.
- 계획, 분석 및 코드 생성을 위한 3단계 처리 흐름을 제공합니다.
- 시스템 아키텍처, 종속성 및 구성 파일을 포함한 완전한 코드 리포지토리를 생성합니다.
- 참조 및 비참조 코드 품질 평가를 1~5점 척도로 지원합니다.
- "주의만 있으면 됩니다" 문서에 대한 트랜스포머 코드를 빠르게 실행할 수 있는 샘플 스크립트를 제공합니다.
- 오픈 소스이며 무료이므로 사용자가 코드를 수정하고 기여할 수 있습니다.
도움말 사용
설치 프로세스
Paper2Code를 사용하려면 필요한 종속성을 설치하고 환경을 구성해야 합니다. 자세한 설치 단계는 다음과 같습니다:
- 클론 창고
터미널에서 다음 명령을 실행하여 Paper2Code 리포지토리를 로컬로 복제합니다:git clone https://github.com/going-doer/Paper2Code.git cd Paper2Code
- 종속성 설치
다음을 포함한 Python 종속성을 설치합니다.openai
노래로 응답tiktoken
등 라이브러리:pip install openai tiktoken
사용해야 하는 경우 vLLM 모델을 사용하는 경우 공식 vLLM 리포지토리(https://github.com/vllm-project/vllm)를 참조하여 설치하세요.
- OpenAI API 키 설정
OpenAI API 키를 얻은 후 환경 변수를 구성합니다:export OPENAI_API_KEY="your-api-key"
Windows 사용자가 실행합니다:
set OPENAI_API_KEY=your-api-key
- PDF 변환 도구 설치
Paper2Code는 PDF 문서를 JSON 형식으로 변환하는 기능을 지원합니다. s2orc-doc2json 리포지토리를 복제합니다:git clone https://github.com/allenai/s2orc-doc2json.git
PDF 변환 스크립트를 실행합니다:
mkdir -p ./s2orc-doc2json/output_dir/paper_coder python ./s2orc-doc2json/doc2json/grobid2json/process_pdf.py -i <PDF_PATH> -t ./s2orc-doc2json/temp_dir/ -o ./s2orc-doc2json/output_dir/paper_coder
사용법
Paper2Code는 여러 가지 실행 방법을 제공하며 PDF 및 LaTeX 형식의 문서를 지원합니다. 자세한 작동 방법은 다음과 같습니다:
샘플 스크립트 실행
Paper2Code에는 주의가 필요한 모든 것 용지용 트랜스포머 코드를 생성하는 샘플 스크립트가 포함되어 있습니다. 로 이동 scripts
카탈로그:
cd scripts
bash run.sh
출력은 outputs/Transformer
카탈로그 포함:
planning_artifacts
시스템 아키텍처 및 종속성 파일.analyzing_artifacts
논문 실현 세부 분석.coding_artifacts
생성된 코드 파일입니다.Transformer_repo
최종 코드 저장소.
맞춤형 에세이 처리
문서를 코드로 변환하려면 PDF 또는 LaTeX 형식의 파일을 준비하고 환경 변수를 수정하세요. 예를 들어 PDF 형식을 사용합니다:
export OPENAI_API_KEY="your-api-key"
cd scripts
bash run.sh
LaTeX 형식의 경우 실행합니다:
bash run_latex.sh
다른 대형 언어 모델을 사용하는 경우 실행하세요:
bash run_llm.sh # PDF 格式
bash run_latex_llm.sh # LaTeX 格式
코드 품질 평가
Paper2Code는 참조 및 비참조 코드 품질 평가를 모두 지원합니다. 평가 스크립트를 실행합니다:
cd codes
python eval.py \
--paper_name Transformer \
--pdf_json_path ../examples/Transformer_cleaned.json \
--data_dir ../data \
--output_dir ../outputs/Transformer \
--target_repo_dir ../outputs/Transformer_repo \
--eval_result_dir ../results \
--eval_type ref_free \
--generated_n 8 \
--papercoder
참조 평가를 위해 표준 웨어하우스 경로를 지정해야 합니다:
--eval_type ref_based \
--gold_repo_dir ../examples/Transformer_gold_repo
정확도 점수를 포함한 평가 결과는 1~5점 사이의 점수를 포함하여 results
카탈로그.
주요 기능 작동
- 멀티 에이전트 협업코드 아키텍처를 설계하는 기획 에이전트, 논문 세부 정보를 추출하는 분석 에이전트, 모듈식 코드를 작성하는 생성 에이전트. 사용자가 수동으로 개입할 필요 없이 시스템이 자동으로 전체 프로세스를 완료합니다.
- 고품질 코드생성된 코드는 문서에 충실하고 종속성 관리 및 구성 파일을 포함하며 프로덕션 환경에 적합합니다.
- 유연한 입력다양한 용지 형식과 호환되는 PDF 및 LaTeX 형식을 지원하여 다양한 사용자 요구에 편리하게 사용할 수 있습니다.
- 평가 도구코드 정확성을 정량화하고 사용자가 구현 품질을 검증할 수 있도록 자동화된 평가 스크립트를 제공합니다.
주의
- 다음을 실행하여 OpenAI API 키가 유효한지 확인합니다. o3-mini 모델의 예상 비용은 $0.50~0.70입니다.
- PDF를 변환할 때 형식 지정 오류를 방지하기 위해 JSON 출력의 완전성을 확인하세요.
- 사용자 지정 문서에는 스크립트에서 경로 및 매개 변수를 조정해야 합니다.
README.md
.
애플리케이션 시나리오
- 학술 연구
연구자들은 새로운 논문을 신속하게 코드로 전환하여 알고리즘을 검증하고 수동 코딩에 드는 시간을 절약할 수 있습니다. 예를 들어 머신 러닝 학자는 Paper2Code에서 생성된 코드를 직접 실행하여 논문에 포함된 모델의 성능을 테스트할 수 있습니다. - 교육 학습
Paper2Code를 통해 학생들은 클래식 논문(예: Transformer)을 코드로 변환하여 모델 구현의 세부 사항을 더 깊이 이해하고 딥러닝의 원리를 학습하는 데 도움을 받을 수 있습니다. - 프로토타입 개발
개발자는 생성된 코드 저장소를 기반으로 머신 러닝 프로토타입을 빠르게 구축할 수 있으므로 개발 주기를 단축하고 빠르게 반복되는 상용 프로젝트에 적합합니다.
QA
- Paper2Code는 어떤 종이 형식을 지원하나요?
PDF 및 LaTeX 형식의 머신러닝 논문을 지원하며, PDF는 JSON으로 변환해야 하고, LaTeX는 직접 처리할 수 있습니다. - 생성된 코드의 품질은 어떤가요?
코드는 논문 내용에 충실하도록 기획, 분석, 생성의 3단계 프로세스를 거쳐 처리됩니다. 평가 도구는 고품질의 결과물을 보장하기 위해 1~5점의 정확성 점수를 제공합니다. - Paper2Code를 실행하려면 비용을 지불해야 하나요?
o3-mini 모델을 실행하는 데 약 $0.50~0.70의 비용이 드는 OpenAI API 사용료가 있습니다. 다른 기능은 무료입니다. - 자신의 서류는 어떻게 처리하나요?
PDF 또는 LaTeX 파일을 준비하고, 환경 변수를 구성하고, 환경 변수를 구성한 후 다음을 실행합니다.run.sh
어쩌면run_latex.sh
스크립트에서 경로와 매개변수를 조정하기만 하면 됩니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 게시물
댓글 없음...