일반 소개 LLaMA-Factory는 100개가 넘는 대규모 언어 모델(LLM)의 유연한 커스터마이징과 효율적인 학습을 지원하는 통합적이고 효율적인 미세 조정 프레임워크입니다. 내장된 LLaMA 보드 웹 인터페이스를 통해 사용자는 모델링을 완료하기 위해 코드를 작성할 필요가 없습니다.
포괄적인 소개 킬른은 대규모 언어 모델(LLM)의 미세 조정, 합성 데이터 생성 및 데이터 세트 협업에 중점을 둔 오픈 소스 도구입니다. Windows, MacOS 및 Linux 시스템을 지원하는 직관적인 데스크톱 애플리케이션을 제공하므로 사용자는 코드 없이 LLM을 구현할 수 있습니다.
종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....
일반 소개 LlamaEdge는 로컬 또는 엣지 장치에서 대규모 언어 모델(LLM)을 실행하고 미세 조정하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Llama2 모델 제품군을 지원하며 사용자가 쉽게 생성하고 실행할 수 있는 OpenAI 호환 API 서비스를 제공합니다.
포괄적인 소개 Forefront AI는 오픈 소스 모델의 사용자 지정 및 배포에 중점을 둔 고급 AI 플랫폼입니다. 사용자는 다양한 작업 요구 사항을 충족하기 위해 GPT-4, GPT-3.5 등과 같은 다양하고 강력한 AI 모델을 선택하고 미세 조정할 수 있습니다. 이 플랫폼은 PD 업로드를 지원합니다.
일반 소개 베이커리는 AI 스타트업, 머신러닝 엔지니어, 연구원을 위해 설계된 플랫폼으로, 간단하고 효율적인 AI 모델 미세 조정 및 수익화 서비스를 제공합니다. 사용자는 베이커리를 통해 커뮤니티 기반 데이터 세트에 액세스하고, 직접 데이터 세트를 만들거나 업로드하고, 모델을 미세 조정할 수 있습니다....
종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.
포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
종합 소개 MM-EUREKA는 상하이 인공 지능 연구소, 상하이 자오통 대학교 및 기타 관계자들이 개발한 오픈 소스 프로젝트입니다. 이 도구는 규칙 기반 강화 학습 기법을 통해 텍스트 추론 기능을 멀티모달 시나리오로 확장하여 모델이 이미지와 텍스트 정보를 처리할 수 있도록 지원합니다. 이 도구의 핵심은...
종합 소개 Maestro는 Roboflow에서 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하여 누구나 자신만의 시각적 매크로 모델을 훈련할 수 있도록 개발한 도구입니다. 이 도구는 F와 같이 널리 사용되는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공합니다.
종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
일반 소개 X-R1은 개발자에게 엔드투엔드 강화 학습을 기반으로 모델을 훈련할 수 있는 저비용의 효율적인 도구를 제공하는 것을 목표로 하는 dhcode-cpp 팀이 GitHub에서 오픈소스화한 강화 학습 프레임워크입니다. 이 프로젝트는 DeepSeek...에서 지원합니다.
일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.
개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
종합 소개 ColossalAI는 대규모 AI 모델의 훈련과 추론을 위한 효율적이고 비용 효율적인 솔루션을 제공하는 것을 목표로 HPC-AI Technologies에서 개발한 오픈 소스 플랫폼입니다. 여러 병렬 전략, 이기종 메모리 관리, 혼합 정밀도 훈련을 지원함으로써 ColossalAI는...