대형 모델 미세 조정

총 28개 기사

순서대로 정렬

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

오스트리스의 AI 툴킷: FLUX.1 모델 트레이닝 툴킷을 통한 안정적인 확산

일반 소개 Ostris의 AI 툴킷은 훈련 및 이미지 생성 작업을 위한 안정적인 확산 및 FLUX.1 모델을 지원하는 데 중점을 둔 오픈 소스 AI 툴셋입니다. 이 툴셋은 개발자 Ostris가 만들고 유지 관리합니다.

1 년 전

0196.6K

ModelScope Swift: 대규모 모델을 효율적으로 미세 조정하고 배포할 수 있는 경량 인프라.

포괄적인 소개 ModelScope Swift(줄여서 MS-Swift)는 대규모 모델(LLM)과 멀티모달 대규모 모델(MLLM)의 미세 조정, 추론, 평가 및 배포를 위해 설계된 효율적인 경량 인프라입니다. 이 프레임워크는 400개 이상의 LLM을 지원합니다.

최신 AI 리소스 # 대형 모델 미세 조정

2 년 전

0127.8K

Search-R1: 검색 및 추론을 위한 대규모 모델 학습을 위한 강화 학습

일반 소개 Search-R1은 veRL 프레임워크를 기반으로 PeterGriffinJin이 GitHub에서 개발한 오픈 소스 프로젝트입니다. 강화 학습(RL) 기법을 통해 대규모 언어 모델(LLM)을 훈련시켜 모델이 자율적으로 학습할 수 있도록 합니다.

1 년 전

0102.8K

Unsloth: 대규모 언어 모델의 효율적인 미세 조정 및 학습을 위한 오픈 소스 도구

종합 소개 Unsloth는 대규모 언어 모델(LLM)을 미세 조정하고 학습하기 위한 효율적인 도구를 제공하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 라마, 미스트랄, 파이, 젬마 등 잘 알려진 다양한 모델을 지원합니다.Unsloth의...

1 년 전

0100.8K

원샷 LoRA: 신속한 비디오 LoRA 모델 생성을 위한 올인원 플랫폼

일반 소개 원샷 LoRA는 동영상에서 고품질의 동영상 LoRA 모델을 생성하는 데 중점을 둔 플랫폼입니다. 사용자는 로그인하거나 개인 데이터를 저장하지 않고도 동영상에서 부티크 LoRA 모델을 빠르고 쉽게 훈련할 수 있습니다. 이 플랫폼은 후뉴아를 지원합니다.

1 년 전

097.9K

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

Second Me는 Mindverse 팀이 개발한 오픈 소스 프로젝트로, 컴퓨터에서 '디지털 도플갱어'처럼 행동하는 AI를 만들어 사용자의 말과 기억을 통해 사용자의 말 패턴과 습관을 학습하고 사용자의 말을 이해하는 똑똑한 사람이 될 수 있게 해줍니다.

1 년 전

096.2K

킬른: 간단한 LLM 모델 미세 조정 및 데이터 합성 툴, 0 코드 베이스로 나만의 작은 모델을 미세 조정할 수 있습니다.

포괄적인 소개 킬른은 대규모 언어 모델(LLM)의 미세 조정, 합성 데이터 생성 및 데이터 세트 협업에 중점을 둔 오픈 소스 도구입니다. Windows, MacOS 및 Linux 시스템을 지원하는 직관적인 데스크톱 애플리케이션을 제공하므로 사용자는 코드 없이 LLM을 구현할 수 있습니다.

최신 AI 리소스 # 대형 모델 미세 조정

1 년 전

096.1K

간편한 데이터 세트: 대규모 모델 미세 조정 데이터 세트를 생성하기 위한 간단한 도구

종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.

1 년 전

095.1K

NVIDIA Garak: LLM 취약점을 탐지하고 안전한 생성 AI를 위한 오픈 소스 도구

포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....

2 년 전

093.9K

LlamaEdge: 로컬에서 LLM을 실행하고 미세 조정하는 가장 빠른 방법!

일반 소개 LlamaEdge는 로컬 또는 엣지 장치에서 대규모 언어 모델(LLM)을 실행하고 미세 조정하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Llama2 모델 제품군을 지원하며 사용자가 쉽게 생성하고 실행할 수 있는 OpenAI 호환 API 서비스를 제공합니다.

2 년 전

093.6K

WeClone: WeChat 채팅 로그와 음성으로 디지털 도플갱어 훈련하기

종합 소개 WeClone은 대규모 언어 모델 및 음성 합성 기술과 결합된 WeChat 채팅 로그와 음성 메시지를 사용하여 사용자가 개인화된 디지털 도플갱어를 만들 수 있는 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자의 채팅 습관을 분석하여 모델을 훈련시킬 뿐만 아니라 소수의 음성 샘플로 사실적인 소리를 생성할 수 있습니다....

1 년 전

091.9K

LLaMA Factory: 100개가 넘는 오픈 소스 매크로 모델의 효율적인 미세 조정, 손쉬운 모델 커스터마이징

일반 소개 LLaMA-Factory는 100개가 넘는 대규모 언어 모델(LLM)의 유연한 커스터마이징과 효율적인 학습을 지원하는 통합적이고 효율적인 미세 조정 프레임워크입니다. 내장된 LLaMA 보드 웹 인터페이스를 통해 사용자는 모델링을 완료하기 위해 코드를 작성할 필요가 없습니다.

최신 AI 리소스 # 대형 모델 미세 조정

2 년 전

091.8K

Optexity: 사람의 시연을 통해 웹 작업을 수행하도록 AI를 훈련시키는 오픈 소스 프로젝트

일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.

1 년 전

089.1K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Petals: 대규모 언어 모델의 분산 공유 GPU 실행 및 미세 조정, BitTorrent 네트워크와 같은 GPU 리소스 공유

일반 소개 꽃잎은 분산 컴퓨팅 접근 방식을 통해 대규모 언어 모델(LLM)을 실행하기 위해 BigScience 워크숍에서 개발한 오픈 소스 프로젝트입니다. 사용자는 가정에서 소비자용 GPU 또는 Google Co...를 사용하여 LLM을 실행할 수 있습니다.

2 년 전

089K

MiniMind-V: 2600만 개의 파라메트릭 시각 언어 모델에 대한 1시간 교육

일반 소개 MiniMind-V는 사용자가 단 2600만 개의 파라미터로 1시간 이내에 경량 시각 언어 모델(VLM)을 학습할 수 있도록 설계된 오픈 소스 프로젝트로, GitHub에서 호스팅되고 있습니다. MiniMind 언어 모델을 기반으로 하며, 새로운 시각적 ...

1 년 전

088K

OpenManus-RL: 지능형 신체 추론 및 의사 결정 향상을 위한 대규모 모델 미세 조정

일반 소개 OpenManus-RL은 UIUC-Ulab이 MetaGPT 커뮤니티의 OpenManus 팀과 함께 개발한 오픈 소스 프로젝트로, GitHub에서 호스팅되며 이 프로젝트는 강화 학습(RL) 기술을 통해 대규모 언어 모델링(LLM)을 향상시킵니다....

1 년 전

087K

Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

종합 소개 Maestro는 Roboflow에서 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하여 누구나 자신만의 시각적 매크로 모델을 훈련할 수 있도록 개발한 도구입니다. 이 도구는 F와 같이 널리 사용되는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공합니다.

1 년 전

086.6K

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...

1 년 전

081.2K

TPO-LLM-WebUI: 질문을 입력하여 실시간으로 모델을 학습시키고 결과를 출력할 수 있는 AI 프레임워크입니다.

일반 소개 TPO-LLM-WebUI는 직관적인 웹 인터페이스를 통해 대규모 언어 모델(LLM)을 실시간으로 최적화할 수 있는 Airmomo가 GitHub에서 오픈소스로 제공하는 혁신적인 프로젝트입니다. TPO(Test-Time Pr ...

1 년 전

079.2K

포어프론트 AI: 머신러닝 모델 튜닝 플랫폼 | AI 채팅 도우미

포괄적인 소개 Forefront AI는 오픈 소스 모델의 사용자 지정 및 배포에 중점을 둔 고급 AI 플랫폼입니다. 사용자는 다양한 작업 요구 사항을 충족하기 위해 GPT-4, GPT-3.5 등과 같은 다양하고 강력한 AI 모델을 선택하고 미세 조정할 수 있습니다. 이 플랫폼은 PD 업로드를 지원합니다.

2 년 전

078.5K

오픈 리서처-제로: 오픈 소스 대규모 추론 강화 학습 교육 플랫폼

일반 소개 Open-Reasoner-Zero는 강화 학습(RL) 연구에 중점을 둔 오픈 소스 프로젝트로, GitHub의 Open-Reasoner-Zero 팀에서 개발했습니다. 효율적이고 확장 가능하며 사용하기 쉬운 교육을 제공하는 것을 목표로 합니다.

1 년 전

077.9K

분재: 에지 디바이스에서 작동하기에 적합한 3값 가중 언어 모델

일반 소개 분재는 삼항 가중치를 사용하여 5억 개의 파라미터 크기로 deepgrove-ai에서 개발한 오픈 소스 언어 모델입니다. 라마 아키텍처와 미스트랄 분류기를 기반으로 합니다...

1 년 전

077.6K

MM-EUREKA: 시각적 추론 탐구를 위한 다중 모드 강화 학습 도구

종합 소개 MM-EUREKA는 상하이 인공 지능 연구소, 상하이 자오통 대학교 및 기타 관계자들이 개발한 오픈 소스 프로젝트입니다. 이 도구는 규칙 기반 강화 학습 기법을 통해 텍스트 추론 기능을 멀티모달 시나리오로 확장하여 모델이 이미지와 텍스트 정보를 처리할 수 있도록 지원합니다. 이 도구의 핵심은...

1 년 전

076.5K

DeepCoder-14B-Preview: 코드 생성에 탁월한 오픈 소스 모델

일반 소개 DeepCoder-14B-Preview는 에이전티카 팀이 개발한 오픈 소스 코드 생성 모델로 Hugging Face 플랫폼에 출시되었습니다. DeepSeek-R1-Distilled-Q...를 기반으로 합니다.

1 년 전

075.1K

X-R1: 일반 디바이스에서 0.5B 모델에 대한 저렴한 비용의 교육

일반 소개 X-R1은 개발자에게 엔드투엔드 강화 학습을 기반으로 모델을 훈련할 수 있는 저비용의 효율적인 도구를 제공하는 것을 목표로 하는 dhcode-cpp 팀이 GitHub에서 오픈소스화한 강화 학습 프레임워크입니다. 이 프로젝트는 DeepSeek...에서 지원합니다.

1 년 전

074K

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.

1 년 전

071.8K

ColossalAI: 효율적인 대규모 AI 모델 학습 솔루션 제공

종합 소개 ColossalAI는 대규모 AI 모델의 훈련과 추론을 위한 효율적이고 비용 효율적인 솔루션을 제공하는 것을 목표로 HPC-AI Technologies에서 개발한 오픈 소스 플랫폼입니다. 여러 병렬 전략, 이기종 메모리 관리, 혼합 정밀도 훈련을 지원함으로써 ColossalAI는...

1 년 전

071K

베이커리: 오픈 소스 AI 모델을 손쉽게 미세 조정하고 수익화하기

일반 소개 베이커리는 AI 스타트업, 머신러닝 엔지니어, 연구원을 위해 설계된 플랫폼으로, 간단하고 효율적인 AI 모델 미세 조정 및 수익화 서비스를 제공합니다. 사용자는 베이커리를 통해 커뮤니티 기반 데이터 세트에 액세스하고, 직접 데이터 세트를 만들거나 업로드하고, 모델을 미세 조정할 수 있습니다....

2 년 전

070.3K

그게 아닙니다.