AI 오픈 소스 프로젝트

총 1020개 문서
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

지식 그래프 스튜디오(WhyHow): 지식 그래프를 생성하고 관리하기 위한 오픈 소스 플랫폼으로, RAG 애플리케이션을 기본적으로 지원합니다.

종합 소개 지식 그래프 스튜디오(KGS)는 RAG 네이티브 지식 그래프를 생성하고 관리하는 프로세스를 간소화하도록 설계된 오픈 소스 플랫폼입니다. 이 플랫폼은 규칙 기반 엔티티 해상도, 모듈식 그래프 구성, 유연한 데이터...
12개월 전
042.2K
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: 지능형 SQL 및 데이터 보고서 생성을 위한 데이터베이스 관리 도구

일반 소개 Chat2DB는 CodePhiliaX 팀이 개발한 오픈 소스 데이터베이스 관리 및 SQL 클라이언트 도구로, AI 기능과 통합되어 있으며, 신속한 SQL 쿼리 작성, 데이터베이스 관리, 데이터 보고서 생성 및 다중 데이터베이스 상호 작용을 지원합니다. 그것은 16 개 이상을 지원합니다 ...
9개월 전
042.2K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: 대형 모델에 구축된 지능형 대화 로봇으로, WeChat 및 기타 다중 대화 플랫폼 액세스를 지원합니다.

종합 소개 ChatGPT-on-WeChat 프로젝트는 대형 모델 기반의 지능형 대화 로봇으로, 개인 WeChat, WeChat 공개 번호, 기업 WeChat 애플리케이션, 플라이북, 네일 등에 대한 다중 플랫폼 액세스를 지원합니다. 사용자는 GPT3.5, GPT-4, Claude, Man ...
11개월 전
042K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: 손상된 이미지 복구 및 이미지 고화질 줌 오픈 소스 프로젝트, 최소 16G 비디오 메모리

일반 설명 InstantIR은 손상된 이미지를 매우 높은 품질과 생생한 디테일로 복원할 수 있도록 설계된 InstantX 팀에서 개발한 혁신적인 단일 이미지 복원 모델로, 손상된 이미지를 고품질로 복원할 수 있습니다. 이 도구는 이미지의 세부 사항을 복원할 뿐만 아니라 ...
1 년 전
041.8K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 대규모 언어 모델의 효율적인 미세 조정 및 학습을 위한 오픈 소스 도구

종합 소개 Unsloth는 대규모 언어 모델(LLM)을 미세 조정하고 학습하기 위한 효율적인 도구를 제공하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 라마, 미스트랄, 파이, 젬마 등 잘 알려진 다양한 모델을 지원합니다.Unsloth의...
10개월 전
041.7K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...
11개월 전
041.6K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

음성 복제: 원클릭 설치 프로그램을 갖춘 Windows용 xtts_v2 기반의 다국어 샘플 없는 음성 복제 툴입니다.

일반 설명 Clone Voice는 오픈 소스 사운드 복제 도구로, 사용자가 모든 사운드 또는 개인 음성 녹음을 사용하여 음성을 복제할 수 있는 웹 기반 인터페이스를 제공합니다. 이 도구는 NVIDIA GPU가 없어도 쉽게 사용할 수 있으며, 사전 컴파일된 앱과 함께 사용할 수 있습니다.
1 년 전
041.6K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI 헤지 펀드: 여러 지능을 사용하여 복잡한 헤지 펀드 거래 결정을 내리는 오픈 소스 자동 거래 시스템입니다.

일반 소개 AI 헤지 펀드는 멀티 에이전트 시스템을 활용하여 매매 결정을 내리는 인공지능 헤지 펀드입니다. 이 시스템은 시장 데이터 에이전트, 퀀트 에이전트, 리스크 관리 에이전트, 포트폴리오 관리 에이전트 등 여러 전문 에이전트와 함께 작동하여 복잡한 트레이딩을 수행합니다....
10개월 전
041.6K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote: 동영상에서 자동으로 마크다운 노트를 생성하는 AI 도구

종합 소개 BiliNote는 오픈 소스 AI 동영상 노트 필기 도구로, BiliNote와 YouTube 동영상 링크에서 콘텐츠를 추출해 마크다운 형식의 명확한 구조의 노트를 자동으로 생성할 수 있도록 지원합니다. 기본 오디오 트랜스크립션과 다양한 대형 모델(예: ...
7개월 전
041.6K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools: 음성-자막 변환 도구, 컷씬, 레이서 및 머스트 컷에 대한 인터페이스가 내장된 경량 클라이언트

포괄적인 소개 AsrTools는 Cutscene, QuickScope, MustCut 등과 같은 대형 업체의 인터페이스가 내장된 지능형 음성 텍스트 변환 도구입니다. GPU나 번거로운 구성이 필요하지 않으며 효율적인 멀티스레드 일괄 처리를 지원합니다. 파이큐트5 개발, 아름답고 사용자 친화적인 인터페이스를 기반으로 하며, SRT 및 TXT 형식의 단어를 출력할 수 있습니다....
1 년 전
041.5K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: AI 어시스턴트 및 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다.

일반 소개 Mem0("mem-zero"로 발음)는 AI 어시스턴트와 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다. 사용자 선호도를 기억하고, 개인의 필요에 맞게 조정하며, 시간이 지남에 따라 개선되므로 고객 지원 챗봇, AI 비서 및 자율 시스템에 이상적입니다.
1 년 전
041.5K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree(ChatAnywhere-2): 모든 창에서 대화를 완료할 수 있도록 지원하는 GPT API를 사용하여 만든 네이티브 코파일럿입니다.

일반 소개 ChatFree는 사용자의 AI 앱을 브라우저의 제약에서 벗어나 로컬에서 실행할 수 있도록 하는 것을 목표로 하는 오픈 소스 프로젝트입니다. GPT API를 사용하여 만들어진 Copilot은 Office, Word, WPS 등과 같은 다양한 오피스 소프트웨어를 지원하도록 설계되었습니다. 이 프로젝트의 개발자는 ...
12개월 전
041.5K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
11개월 전
041.5K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI 챗봇 Supabase: 오픈 소스 Next.js와 Supabase는 Vercel에 신속하게 배포할 수 있도록 AI 챗봇을 구축했습니다.

일반 소개 AI 챗봇 수파베이스는 Next.js와 수파베이스를 기반으로 구축된 오픈 소스 AI 챗봇 템플릿입니다. Vercel에서 개발한 이 프로젝트는 완전한 기능을 갖춘 사용자 지정 가능한 챗봇 솔루션을 제공하는 것을 목표로 합니다. 작성자 ...
1 년 전
041.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: 음성을 인식하고 복제된 음성을 사용하여 통신하는 멀티모달 음성 상호작용 프레임워크 등 다양한 기능

종합 소개 Step-Audio는 프로덕션 환경에 즉시 사용 가능한 음성 이해 및 생성 기능을 제공하도록 설계된 오픈 소스 지능형 음성 인터랙션 프레임워크입니다. 이 프레임워크는 다국어 대화(예: 중국어, 영어, 일본어), 감정적 음성(예: 행복, 슬픔), 지역 방언(예: 광동어, 사천어 ...) 등을 지원합니다.
9개월 전
041.4K
Moffee:将Markdown转为PPT幻灯片

Moffee: 마크다운을 PPT 슬라이드쇼로 변환하기

일반 소개 Moffee는 마크다운 파일을 빠르고 간단하고 효율적으로 전문 슬라이드쇼로 변환하는 오픈 소스 도구입니다. 사용자는 마크다운 콘텐츠를 작성하기만 하면 Moffee가 레이아웃, 페이지 매김 및 스타일을 자동으로 처리하므로 수동으로 조판할 필요가 없습니다.
8개월 전
041.3K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: 혁신적인 음성 생성 및 음성 복제 도구

종합적인 소개 GPT-SoVITS는 오픈 소스 음성 변환 및 합성 도구로, GPT 모델과 SoVITS 보이스 체인저 기술을 결합한 것입니다. 이 도구는 샘플이 전혀 없거나 적은 상태에서 즉석에서 텍스트를 음성으로 변환하고 5초의 오디오 샘플만으로 음성 스타일 마이그레이션을 지원합니다. 그 기능에는 교차 언어가 포함됩니다 ...
1 년 전
041.2K
FinRobot:提升金融数据分析效率和投资研究的的智能体

핀로봇: 금융 데이터 분석 효율성과 투자 리서치를 개선하는 지능형 기관

종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....
10개월 전
041.2K
Local-NotebookLM:本地PDF生成语音播客的开源工具

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.
9개월 전
041.2K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: 원클릭 번역 및 더빙이 가능한 동영상용 다국어 글로벌라이제이션 도구

포괄적인 소개 KrillinAI는 인공 지능을 사용하여 사용자가 동영상을 번역하고 자동으로 더빙하는 데 중점을 둔 오픈 소스 동영상 처리 도구입니다. 동영상 다운로드부터 다양한 플랫폼에 적합한 완제품 생성까지 모든 과정을 단 몇 번의 클릭만으로 진행할 수 있습니다. 개발자는 깃허브에서 확인할 수 있습니다...
6개월 전
041.2K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: 안드로이드용 실시간 음성 번역 앱, 무료 및 오프라인!

일반 소개 RTranslator는 안드로이드 기기용으로 설계된 사실상 오픈 소스인 무료 오프라인 실시간 번역 앱입니다. 사용자는 블루투스 헤드셋을 연결하여 휴대폰을 주머니에 넣고 다른 사람과 마치 자신의 언어로 말하는 것처럼 대화할 수 있습니다.RTransla...
11개월 전
041.2K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具

PhotoDoodle: 텍스트 명령으로 사진에 예술적인 낙서를 추가할 수 있는 AI 도구

일반 소개 포토두들은 쇼랩에서 개발한 오픈 소스 이미지 편집 도구로, 인공지능 기술을 통한 사진의 예술적 편집에 중점을 두고 있습니다. 사용자는 간단한 텍스트 입력만으로 만화 스타일, 3D 효과, 빛을 실제 사진에 추가할 수 있습니다...
9개월 전
041.1K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
11개월 전
041K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: 오픈 소스 프로그래밍 보조 도구, 코드 작성 및 파일 편집에 AI 어시스턴트 사용

일반 소개 Aider는 개발자가 자연어 대화를 통해 코드를 작성, 편집 및 리팩터링할 수 있도록 도와주는 강력한 오픈 소스 AI 프로그래밍 보조 도구입니다. 대화형 AI 쌍 프로그래밍 도구인 Aider는 여러 주요 프로그래밍 언어를 지원하며 Git에 원활하게 통합할 수 있습니다.
8개월 전
040.9K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 고품질 음성 생성 및 복제를 위한 오픈 소스 텍스트 음성 변환 모델

일반 소개 Llasa-3B는 홍콩과학기술대학교 오디오 랩(HKUST Audio)에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 이 모델은 여러 언어를 지원할 뿐만 아니라 고품질 음성 생성을 제공하도록 세심하게 튜닝된 Llama 3.2B 아키텍처를 기반으로 합니다.
10개월 전
040.9K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: AI가 컴퓨터를 직접 제어할 수 있도록 하는 클라우드의 제어 컴퓨터를 오픈 소스로 구현한 기능입니다.

일반 설명 Agent.exe는 사용자가 AI를 통해 로컬 컴퓨터를 직접 제어할 수 있도록 Anthropic의 클로드 3.5 소네트 API를 활용하는 오픈 소스 일렉트론 애플리케이션입니다. 이 프로젝트는 K...에 의해 개발되었습니다.
11개월 전
040.8K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify: AI 기술을 사용하여 흑백 사진과 동영상에 컬러를 입히는 클래식 오픈 소스 도구

종합 소개 DeOldify는 흑백 사진과 비디오의 지능형 컬러링 및 복원을 위한 딥러닝 기술을 기반으로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 혁신적인 NoGAN 훈련 방법을 사용하여 이미지 컬러링 과정에서 기존 GAN 네트워크의 일반적인 결함을 성공적으로 해결합니다...
11개월 전
040.8K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
8개월 전
040.7K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee: 데스크톱에서 로컬로 AI 매크로 모델을 실행하고 비공개 지식창고를 관리하기

일반 소개 Klee는 사용자가 안전한 비공개 지식 베이스 관리와 마크다운 노트 필기 기능을 통해 로컬에서 오픈 소스 LLM(대규모 언어 모델)을 실행할 수 있도록 설계된 오픈 소스 데스크톱 애플리케이션입니다. Ollama와 LlamaIndex 기술을 기반으로 합니다...
9개월 전
040.7K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit: 자연어 명령어로 이미지를 편집할 수 있는 오픈 소스 도구

일반 소개 Step1X-Edit는 스텝펀 AI 팀이 개발하고 깃허브에서 호스팅하는 오픈 소스 이미지 편집 프레임워크로, 멀티모달 대용량 언어 모델(Qwen-VL)과 확산 변환기(DiT)를 결합하여 사용자가 간단하고 자연스러운 방식으로 이미지를 만들 수 있도록 합니다.
7개월 전
040.5K
Fish Speech:快速且高精度使用少样本克隆中英文语音

물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.

일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...
10개월 전
040.5K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: 디지털 맨 통합 시스템의 오픈 소스 클론, 무료 디지털 맨 클라이언트를 원클릭으로 배포할 수 있습니다.

종합 소개 AigcPanel은 모든 사용자를 위한 원스톱 AI 디지털 휴먼 제작 시스템으로, 전자+뷰3+타입스크립트 기술 스택으로 개발되어 Windows에서 원클릭 배포를 지원합니다. 이 시스템은 핵심인 사용자 친화적으로 설계되었습니다.
11개월 전
040.5K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)

BlinkShot: 프롬프트 단어를 입력하여 실시간 이미지 생성(Flux Schnell 모델 무료 이용)

일반 설명 BlinkShot은 오픈 소스 실시간 AI 이미지 생성기로, Together AI와 Flux Schnell 기술을 활용하여 사용자가 프롬프트에 입력하는 대로 고품질 이미지를 생성할 수 있습니다. 이 플랫폼은 완전 무료이며 사용자 커스터마이징과 2차 오픈을 지원합니다.
1 년 전
040.5K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: AI 지원 주식 분석 도구, 자체 선택한 주식 시세 실시간 모니터링 및 AI 기반 심층 분석

종합 소개 고스탁은 Wails와 NaiveUI를 기반으로 구축된 AI 기반 주식 분석 도구입니다. 이 도구는 주식 시세를 실시간으로 모니터링하고 비용 및 손익 표시와 상승/하락 알람 푸시 기능을 제공합니다. 모든 데이터는 로컬에 저장되어 사용자가 ...
10개월 전
040.4K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원

종합 소개 컬러는 잠재적 확산 기법을 기반으로 Racer 팀에서 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍에 대해 학습되었으며 중국어와 영어 입력을 모두 지원하여 의미적으로 정확한 고품질의 복잡한 이미지를 생성할 수 있습니다.시각적 품질의 컬러...
11개월 전
040.4K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

계속: VS Code와 통합되고 모델 및 임베딩을 사용자 지정하는 오픈 소스 AI 코드 도우미

일반 소개 Continue는 소프트웨어 개발자의 효율성을 개선하기 위해 설계된 오픈 소스 AI 코드 어시스턴트입니다. 주요 기능으로는 코드 자동 완성, 코드 최적화, VS Code 및 JetBrains IDE를 위한 지능형 코드 제안 등이 있습니다.Continue의 기능은 다음과 같습니다.
10개월 전
040.4K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

소닉: 오디오 기반 인물 이미지로 생생한 얼굴 표정이 담긴 디지털 데모 동영상 생성

일반 소개 Sonic은 글로벌 오디오 인식에 초점을 맞춘 혁신적인 플랫폼으로, 오디오를 기반으로 생생한 인물 애니메이션을 생성하는 것을 목표로 합니다. 텐센트와 저장대학교의 연구팀이 개발한 이 플랫폼은 오디오 정보를 사용하여 얼굴 표정과 머리 움직임을 제어하여 자연스럽고 부드러운 애니메이션 동영상을 생성합니다....
8개월 전
040.4K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

미드여정 프록시: AI 매핑 API 호출을 위한 미드여정 디스코드 채널 프록시/반전(무료 테스트)

종합 소개 Midjourney Proxy는 AI 그리기 기능을 API 형태로 변환하기 위해 Midjourney의 Discord 채널에 프록시 서비스를 제공하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 완전 무료 오픈 소스이며, 원클릭 얼굴 교체, 이미지 블렌딩, 그래프 생성 등을 지원합니다.
12개월 전
040.3K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: 이미지를 업로드하고 초상화 기능을 마이그레이션하여 다양한 스타일의 이미지를 생성합니다.

개요 InstantID는 단일 참조 ID 사진을 사용하여 높은 수준의 충실도를 보장하면서 개인화된 스타일이나 포즈를 가진 이미지를 몇 초 만에 생성하는 데 중점을 둔 고급 기술입니다. 이 기술은 얼굴 이미지, 랜드마크 지도를 통합하여 확산 모델 기반 솔루션을 사용합니다....
1 년 전
040.3K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程

Open R1: 딥시크-R1 훈련 프로세스를 복제하는 허깅 페이스

일반 소개 허깅페이스의 Open R1 프로젝트는 R1 파이프라인에서 누락된 부분을 구축하여 누구나 이를 복제하고 구축할 수 있도록 하는 것을 목표로 하는 완전 오픈 소스 DeepSeek-R1 복제 프로젝트입니다. 이 프로젝트는 단순하게 설계되었으며 주로 교육과 평가로 구성됩니다.
10개월 전
040.2K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: 텍스트 설명 생성을 위한 AI 어시스턴트 ComfyUI 워크플로

포괄적인 소개 ComfyUI-Copilot은 자연어 상호 작용을 통해 AI 알고리즘 디버깅 및 배포의 효율성을 개선하는 것을 목표로 ComfyUI 프레임워크용으로 설계된 AI 기반 사용자 지정 노드입니다. AIDC-AI 팀(알리바바)이 개발했으며 GitHu에서 파생되었습니다.
9개월 전
040.2K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: 컴퓨터 비전 프로젝트의 효율성을 높여주는 무료 이미지 주석 도구

일반 소개 Make Sense는 사용자가 컴퓨터 비전 프로젝트를 위한 데이터 세트를 빠르게 준비할 수 있도록 설계된 무료 온라인 이미지 주석 도구입니다. 복잡한 설치 없이 브라우저에 액세스하기만 하면 사용할 수 있고, 여러 운영 체제를 지원하며, 소규모 딥 러닝 프로젝트에 이상적입니다. 사용자는 다음을 수행할 수 있습니다.
9개월 전
040.2K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全

NSFW 탐지기: 데이터 보안을 보호하기 위해 파일에 NSFW 콘텐츠가 포함되어 있는지 감지합니다.

종합 소개 NSFW Detector는 주로 이미지, 동영상, PDF 파일 등에 불쾌감을 주는 콘텐츠가 포함되어 있는지 여부를 탐지하는 데 사용되는 AI 기반 불쾌감 콘텐츠 탐지 도구입니다. 이 도구는 Falconsai/nsfwimagedetectio...
12개월 전
040.1K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: 이미지 및 비디오 얼굴 복원, 오래된 사진 복원, 원클릭 배포 버전 제공

코드포머 일반 소개 코드포머는 난양공과대학교 S-Lab 연구팀이 개발한 강력한 시각장애인 얼굴 복구를 위한 코드베이스로, NeurIPS 2022에서 발표되었습니다. 이 프로젝트는 코드북 룩업 트랜스포머(C ...
1 년 전
040.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

드림톡: 하나의 아바타 이미지로 표현력 있는 토킹 동영상을 생성하세요!

드림톡 종합 소개 드림톡은 칭화대학교, 알리바바 그룹, 화중과학기술대학교가 공동으로 개발한 확산 모델 기반 표정 토킹 헤드 생성 프레임워크입니다. 주로 노이즈 감소 네트워크, 스타일 인식 립 전문가, 스타일 예측기의 세 부분으로 구성되어 있으며, 다음을 기반으로 할 수 있습니다.
12개월 전
040.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: 다중 지능형 신체 애플리케이션을 구축하기 위한 상탕의 오픈 소스 로우코드 개발 도구

포괄적인 소개 LazyLLM은 LazyAGI 팀이 개발한 오픈 소스 도구로, 다중 지능 대규모 모델 애플리케이션의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 개발자는 원클릭 배포와 가벼운 게이트웨이 메커니즘을 통해 복잡한 AI 애플리케이션을 빠르게 구축하여 지루한 엔지니어링 구성을 줄일 수 있습니다.
9개월 전
039.9K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: AI 기술을 통해 데이터 기반 R&D 프로세스를 촉진하는 자동화된 데이터 기반 R&D 도구

일반 소개 RD-Agent는 연구 개발(R&D) 프로세스를 자동화하고 최적화하도록 설계된 Microsoft의 오픈 소스 도구입니다. 이 도구는 인공 지능 기술을 통해 모델 및 데이터 개발의 효율성을 개선하기 위해 데이터 기반 시나리오에 초점을 맞추고 있으며, RD-Agent는 연구...
9개월 전
039.8K
Gemini Teacher:英语口语发音纠正助手

쌍둥이자리 선생님: 영어 말하기 발음 교정 도우미

일반 소개 제미니 선생님은 구글 제미니 AI를 기반으로 한 영어 말하기 연습 도우미입니다. 사용자의 영어 발음을 실시간으로 인식하고 즉각적인 피드백과 교정 제안을 제공합니다. 이 도구는 사용자가 다음을 통해 영어 말하기 능력을 향상시킬 수 있도록 설계되었습니다.
10개월 전
039.8K
MiniMind:2小时从零训练26M参数GPT的开源工具

미니마인드: 처음부터 2시간 동안 2600만 개의 매개변수를 교육하는 GPT 오픈 소스 도구

일반 소개 미니마인드는 개발자 징야오공이 만든 오픈 소스 프로젝트입니다. 미니마인드의 핵심 목표는 일반인들도 자신의 AI 모델을 빠르게 훈련할 수 있도록 하는 것입니다. 미니마인드의 주요 기능은 단일 NVIDIA에서 2시간을 사용하는 것입니다.
8개월 전
039.8K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 시각 언어 모델의 일반화 기능을 위한 저비용 강화 학습

종합 소개 R1-V는 저비용 강화 학습(RL)을 통해 시각 언어 모델링(VLM)의 획기적인 발전을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 검증 가능한 보상 메커니즘을 활용하여 VLM이 일반적인 수 세기 능력을 학습하도록 동기를 부여합니다. 놀랍게도, R1-V의 2B는 ...
10개월 전
039.6K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

제네시스: 실제 물리 기반의 4D 동적 월드 시뮬레이션을 위한 오픈 소스 제너레이티브 물리 엔진

일반 소개 Genesis는 범용 로봇 공학 및 구현형 AI 학습을 위해 설계된 제너레이티브 물리 세계입니다. 다양한 재료와 물리 현상의 시뮬레이션을 지원하는 통합 시뮬레이션 플랫폼을 제공하며, 제네시스는 제너레이티브 AI와 물리 시뮬레이션을 결합하여...
11개월 전
039.6K
Kokoro:高效语音合成模型,生成自然流畅的语音

Kokoro: 자연스럽고 부드러운 음성을 생성하는 효율적인 음성 합성 모델

일반 소개 Kokoro 82M은 더 적은 매개변수와 데이터로 고품질의 음성을 생성하도록 설계된 Hugging Face에서 제공하는 효율적인 음성 합성 모델입니다. 이 모델에는 8,200만 개의 파라미터가 있으며 Apache 2.0에 따라 라이센스가 부여되어 있습니다.
11개월 전
039.6K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly: 자동화된 기사 생성을 위한 무료 캔버스에서 프로세스 오케스트레이션을 기반으로 하는 AI 글쓰기 플랫폼

종합 소개 Refly는 멀티 스레드 대화, 지식 베이스 통합, 문맥 메모리 및 지능형 검색 기술을 통해 사용자가 아이디어를 고품질 콘텐츠로 전환할 수 있도록 설계된 무료 캔버스 기반 AI 네이티브 저작 엔진입니다. 이 플랫폼은 학습을 포함한 20개 이상의 전문 시나리오 템플릿을 지원합니다.
10개월 전
039.5K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

퍼플렉시카: 퍼플렉시 AI의 기능과 인터페이스를 1:1로 복제하는 오픈 소스 AI 검색 엔진

일반 소개 퍼플렉시카는 인터넷을 깊이 파고드는 답변을 제공하도록 설계된 오픈 소스 AI 기반 검색 엔진입니다. 유사성 검색 및 임베딩 기술과 같은 고급 머신 러닝 알고리즘을 사용하여 검색 결과를 최적화하고 인용된 출처와 함께 명확한 답변을 제공합니다.
1 년 전
039.5K
Dia:生成超现实多人对话的文本转语音模型

Dia: 초현실적인 멀티플레이어 대화 생성을 위한 텍스트 음성 변환 모델

일반 소개 Dia는 초현실적인 대화 오디오를 생성하는 데 중점을 두고 나리 랩스에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 텍스트 스크립트를 한 번의 프로세스로 사실적인 다중 문자 대화로 변환하고 감정과 억양 제어를 지원하며 비언어적 표현까지 생성합니다....
7개월 전
039.5K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AI가 책을 읽습니다: AI가 PDF 책을 한 페이지씩 읽고 지식의 요점을 자동으로 추출하여 요약을 생성합니다.

종합 소개 AI-reads-books-page-by-page는 PDF 책의 페이지별 분석을 자동화하고 핵심 지식 포인트를 추출하며 지정된 페이지 간격 후 단계를 생성하는 Python 기반 지능형 PDF 책 분석 도구입니다....
11개월 전
039.4K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

브라우저 사용: AI 인텔리전트가 브라우저를 쉽게 운영할 수 있는 지능형 웹 자동화 도구 구축

종합 소개 브라우저 사용은 언어 모델(LLM)이 웹사이트와 자연스럽게 상호 작용할 수 있도록 특별히 설계된 혁신적인 오픈 소스 웹 자동화 도구입니다. 이 도구는 강력하고 유연한 프레임워크를 제공하여 GPT-4, Claud... 등 다양한 주류 언어 모델을 지원합니다.
11개월 전
039.4K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: 도구 호출, 코드 인터프리터, RAG 및 Chrome 확장 프로그램을 포함한 지능형 에이전트 애플리케이션을 위한 Qwen 기반 프레임워크입니다.

종합 소개 Qwen-Agent는 명령 팔로잉, 도구 사용, 계획 및 메모리 등의 기능을 갖춘 Qwen 2.0 이상을 기반으로 개발된 지능형 에이전트 애플리케이션 프레임워크입니다. 이 프레임워크는 브라우저 어시스턴트, 코드 인터프리터 및 사용자 지정 어시스턴트와 같은 다양한 샘플 애플리케이션을 제공합니다....
12개월 전
039.4K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.
11개월 전
039.4K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: 유튜브 다운로더, 유튜브 비디오 무료 다운로드, 오디오 추출, 자막 가져오기

일반 소개 YTSage는 깔끔한 PyQt6 인터페이스를 갖춘 최신 YouTube 다운로드 도구입니다. 사용자는 YTSage를 사용하여 모든 화질의 동영상을 다운로드하고, 오디오를 추출하고, 자막(자동 생성 자막 포함)을 가져오고, 동영상의 메타 정보를 볼 수 있습니다.
11개월 전
039.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

액티브피스: AI 워크플로 자동화, 비기술 사용자를 위한 작업 스케줄링 도구, 오픈 소스 Zapier 대체 도구

일반 소개 Activepieces는 기업과 개인 사용자에게 직관적이고 강력한 자동화 솔루션을 제공하는 데 중점을 둔 오픈 소스 올인원 자동화 워크플로 플랫폼입니다. TypeScript로 개발된 이 플랫폼은 확장성이 뛰어나며 200개 이상의 통합 서비스를 지원합니다.
11개월 전
039.3K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS 생성기: AI를 통해 웹 콘텐츠를 RSS 피드로 변환하는 도구

일반 소개 AI RSS는 AI 기술을 통해 웹 콘텐츠를 RSS 피드로 변환하는 혁신적인 도구입니다. 브라우저 플러그인과 서버 측의 두 가지 주요 부분으로 구성됩니다. 브라우저 플러그인을 통해 사용자는 웹 페이지에서 목록을 선택하고 구조화된 데이터 설명(SDD) 파일을 생성할 수 있습니다.
10개월 전
039.3K
阿布量化交易系统:基于Python的开源量化交易平台

아부 퀀트 트레이딩 시스템: 파이썬 기반 오픈 소스 퀀트 트레이딩 플랫폼

일반 소개 아부 퀀트 트레이딩 시스템은 파이썬 기반의 오픈 소스 플랫폼입니다. 투자자가 코드를 통해 퀀트 트레이딩 전략을 구현할 수 있도록 사용자 "bbfamily"가 만들었습니다. 이 시스템은 주식, 옵션, 선물, 비트코인 등 다양한 금융상품의 백테스팅과 거래를 지원합니다. It...
8개월 전
039.2K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: 오픈 소스 대형 모델 인스턴트 메시징 로봇, 여러 WeChat, QQ, Flybook 및 기타 멀티 플랫폼 배포를 지원하는 AI 로봇.

LangBot은 여러 메시징 플랫폼과 대형 모델을 지원하는 대형 모델 기반 인스턴트 메시징 봇 플랫폼입니다. 이 플랫폼은 QQ, 위챗(기업용 위챗, 개인용 위챗), 플라이북, 디스코드, 원봇 및 기타 메시징 플랫폼에 맞게 조정되며, 오픈...
10개월 전
039.2K