AI 오픈 소스 프로젝트

총 1020개 문서
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 빠르고 제어 가능한 다국어(7000개 이상의 언어 지원) 텍스트 음성 변환 도구

일반 소개 IMS Toucan은 독일 슈투트가르트 대학교의 자연어 처리 연구소(IMS)에서 개발한 최첨단 텍스트 음성 변환(TTS) 툴킷입니다. 이 툴킷은 7000개 이상의 언어를 지원하며 빠르고 제어 가능하며 컴퓨팅 리소스 요구 사항이 낮습니다.IMS...
6개월 전
03.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

로컬 장치에서 여러 문서와 통신하여 데이터 프라이버시 보장: 로컬 장치에서 여러 문서와 통신하여 데이터 프라이버시 보장

일반 소개 LocalGPT는 사용자가 로컬 장치에서 문서와 대화할 수 있도록 설계된 오픈 소스 프로젝트로, 데이터 프라이버시를 보장합니다. 다양한 오픈 소스 모델을 사용하여 LocalGPT는 클라우드에 데이터를 업로드하지 않고도 문서 콘텐츠를 처리하고 이해할 수 있습니다. 이 프로젝트는 다양한 ...
8개월 전
03.1K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: 정지 이미지와 동영상에서 역동적인 인물 사진을 생성하는 애니메이션 도구

일반 소개 라이브포트트레이트는 레이서 테크놀로지에서 개발한 고급 AI 동적 인물 애니메이션 툴입니다. 혁신적인 AI 기술을 활용하여 정지 이미지를 생생한 비디오 애니메이션으로 변환합니다. 실제 사진, 애니메이션 스타일 또는 예술적 초상화를 사용하든 LivePo...
9개월 전
03.1K
Quantum Swarm:多智能体集群协作框架

퀀텀 스웜: 다중 인텔리전스 클러스터 협업을 위한 프레임워크

퀀텀 스웜은 AI 집단 지능 개발 및 연구에 중점을 둔 오픈 소스 인공 지능 프레임워크입니다. 이 프로젝트는 깃허브의 퀀텀 AI 팀에서 관리하며 다중 지능 시스템을 구축하고 테스트할 수 있는 유연하고 효율적인 플랫폼을 제공하는 것을 목표로 합니다.
7개월 전
03.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: AI가 컴퓨터를 직접 제어할 수 있도록 하는 클라우드의 제어 컴퓨터를 오픈 소스로 구현한 기능입니다.

일반 설명 Agent.exe는 사용자가 AI를 통해 로컬 컴퓨터를 직접 제어할 수 있도록 Anthropic의 클로드 3.5 소네트 API를 활용하는 오픈 소스 일렉트론 애플리케이션입니다. 이 프로젝트는 K...에 의해 개발되었습니다.
8개월 전
03.1K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: 다국어 이미지 텍스트를 생성하고 편집할 수 있으며, 이미지에 여러 줄의 중국어를 생성하도록 고도로 제어할 수 있습니다.

종합 소개 AnyText는 확산 모델을 기반으로 개발된 혁신적인 다국어 시각 텍스트 생성 및 편집 도구입니다. 이미지에서 자연스러운 고품질 다국어 텍스트를 생성하고 유연한 텍스트 편집 기능을 지원합니다. 연구팀이 개발하여 ICLR 2024에서 발표했습니다...
7개월 전
03.1K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: 워크플로 자동화 및 자율적 작업 실행을 위한 지능형 바디 구축 플랫폼

일반 설명 AutoGPT는 사용자가 지속적으로 실행되는 AI 에이전트를 생성, 배포, 관리하고 복잡한 워크플로를 자동화할 수 있도록 설계된 강력한 플랫폼입니다. 시그니피컨트 그라비타스에서 개발한 이 플랫폼은 사용자가 집중할 수 있는 다양한 도구와 기능을 제공합니다.
8개월 전
03.1K
Browse AI:无代码提取和监控结构化数据

AI 찾아보기: 코드 없이 구조화된 데이터 추출 및 모니터링

Browse Browse AI는 코딩 없이도 모든 웹사이트에서 데이터를 추출하고 모니터링할 수 있도록 설계된 클라우드 기반 웹 자동화 소프트웨어입니다. 마우스 클릭 한 번으로 데이터 추출, 모니터링 및 자동화 작업을 수행하도록 봇을 훈련시킬 수 있습니다....
11개월 전
03.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

일반 소개 RAGLite는 검색 증강 생성(RAG)을 위한 Python 툴킷으로, PostgreSQL 또는 SQLite 데이터베이스를 지원합니다. 사용자가 다양한 언어 모델과 재주문자를 선택할 수 있는 유연한 구성 옵션을 제공합니다....
9개월 전
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.
7개월 전
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

플라잉 패들 PP-TableMagic: 복잡한 테이블을 위한 구조화된 정보 추출

표 인식의 목표는 이미지에서 표를 구문 분석하여 표 구조와 셀 위치를 정확하게 식별하고 이를 구조화된 표 형식(예: HTML)으로 변환하는 것입니다. 오늘날의 정보화 시대에는 여전히 많은 양의 중요한 표 데이터가 비정형화된 상태로 존재합니다(예: 통계표 그림이 있는 스캔 문서...).
5개월 전
03K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

위챗-기사-내보내기: 원클릭으로 배포되는 위챗 공개 번호 기사 일괄 내보내기 도구

포괄적 인 소개 위챗 기사 내보내기 도구는 사용자가 위챗 공개 번호 기사를 일괄 내보낼 수 있도록 설계된 오픈 소스 도구입니다. 이 도구는 환경을 구축하지 않고도 기사에 포함 된 오디오 및 비디오를 내보내고, 100%가 기사 스타일을 복원하고, 비공개 부분을 지원할 수 있습니다.
10개월 전
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine: 검색 지식을 기반으로 미래 이벤트 발생 확률 예측하기

일반 소개 예보 AI는 첨단 인공지능 기술을 기반으로 한 뛰어난 예측 플랫폼입니다. 강력한 데이터 분석과 머신러닝 알고리즘을 사용하여 사용자에게 미래 이벤트에 대한 매우 정확한 예측을 제공합니다. 정치 선거, 경제 동향, 사회 이벤트 등 예측은 ...
11개월 전
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 메모리, 지식 및 도구로 AI 인텔리전스 구축

포괄적인 소개 PhiData는 지능형 AI 어시스턴트 개발을 위해 설계된 프레임워크입니다. 향상된 메모리, 지식 통합 및 도구 호출 기능을 통해 AI 어시스턴트가 장기적인 대화에 참여하고, 정확한 비즈니스 컨텍스트를 제공하며, 다양한 작업을 수행할 수 있도록 지원합니다.PhiData는 AI 어시스턴트의 기능을 향상시킬 뿐만 아니라...
5개월 전
03K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

비전만 있으면 충분합니다: 시각 언어 모델을 사용한 지능형 문서 검색 시스템 구축(Vision RAG)

종합 소개 Vision-is-all-you-need는 시각 언어 모델링(VLM)을 문서 처리 영역에 적용하는 새로운 지평을 여는 혁신적인 시각적 RAG(검색 증강 생성) 시스템 데모 프로젝트입니다. 기존의 텍스트 청킹 방식과 달리 이 시스템은 직접적으로 ...
7개월 전
03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

로보 블로거: 랭그래프 기반의 음성 콘텐츠에서 블로그 게시물 생성, 자동화된 블로그 작성

일반 소개 Robo Blogger는 음성-텍스트 기술을 통해 콘텐츠 생성 과정을 간소화하도록 설계된 혁신적인 블로그 생성 도구입니다. 사용자는 모든 음성-텍스트 애플리케이션을 통해 아이디어를 녹음할 수 있으며, Robo Blogger는 이러한 아이디어를 구조화된 블로그 콘텐츠로 변환합니다....
8개월 전
03K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: RAG 리콜 QA 정확도 및 답변 상관관계 평가하기

종합 소개 Ragas는 검색 증강 생성(RAG) 시스템을 평가하고 최적화하기 위해 특별히 고안된 도구입니다. 쿼리, 검색 컨텍스트, 생성된 답변 간의 관계를 분석하여 종합적인 평가 메트릭 세트를 제공합니다. 이러한 메트릭에는 충실도, 답변 관련성, 문맥 관련성 등이 포함됩니다.
7개월 전
03K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

일반 소개 DH_live는 샘플리스 학습을 기반으로 하는 실시간 라이브 디지털 휴먼 프로젝트로, 사용자에게 원활하고 인터랙티브한 라이브 스트리밍 경험을 제공하는 것을 목표로 합니다. 이 프로젝트는 NVIDIA 30 및 40 시리즈 그래픽 카드를 지원하며 25fps 이상에서 실시간으로 실행할 수 있습니다. 사용자는...
9개월 전
03K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: 실시간 시각 및 음성 상호 작용을 위한 오픈 소스 멀티모달 대규모 언어 모델

일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...
7개월 전
03K
FramePainter:AI驱动的涂鸦式图像编辑工具

프레임페인터: AI 기반 낙서 스타일의 이미지 편집 도구

일반 소개 프레임페인터는 고급 동영상 확산 기술과 직관적인 스케치 컨트롤을 활용하여 사용자가 복잡한 이미지 편집을 쉽게 할 수 있도록 도와주는 혁신적인 AI 기반 이미지 편집 도구입니다. 간단한 조정이든 복잡한 창의적 변형이든, 프레임페인터는 ...
7개월 전
03K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: 전문 4 패널 만화 일러스트레이션 제작 도구, 이미지 생성, 만화 페이지 편집

일반 소개 SP-MangaEditer는 만화 창작자를 위해 설계된 독립적인 만화 편집 플랫폼입니다. 이 플랫폼은 이미지 생성, 레이어 편집, 이미지 조정, 필터 적용 및 기타 여러 기능을 지원하여 사용자가 고품질의 만화 일러스트를 쉽게 만들 수 있도록 도와줍니다. 사용자는 간단하게 조작할 수 있습니다.
7개월 전
03K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisper 기반의 저지연 스트리밍 음성 인식을 위한 실시간 음성-텍스트 변환 도구

일반 소개 RealtimeSTT는 고급 음성 활동 감지 및 웨이크 워드 활성화 기능을 갖춘 효율적이고 지연 시간이 짧은 실시간 음성-텍스트 라이브러리입니다. 빠르고 정확한 음성-텍스트 변환이 필요한 애플리케이션을 지원하기 위해 콜야 베이겔이 개발했습니다.
7개월 전
03K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

종합 소개 "Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 마스터할 수 있도록 돕기 위해 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅됩니다...
6개월 전
03K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

페이 디지털 휴먼 프레임워크: 언어 모델과 3D 디지털 캐릭터를 통합하여 다양한 애플리케이션 시나리오 지원

종합 소개 페이는 가상 쇼핑 가이드, 가상 앵커, 비서, 웨이터, 교사, 음성 또는 텍스트 기반 모바일 비서 등 다양한 애플리케이션 시나리오를 위해 언어 모델과 디지털 캐릭터를 통합하는 오픈 소스 3D 가상 디지털 휴먼 프레임워크입니다.페이 프레임워크는 완전한 오프라인 사용을 지원하여 ...
7개월 전
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP 서버 ChatSum: MCP를 사용하여 Claude에서 WeChat 메시지 쿼리 및 요약하기

일반 소개 MCP 서버 ChatSum은 사용자가 채팅 메시지를 쿼리하고 요약할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅되며 사용자가 특정 매개변수를 기반으로 채팅 로그를 쿼리하고 해당 요약을 생성할 수 있는 강력한 도구 세트를 제공합니다....
5개월 전
03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: OpenAI 인터페이스로 변환된 경량 빅 모델 API, API 채널을 구성하기 위한 YAML 파일

포괄적인 소개 프런트엔드, 순수 구성 파일 구성 API 채널이 없습니다. 파일을 작성하기 만하면 자체 API 스테이션을 실행할 수 있으며 문서에는 흰색 친화적 인 자세한 구성 가이드가 있습니다. uni-api는 대규모 모델 API 프로젝트의 통합 관리로, 통합 된 ...
9개월 전
03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: 완전한 TypeScript 프로젝트를 빠르게 빌드하고 반복하는 오픈 소스 풀스택 AI 엔지니어

일반 소개 Srcbook은 AI 어시스턴트를 사용하여 웹 애플리케이션을 빠르게 만들고 반복할 수 있도록 설계된 TypeScript 중심 애플리케이션 개발 플랫폼입니다. 기본 런타임을 지원하고, 대화형 노트북 인터페이스를 제공하며, 사용자가 백엔드 코드를 작성하고 실행할 수 있습니다.
9개월 전
03K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: 혁신적인 음성 생성 및 음성 복제 도구

종합적인 소개 GPT-SoVITS는 오픈 소스 음성 변환 및 합성 도구로, GPT 모델과 SoVITS 보이스 체인저 기술을 결합한 것입니다. 이 도구는 샘플이 전혀 없거나 적은 상태에서 즉석에서 텍스트를 음성으로 변환하고 5초의 오디오 샘플만으로 음성 스타일 마이그레이션을 지원합니다. 그 기능에는 교차 언어가 포함됩니다 ...
11개월 전
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

레이캐스트-G4F: 레이캐스트를 통해 GPT-4, 라마-3 및 기타 여러 AI 모델에 무료로 액세스하세요!

일반 소개 레이캐스트-G4F(GPT4Free)는 사용자가 GPT-4, 라마-3을 포함한 다양한 고급 AI 모델에 무료로 액세스할 수 있는 강력한 레이캐스트 확장 프로그램입니다. 이 확장 프로그램은 실시간 대화 스트리밍을 제공할 뿐만 아니라...
7개월 전
03K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

프롬프타이머: 대형 모델 프롬프트 단어를 최적화하는 실험적인 라이브러리로, 프롬프트를 자동으로 최적화합니다.

일반 소개 프롬프타이마이저는 사용자가 AI 시스템의 단서를 체계적으로 개선할 수 있도록 설계된 실험적인 단서 단어 최적화 라이브러리입니다. 프롬프타이마이저는 최적화 프로세스를 자동화함으로써 특정 작업에서 프롬프트 단어의 성능을 향상시킬 수 있습니다. 사용자는 다음 정보만 제공하면 됩니다.
9개월 전
03K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 자연어 설명으로 비디오 검색, 편집 및 생성 워크플로우를 수행하는 지능형 비디오 에이전트 프레임워크입니다.

개요 Director는 지능형 비디오 에이전트를 구축하여 비디오 상호 작용 및 워크플로우를 간소화하고 최적화하도록 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 VideoDB의 '데이터형 비디오' 인프라를 기반으로 하며 검색, 편집, 컴파일, 생성 등 복잡한 비디오 작업을 처리할 수 있습니다.
8개월 전
03K
MiniMind:2小时从零训练26M参数GPT的开源工具

미니마인드: 처음부터 2시간 동안 2600만 개의 매개변수를 교육하는 GPT 오픈 소스 도구

일반 소개 미니마인드는 개발자 징야오공이 만든 오픈 소스 프로젝트입니다. 미니마인드의 핵심 목표는 일반인들도 자신의 AI 모델을 빠르게 훈련할 수 있도록 하는 것입니다. 미니마인드의 주요 기능은 단일 NVIDIA에서 2시간을 사용하는 것입니다.
5개월 전
03K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: 고품질 휴먼 액션 동영상 생성을 위한 오픈 소스 동영상 모델

일반 소개 SkyReels-V1은 인간 중심의 고품질 동영상 콘텐츠 제작에 초점을 맞춘 SkyworkAI 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 수천만 개의 고품질 영화 및 텔레비전 클립을 통해 HunyuanVideo 모델을 기반으로 합니다.
6개월 전
03K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: 오픈 소스 프로그래밍 보조 도구, 코드 작성 및 파일 편집에 AI 어시스턴트 사용

일반 소개 Aider는 개발자가 자연어 대화를 통해 코드를 작성, 편집 및 리팩터링할 수 있도록 도와주는 강력한 오픈 소스 AI 프로그래밍 보조 도구입니다. 대화형 AI 쌍 프로그래밍 도구인 Aider는 여러 주요 프로그래밍 언어를 지원하며 Git에 원활하게 통합할 수 있습니다.
4개월 전
03K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: 객실 사진을 업로드하고 AI를 사용하여 다시 디자인하세요!

일반 소개 RoomGPT는 사용자가 방 사진을 업로드하고 인공지능 기술을 사용하여 새롭게 디자인된 버전을 생성할 수 있는 GitHub 사용자 Nutlope가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자가 비싼 디자이너 비용 없이 전문가 수준의 인테리어 디자인을 이용할 수 있도록 하는 것을 목표로 합니다....
9개월 전
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse: 각 유형의 문서를 LLM 사용 가능한 데이터로 구문 분석하여 표와 그림 등 문서의 모든 정보를 전체적으로 보존합니다.

일반 소개 MegaParse는 대규모 언어 모델(LLM)의 데이터 처리를 최적화하도록 설계된 강력하고 다재다능한 문서 구문 분석 도구입니다. 텍스트, PDF, PowerPoint 프레젠테이션, Word 문서 등 어떤 작업을 하든 MegaParse...
8개월 전
03K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: 명령을 이해하고 하위 작업으로 분할하여 코드를 작성하는 오픈 소스 AI 소프트웨어 엔지니어 인텔리전스

일반 소개 Devika는 인간의 높은 수준의 지시를 이해하고, 이를 단계별로 세분화하여 관련 정보를 연구하고, 주어진 목표를 달성하기 위해 코드를 작성하는 고급 AI 소프트웨어 엔지니어입니다. 대규모 언어 모델, 계획 및 추론 알고리즘, 웹 브라우징 기능을 사용하여 소프트웨어를 지능적으로 개발합니다....
5개월 전
03K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: 컴퓨터 비전 프로젝트의 효율성을 높여주는 무료 이미지 주석 도구

일반 소개 Make Sense는 사용자가 컴퓨터 비전 프로젝트를 위한 데이터 세트를 빠르게 준비할 수 있도록 설계된 무료 온라인 이미지 주석 도구입니다. 복잡한 설치 없이 브라우저에 액세스하기만 하면 사용할 수 있고, 여러 운영 체제를 지원하며, 소규모 딥 러닝 프로젝트에 이상적입니다. 사용자는 다음을 수행할 수 있습니다.
6개월 전
03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

텍스트 디스틸러: 한 번의 클릭으로 책 전체를 요약하고, 책의 내용을 효율적으로 추출하고, 핵심 아이디어를 빠르게 파악할 수 있습니다.

종합 소개 TextDistiller는 책을 챕터별로 또는 전체적으로 요약하여 간결하면서도 포괄적인 개요를 제공하도록 설계된 고급 AI 기반 도구입니다. 텍스트 디스틸러를 사용하면 어떤 책이든 핵심 아이디어와 요점을 빠르게 파악할 수 있습니다.
8개월 전
03K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: 오픈 소스 AI 북마크 관리 도구, 여러 형식 지원, 지능형 태그 분류, 전체 텍스트 검색

일반 설명 Hoarder는 링크, 노트, PDF, 이미지의 저장을 지원하는 자체 호스팅 북마크 관리 도구입니다. 자동 태그 지정에 AI 기술을 사용하며 전체 텍스트 검색 기능을 제공합니다. 사용자는 크롬 플러그인과 파이어폭스 플러그인을 사용할 수 있습니다...
8개월 전
03K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: 이미지 단서 단어의 일괄 역전파를 위한 오픈 소스 경량 시각 언어 모델

종합 소개 Moondream은 딥러닝과 컴퓨터 비전 기술을 통해 이미지 설명 기능을 구현하도록 설계된 오픈 소스 경량 시각 언어 모델입니다. 이 모델은 다양한 플랫폼에서 효율적으로 실행할 수 있으며 특히 엣지 디바이스에 적합합니다.Moondream은 고급 기술을 사용하며...
7개월 전
03K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: 소스 코드 읽기 도구, LLM을 사용하여 코드를 분석하고, 자세한 코드 설명을 제공하고, 다양한 프로그래밍 언어를 지원합니다.

일반 소개 askrepo는 LLM(대규모 언어 모델)을 기반으로 하는 소스 코드 읽기 도구입니다. 지정된 디렉터리에 있는 Git 관리 텍스트 파일의 내용을 읽고 Google Gemini API로 전송하여 지정된 프롬프트에 따라 질문에 대한 답변을 제공할 수 있습니다.
9개월 전
03K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: 다양한 트랜잭션을 효율적으로 처리하기 위해 많은 단서 단어를 통합하는 AI 오픈 소스 워크플로우 프레임워크입니다.

일반 소개 Fabric은 일상적인 컴퓨터 작업을 단순화 및 자동화하고 인공 지능을 더 쉽게 사용할 수 있도록 Daniel Miessler가 개발한 오픈 소스 AI 프레임워크입니다. 모듈식 설계와 사전 정의된 프롬프트 단어(패턴)를 통해 사용자가 효율적으로 사용할 수 있도록 도와줍니다...
10개월 전
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: 멀티모달 검색 및 지식 그래프 구성을 지원하여 매우 긴 동영상을 이해하기 위한 RAG 프레임워크입니다.

포괄적인 소개 VideoRAG는 매우 긴 컨텍스트 비디오를 처리하고 이해하도록 설계된 검색 강화 생성 프레임워크입니다. 이 도구는 그래프 중심의 텍스트 지식 기반과 계층적 멀티모달 컨텍스트 인코딩을 결합하여 단일 NVIDIA RTX 3090 GPU에서 효율적으로 처리합니다....
6개월 전
03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: 문서 채팅 도우미, 단일 문서, 웹 소스에서 신뢰할 수 있는 답변 얻기, 로컬 배포 지원

일반 소개 DocsGPT는 프로젝트 문서 쿼리 프로세스를 간소화하도록 설계된 오픈 소스 문서 도우미입니다. 강력한 GPT 모델을 통합하여 개발자는 프로젝트에 대해 쉽게 질문하고 정확한 답변을 얻을 수 있으며, DocsGPT는 로컬 배포를 지원하여 데이터 프라이버시를 보장하는 동시에...
9개월 전
03K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

소닉: 오디오 기반 인물 이미지로 생생한 얼굴 표정이 담긴 디지털 데모 동영상 생성

일반 소개 Sonic은 글로벌 오디오 인식에 초점을 맞춘 혁신적인 플랫폼으로, 오디오를 기반으로 생생한 인물 애니메이션을 생성하는 것을 목표로 합니다. 텐센트와 저장대학교의 연구팀이 개발한 이 플랫폼은 오디오 정보를 사용하여 얼굴 표정과 머리 움직임을 제어하여 자연스럽고 부드러운 애니메이션 동영상을 생성합니다....
4개월 전
03K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: Tencent ARC에서 출시한 이미지 복원 및 편집을 위한 올인원 도구

종합 소개 BrushEdit는 Tencent ARC Labs에서 개발한 올인원 이미지 복구 및 편집 도구입니다. 이 도구는 최신 AI 기술을 기반으로 하며 이미지의 결함을 자동으로 식별하고 복구하는 동시에 사용자의 대화형 편집을 지원할 수 있으며, BrushEdit는 다양한 기능을 결합합니다.
8개월 전
03K
xyks:小猿口算逆向笔记,逆向工程与解密算法

XYKS: 소형 유인원 구두 계산 리버스 노트, 리버스 엔지니어링 및 복호화 알고리즘

포괄적인 소개 유인원 입 계산기 리버스 노트는 유인원 입 계산기 애플리케이션을 리버스 엔지니어링하는 과정과 방법을 문서화하고 공유하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트에는 사용자가 작은 유인원 구강 산술 추가를 이해하고 해독하는 데 도움이 되는 지침을 사용하기 위한 다양한 리버스 도구 및 기술(예: Frida, dexdump 등)이 포함되어 있습니다.
10개월 전
03K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 대규모 언어 모델의 효율적인 미세 조정 및 학습을 위한 오픈 소스 도구

종합 소개 Unsloth는 대규모 언어 모델(LLM)을 미세 조정하고 학습하기 위한 효율적인 도구를 제공하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 라마, 미스트랄, 파이, 젬마 등 잘 알려진 다양한 모델을 지원합니다.Unsloth의...
6개월 전
02.9K
Second Me:本地训练拥有个人记忆和习惯的AI分身

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

Second Me는 Mindverse 팀이 개발한 오픈 소스 프로젝트로, 컴퓨터에서 '디지털 도플갱어'처럼 행동하는 AI를 만들어 사용자의 말과 기억을 통해 사용자의 말 패턴과 습관을 학습하고 사용자의 말을 이해하는 똑똑한 사람이 될 수 있게 해줍니다.
5개월 전
02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

500개 이상의 연구 도구를 통합하여 연구 및 과학 작업을 자동화하는 인텔리전스, SciToolAgent

종합 소개 SciToolAgent는 항저우 절강대학교 혁신 센터(HICAI-ZJU)에서 개발한 오픈 소스 도구 플랫폼입니다. 지식 그래프(SciToolKG)와 빅 언어 모델링 기술을 통해 500개 이상의 과학 도구를 통합하여 연구자들이 다음과 같은 문제를 처리할 수 있도록 지원합니다.
5개월 전
02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git 리포지토리 텍스트 파일을 읽고 대형 모델을 위해 빠르게 청크 처리하기

일반 소개 Yek은 저장소나 디렉터리에서 텍스트 파일을 읽고, 청크화하여 대규모 언어 모델(LLM)에서 사용하기 위해 직렬화하기 위한 빠른 Rust 기반 도구입니다. 이 도구는 기본적으로 .gitignore 규칙을 사용하여 불필요한 파일을 건너뛰고, ...
7개월 전
02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: 기본 Ollama 모델과 상호 작용할 수 있는 깔끔한 채팅 인터페이스

일반 소개 HiOllama는 Python과 Gradio를 기반으로 구축된 사용자 친화적인 인터페이스로, 올라마 모델과 상호 작용하도록 설계되었습니다. 실시간 텍스트 생성 및 모델 관리 기능을 지원하는 간단하고 직관적인 웹 인터페이스를 제공합니다. 사용자는 온도와 같은 매개변수를 조정할 수 있으며 대부분의 ...
9개월 전
02.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: 유튜브 다운로더, 유튜브 비디오 무료 다운로드, 오디오 추출, 자막 가져오기

일반 소개 YTSage는 깔끔한 PyQt6 인터페이스를 갖춘 최신 YouTube 다운로드 도구입니다. 사용자는 YTSage를 사용하여 모든 화질의 동영상을 다운로드하고, 오디오를 추출하고, 자막(자동 생성 자막 포함)을 가져오고, 동영상의 메타 정보를 볼 수 있습니다.
8개월 전
02.9K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: 사진 및 비디오를 애니메이션 스타일로 변환하는 오픈 소스 도구

일반 소개 DCT-Net은 이미지의 애니메이션 스타일 변환을 목표로 북경대학교 왕쉬안 컴퓨터 기술 연구소와 DAMO 아카데미에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 도메인 캘리브레이션 번역(Domain-Calibrat...
7개월 전
02.9K
E2B:安全云沙箱中的AI代码运行平台

E2B: 안전한 클라우드 샌드박스에서 AI 코드를 실행하는 플랫폼

일반 소개 E2B는 안전한 클라우드 샌드박스에서 AI 생성 코드를 실행하도록 설계된 오픈 소스 플랫폼입니다. 다양한 프로그래밍 언어와 프레임워크를 지원하고 격리된 가상 환경을 제공하여 코드 실행의 보안과 안정성을 보장하며, E2B는 데이터 파티셔닝을 비롯한 다양한 AI 애플리케이션 시나리오에 적합합니다.
7개월 전
02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...
7개월 전
02.9K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: 인물 사진을 지브리 스타일의 이미지로 변환하는 무료 도구

일반 소개 EasyControl은 오픈 소스 프로젝트로, 효율적이고 유연한 이미지 생성 제어를 제공하기 위해 확산 변압기(DiT) 아키텍처를 기반으로 합니다. 그중에서도 지브리 컨트롤 LoRA는 100개의 서브만 사용하여 특별한 기능 중 하나입니다.
4개월 전
02.9K
HivisionIDPhotos:开源智能AI证件照制作工具

하이비전ID사진: 오픈 소스 지능형 AI 사진 신분증 생성 도구

종합 소개 HivisionIDPhotos는 오픈 소스 경량 AI 문서 사진 제작 도구로, 사용자 사진 장면과 키잉을 지능적으로 식별하여 다양한 사양에 맞는 표준 문서 사진을 생성할 수 있습니다. 이 도구는 사용자 정의 배경 색상과 크기를 지원하며 향후 뷰티 및 ...
11개월 전
02.9K
ANP:实现智能代理间安全高效通信的开源协议

ANP: 지능형 에이전트 간의 안전하고 효율적인 통신을 위한 오픈 소스 프로토콜

일반 소개 에이전트네트워크프로토콜(줄여서 ANP)은 지능형 에이전트(AI 에이전트)를 위한 안전하고 효율적인 커뮤니케이션 솔루션을 제공하는 데 중점을 둔 오픈 소스 프로토콜 프로젝트로, GitHub에서 호스팅되고 있습니다. 이 프로젝트는 ID와 암호화의 3계층 아키텍처를 통해 작동합니다...
5개월 전
02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: 지식 베이스 + LLM 기반 지능형 코드 검토 멘토(GitHub용)

종합 소개 CR-Mentor는 전문 지식 베이스와 LLM(대규모 언어 모델링)의 강력한 기능을 결합한 지능형 코드 리뷰 도구입니다. 모든 프로그래밍 언어에 대한 코드 리뷰를 지원할 뿐만 아니라 지식 기반에 축적된 모범 사례를 기반으로 팀을 위한 전용 검토 기준과 집중 영역을 사용자 지정할 수 있습니다. 다음을 통해...
9개월 전
02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: 복잡한 형식의 문서를 구문 분석하고 멀티모달 데이터를 메타데이터와 텍스트로 추출합니다.

포괄적인 소개 NV Ingest(NVIDIA Ingest)는 수십만 개의 복잡하고 지저분한 비정형 PDF 및 기타 엔터프라이즈 문서를 구문 분석하도록 설계된 조기 액세스 마이크로서비스 제품군입니다. 이러한 문서를 메타데이터 및 텍스트로 변환하여 검색에 포함할 수 있습니다.
7개월 전
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: 멀티모달 콘텐츠 구문 분석 및 지식 그래프와 하이브리드 검색의 결합을 위한 고급 AI 검색(RAG) 시스템

종합 소개 R2R(RAG to Riches)은 프로덕션에 바로 사용할 수 있는 기능을 갖춘 검색 증강 생성(RAG) 기능을 지원하는 고급 AI 검색 시스템입니다. 컨테이너화된 RESTful API를 기반으로 구축된 이 시스템은 멀티모달 콘텐츠 구문 분석, 하이브리드 검색 기능 등을 제공합니다.
8개월 전
02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: 모듈식 RAG 애플리케이션을 구축하고 다양한 RAG 전략을 신속하게 테스트하기 위한 오픈 소스 프레임워크

포괄적인 소개 Cognita는 RAG(검색 증강 세대) 기반 애플리케이션의 개발을 간소화하기 위해 TrueFoundry에서 개발한 오픈 소스 프레임워크입니다. 이 프레임워크는 구조화되고 수정 가능한 ...
7개월 전
02.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

컴피유 디스티 플로우: 워크플로우를 간소화하는 컴피유 사용자 친화적 인터페이스

일반 소개 ComfyUI-disty-Flow는 ComfyUI에 사용자 친화적인 인터페이스를 제공하는 사용자 정의 노드입니다. 이 노드는 워크플로우 생성을 위한 대체 사용자 인터페이스를 제공하여 워크플로우 실행을 단순화하기 위한 것입니다.ComfyUI-disty...
7개월 전
02.9K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS: 개인화된 팟캐스트 음성 훈련 및 합성

Synthesis Muyan-TTS는 팟캐스트 시나리오를 위해 설계된 오픈 소스 텍스트 음성 변환(TTS) 모델입니다. 100,000시간 이상의 팟캐스트 오디오 데이터로 사전 학습되었으며 제로 샘플 음성 합성을 지원하여 고품질의 자연스러운 음성을 생성합니다. 이 모델은 Llama-3.2-3...을 기반으로 합니다.
3 개월 전
02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원

종합 소개 컬러는 잠재적 확산 기법을 기반으로 Racer 팀에서 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍에 대해 학습되었으며 중국어와 영어 입력을 모두 지원하여 의미적으로 정확한 고품질의 복잡한 이미지를 생성할 수 있습니다.시각적 품질의 컬러...
8개월 전
02.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: 검색 향상 생성 시스템 최적화를 위한 시각적 평가 도구

종합 소개 XRAG(eXamining the Core)는 고급 검색 증강 생성(RAG) 시스템의 기본 구성 요소를 평가하기 위해 고안된 벤치마킹 프레임워크입니다. 각 핵심 모듈을 프로파일링하고 분석함으로써 XRAG는 다양한 구성과 구성 요소가 RAG에 어떤 영향을 미치는지에 대한 정보를 제공합니다.
7개월 전
02.9K
Supermemory:导入书签和网页内容构建个人知识库

슈퍼메모리: 북마크 및 웹 콘텐츠를 가져와 개인 지식창고 구축하기

일반 소개 슈퍼메모리는 사용자가 '제2의 두뇌'를 구축할 수 있도록 설계된 오픈소스 프로젝트입니다. 강력한 Chrome 확장 프로그램과 AI 기술을 통해 사용자는 웹페이지, 트위터 북마크 등에서 데이터를 쉽게 저장, 정리, 검색할 수 있습니다.
6개월 전
02.9K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: 오픈 소스 대형 모델 인스턴트 메시징 로봇, 여러 WeChat, QQ, Flybook 및 기타 멀티 플랫폼 배포를 지원하는 AI 로봇.

LangBot은 여러 메시징 플랫폼과 대형 모델을 지원하는 대형 모델 기반 인스턴트 메시징 봇 플랫폼입니다. 이 플랫폼은 QQ, 위챗(기업용 위챗, 개인용 위챗), 플라이북, 디스코드, 원봇 및 기타 메시징 플랫폼에 맞게 조정되며, 오픈...
6개월 전
02.9K