AI 오픈 소스 프로젝트

총 1020개 문서
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

머니프린터터터보: 동영상 테마를 입력하여 한 번의 클릭으로 동영상 사본과 짧은 HD 동영상을 생성합니다.

종합 소개 머니프린터터터보는 고급 AI 빅 모델 기술을 사용하여 한 번의 클릭으로 짧은 HD 동영상을 생성하는 기능을 달성하는 오픈 소스 프로젝트입니다. 사용자는 비디오 테마 또는 키워드만 제공하면 시스템이 자동으로 비디오 카피, 비디오 클립, 비디오 자막 등을 생성합니다.
9개월 전
035.5K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

레파: 고충실도 모델 가상 트라이얼 및 캐릭터 포즈 조정, 메타 오픈 소스 제어 캐릭터 이미지 생성 모델

개요 레파는 제어 가능한 캐릭터 이미지를 생성하기 위한 통합 프레임워크로, 캐릭터의 외형(예: 가상 피팅)과 포즈(예: 포즈 전송)를 정밀하게 조작할 수 있습니다. 이 프레임워크는 대상 쿼리가 주의 레이어에서 올바른 참조 키에 집중하도록 지시하여 세밀한 디테일의 왜곡을 크게 줄입니다.
12개월 전
035.5K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCP 서버 ChatSum: MCP를 사용하여 Claude에서 WeChat 메시지 쿼리 및 요약하기

일반 소개 MCP 서버 ChatSum은 사용자가 채팅 메시지를 쿼리하고 요약할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅되며 사용자가 특정 매개변수를 기반으로 채팅 로그를 쿼리하고 해당 요약을 생성할 수 있는 강력한 도구 세트를 제공합니다....
9개월 전
035.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

오픈 캔버스: 코드 편집 협업 캔버스, OpenAI 캔버스/클라우드 아티팩트 오픈 소스 버전

일반 소개 LangChain은 내장된 이중 에이전트 메모리 기능과 전체 실행 세부 사항을 관찰할 수 있는 통합 스미스를 통해 문서 편집 및 협업 경험을 향상하도록 설계된 오픈 소스 웹 애플리케이션인 오픈 캔버스를 선보입니다. 이 플랫폼은 오픈에이...
9개월 전
035.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.
10개월 전
035.4K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.
10개월 전
035.4K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

종합 소개 "Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 마스터할 수 있도록 돕기 위해 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅됩니다...
9개월 전
035.4K
HivisionIDPhotos:开源智能AI证件照制作工具

하이비전ID사진: 오픈 소스 지능형 AI 사진 신분증 생성 도구

종합 소개 HivisionIDPhotos는 오픈 소스 경량 AI 문서 사진 제작 도구로, 사용자 사진 장면과 키잉을 지능적으로 식별하여 다양한 사양에 맞는 표준 문서 사진을 생성할 수 있습니다. 이 도구는 사용자 정의 배경 색상과 크기를 지원하며 향후 뷰티 및 ...
1 년 전
035.3K
Novel:模仿Notion AI的开源写作编辑器

Novel: Notion AI를 모방한 오픈 소스 글쓰기 편집기

포괄적 인 소개 이것은 Novel이라고 불리는 Steven Tey가 개발 한 오픈 소스 프로젝트로, 사용자가 텍스트 입력의 효율성을 향상시키는 데 도움이되는 통합 AI 자동 완성 기능인 Notion 스타일 WYSIWYG 텍스트 편집기입니다. 이 프로젝트는 자세한 문서 및 설치 지침을 제공합니다 ...
1 년 전
035.3K
Knowledge Table:高效提取与探索结构化数据的开源工具

지식 테이블: 구조화된 데이터의 효율적인 추출과 탐색을 위한 오픈 소스 도구

종합 소개 지식 테이블(Knowledge Table)은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 추출 사용자 지정을 지원합니다 ...
1 년 전
035.3K
AI Podcast Generator:自动抓取新闻生成音频播客

AI 팟캐스트 생성기: 뉴스를 자동으로 캡처하여 오디오 팟캐스트 생성하기

일반 소개 AI 팟캐스트 생성기는 고급 AI 기술을 사용하여 웹 소스에서 매력적인 오디오 콘텐츠를 자동으로 생성하는 지능형 팟캐스트 생성 도구입니다. 이 시스템은 뉴스 콘텐츠를 캡처하여 오디오 팟캐스트로 변환함으로써 자연스럽게 흐르는 내러티브를 생성합니다. 이 프로젝트는 다음...
1 년 전
035.3K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 입력 텍스트에서 화자별 텍스트 음성 변환 모델 생성

일반 소개 Parler-TTS는 고품질의 자연스러운 음성을 생성하도록 설계된 Hugging Face에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델 라이브러리입니다. 이 모델은 특정 화자 스타일(예: 성별, 음조, 말하기 스타일 등)을 가진 입력 텍스트를 기반으로 음성을 생성할 수 있습니다.
10개월 전
035.3K
Coding Agent:基于Langgraph构建的简单编程助手

코딩 에이전트: 랭그래프 기반의 간단한 프로그래밍 도우미

일반 소개 코딩 에이전트는 개발자의 프로그래밍 효율성 향상을 돕기 위해 AbhinavTheDev에서 개발한 지능형 프로그래밍 어시스턴트입니다. 이 도구는 인공 지능 기술을 사용하여 자동으로 코드를 생성하고, 프로그래밍 제안을 제공하며, 개발자에게 다양한 코딩을 지원합니다.
10개월 전
035.3K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: 모듈식 RAG 애플리케이션을 구축하고 다양한 RAG 전략을 신속하게 테스트하기 위한 오픈 소스 프레임워크

포괄적인 소개 Cognita는 RAG(검색 증강 세대) 기반 애플리케이션의 개발을 간소화하기 위해 TrueFoundry에서 개발한 오픈 소스 프레임워크입니다. 이 프레임워크는 구조화되고 수정 가능한 ...
10개월 전
035.3K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: 웹 데이터를 자동으로 크롤링하여 API 또는 스프레드시트로 변환하는 코드가 필요 없는 오픈 소스 플랫폼입니다.

종합 소개 Maxun은 오픈 소스 노코드 웹 데이터 추출 플랫폼으로, 사용자가 몇 분 안에 로봇을 훈련시켜 웹 데이터를 자동으로 크롤링하고 이를 API 또는 스프레드시트로 변환할 수 있습니다. 이 플랫폼은 페이징과 스크롤을 지원하고, 웹사이트 레이아웃 변경에 적응하며, 강력한 데이터 크롤링 기능을 제공합니다.
11개월 전
035.2K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: 나만의 퍼플렉서티 검색 엔진을 배포할 수 있는 오픈 소스 AI 검색 엔진 프레임워크!

종합 소개 MindSearch는 상하이 인공 지능 연구소(SAL)에서 출시한 오픈 소스 AI 검색 엔진 프레임워크로, 복잡한 정보 수집 및 통합을 위한 인간의 사고 과정을 시뮬레이션하는 것을 목표로 합니다. 이 도구는 다중 지능을 통해 대규모 언어 모델링(LLM)과 검색 엔진의 고급 기술을 결합합니다....
11개월 전
035.2K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: 정지 이미지와 동영상에서 역동적인 인물 사진을 생성하는 애니메이션 도구

일반 소개 라이브포트트레이트는 레이서 테크놀로지에서 개발한 고급 AI 동적 인물 애니메이션 툴입니다. 혁신적인 AI 기술을 활용하여 정지 이미지를 생생한 비디오 애니메이션으로 변환합니다. 실제 사진, 애니메이션 스타일 또는 예술적 초상화를 사용하든 LivePo...
1 년 전
035.2K
MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音

모킹버드: 빠른 음성 복제 및 모델 학습, xtts v2 기반 텍스트 음성 변환

종합적인 소개 모킹버드는 AI 기술을 통해 빠른 음성 복제와 텍스트 음성 변환을 목표로 하는 오픈 소스 프로젝트입니다. 사용자는 5초 분량의 음성 샘플만 제공하면 모든 음성 콘텐츠를 생성할 수 있습니다. 이 프로젝트는 다양한 중국어 데이터 세트를 지원하며 Windows에서는 ...
12개월 전
035.2K
PromptWizard:优化提示工程的开源框架,提升任务性能

프롬프트 마법사: 프롬프트 프로젝트를 최적화하여 작업 성능을 향상시키는 오픈 소스 프레임워크

개요 PromptWizard는 Microsoft에서 개발한 오픈 소스 프레임워크로, 모델이 스스로 프롬프트 단어를 생성, 평가 및 개선하고 예제를 생성하여 지속적인 피드백을 통해 출력 품질을 개선할 수 있는 자체 진화 메커니즘을 사용합니다. 프롬프트 단어를 자율적으로 최적화하고 적절한 예제를 생성 및 선택할 수 있으며, ...
11개월 전
035.2K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: 프런트엔드 디자인을 위한 오픈 소스 커서, React 애플리케이션에서 코드를 디자인하고 게시하세요.

일반 소개 Onlook은 디자이너와 개발자를 위해 만들어진 오픈 소스 디자인 도구로, 사용자가 실행 중인 React 애플리케이션에서 직접 디자인하고 디자인 변경 사항을 코드로 변환할 수 있습니다. 이 도구는 Figma나 Webf...와 유사한 직관적인 시각적 편집 환경을 제공합니다.
10개월 전
035.2K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

만화 닌자: 애니메이션 흑백 선화를 빠르게 색칠할 수 있는 자동 선 채색 도구입니다.

종합 소개 만화닌자는 알리바바 통이 시각지능연구소(Ali-Vilab)에서 개발한 오픈소스 프로젝트로, 선화 채색 자동 처리에 중점을 두고 있습니다. 이 도구는 딥러닝 기술을 통해 참조 이미지의 정확한 색상 일치를 달성하여 크게 개선된 ...
10개월 전
035.2K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: 멀티모달 입력으로 캐릭터 일관성 있는 이미지를 생성하는 통합 이미지 생성 모델

일반 소개 OmniGen은 벡터스페이스랩에서 개발한 "범용" 이미지 생성 모델로, 간단한 텍스트 프롬프트 또는 멀티모달 입력으로 다양하고 맥락이 풍부한 비주얼을 생성할 수 있습니다. 특히 인식이 필요한 애플리케이션에 적합합니다...
1 년 전
035.2K
自动爬取小说并生成多角色有声书的工具

소설을 자동으로 크롤링하여 여러 문자의 오디오북을 생성하는 도구

일반 소개 자동 오디오북은 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 웹사이트에서 소설 콘텐츠를 자동으로 크롤링하여 여러 캐릭터의 목소리가 담긴 오디오북으로 변환합니다. 파이썬 3.1을 사용하는 zqq-nuli 개발자...
8개월 전
035.1K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

이중 언어 북 메이커: AI 번역을 사용하여 이중 언어 전자책, 전체 책 자동 번역 도구를 만들 수 있습니다.

일반 소개 이중 언어 북 메이커는 사용자가 AI 기술을 사용하여 다국어 버전의 전자책을 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 주로 번역을 위해 ChatGPT를 사용하며 epub, txt 및 srt를 포함한 여러 파일 형식을 지원합니다.
10개월 전
035.1K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT 에이전트: 복잡한 표 형식의 데이터를 분석하도록 설계된 지능형 도구

종합 소개 TableGPT 에이전트는 표 형식의 데이터를 처리하고 분석하기 위해 설계된 GitHub 오픈 소스 프로젝트에 기반한 지능형 도구입니다. TableGPT2 빅 언어 모델에 의존하며 자연어 상호 작용을 사용하여 사용자가 쉽게 쿼리하고 조작할 수 있도록 합니다.
9개월 전
035.1K
Easy Voice Toolkit:本地部署的AI语音工具箱

간편한 음성 툴킷: 로컬 배포를 위한 AI 음성 툴킷

개요 Easy-Voice-Toolkit은 오픈 소스 음성 프로젝트에 기반한 다기능 툴킷으로 음성 인식, 음성 전사, 음성 변환, 데이터 세트 생성 및 모델 학습을 위한 다양한 자동화된 오디오 도구를 제공합니다. 사용자는 필요에 따라 이러한 도구를 선택적으로 사용할 수 있습니다...
1 년 전
035.1K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: 이미지 단서 단어의 일괄 역전파를 위한 오픈 소스 경량 시각 언어 모델

종합 소개 Moondream은 딥러닝과 컴퓨터 비전 기술을 통해 이미지 설명 기능을 구현하도록 설계된 오픈 소스 경량 시각 언어 모델입니다. 이 모델은 다양한 플랫폼에서 효율적으로 실행할 수 있으며 특히 엣지 디바이스에 적합합니다.Moondream은 고급 기술을 사용하며...
11개월 전
035.1K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: AI 애플리케이션을 위한 사용자 프로필 기반 장기 메모리 솔루션

일반 소개 메모베이스는 생성형 AI 애플리케이션을 위해 오래 지속되는 사용자 메모리를 지원하도록 설계된 사용자 프로필 기반 메모리 시스템입니다. 가상 동반자, 교육 도구 또는 개인화된 비서를 구축하든, Memobase는 AI가 다음을 사용하여 기억하고 이해하고 성장할 수 있도록 지원합니다.
9개월 전
035K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: Tencent ARC에서 출시한 이미지 복원 및 편집을 위한 올인원 도구

종합 소개 BrushEdit는 Tencent ARC Labs에서 개발한 올인원 이미지 복구 및 편집 도구입니다. 이 도구는 최신 AI 기술을 기반으로 하며 이미지의 결함을 자동으로 식별하고 복구하는 동시에 사용자의 대화형 편집을 지원할 수 있으며, BrushEdit는 다양한 기능을 결합합니다.
11개월 전
035K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

라이트 카드: HTML5 카드 생성기 도구, 간단한 도구로 아름다운 콘텐츠 카드 만들기

일반 설명 라이트카드는 사용자가 멋진 콘텐츠 카드를 쉽게 만들 수 있도록 설계된 간단하고 우아한 카드 생성 도구입니다. 이 도구는 사용자 지정 텍스트 콘텐츠, 여러 테마 스타일 및 QR 코드를 지원하여 더 쉽고 재미있게 만들 수 있습니다. 사용자는 제목, 본문, 작성자를 편집할 수 있습니다.
11개월 전
034.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
7개월 전
034.9K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: 완전한 TypeScript 프로젝트를 빠르게 빌드하고 반복하는 오픈 소스 풀스택 AI 엔지니어

일반 소개 Srcbook은 AI 어시스턴트를 사용하여 웹 애플리케이션을 빠르게 만들고 반복할 수 있도록 설계된 TypeScript 중심 애플리케이션 개발 플랫폼입니다. 기본 런타임을 지원하고, 대화형 노트북 인터페이스를 제공하며, 사용자가 백엔드 코드를 작성하고 실행할 수 있습니다.
1 년 전
034.9K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: 다국어 입력 및 긴 비디오 생성을 지원하는 Vincennes 비디오 모델

종합 소개 Step-Video-T2V는 StepFun AI(StepFun Star)의 고급 텍스트-비디오 변환 모델입니다. 이 모델에는 30억 개의 매개변수가 있으며 최대 204fps의 동영상을 생성할 수 있습니다. 고도로 압축된 가변 자동 인코더(VAE)를 통해 이 모델은 ...
9개월 전
034.9K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Nuxt 3 및 Ollama 기반의 로컬 실시간 채팅 애플리케이션 UI

포괄적 인 소개 ChatOllama는 대규모 언어 모델 (LLM)을 기반으로하는 오픈 소스 온라인 채팅 응용 프로그램 프로젝트로 수많은 언어 모델과 지식 기반 관리를 지원합니다. 사용자는 모델 관리(목록 표시, 다운로드, 삭제), 모델과의 채팅 및 기타 기능을 위해 플랫폼을 사용할 수 있습니다. 이 프로젝트는 ...
1 년 전
034.9K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

일반 설명 Charla는 모국어 모델과 대화할 수 있도록 설계된 엔드포인트 기반 채팅 애플리케이션입니다. 이 애플리케이션은 Ollama 백엔드와 통합되어 문맥 인식 대화를 지원하며 채팅 세션을 마크다운 파일로 저장합니다. 사용자는 간단히...
10개월 전
034.9K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know: 지식 그래프 기반의 지능형 Q&A 플랫폼

유시노우는 지식 그래프와 RAG(검색 증강 생성) 기술을 결합하여 사용자가 정확한 답변을 빠르게 얻을 수 있도록 지원하는 오픈소스 지능형 Q&A 플랫폼입니다. 지식 그래프를 저장하기 위해 Neo4j를 기반으로 FastAPI와 VueJS 구조를 사용하여 ...
8개월 전
034.9K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: 여러 AI 제품을 통합하는 상용화 통합 플랫폼

종합 소개 AIBot PRO는 사용자에게 여러 AI 제품을 통합할 수 있는 편리한 플랫폼을 제공하도록 설계된 .NET 6 기반 AI 통합 클라이언트입니다. 이 클라이언트는 무의미한 전환 대화를 지원하며 ChatGPT, Gemini, Claude, Wenxin Yiyin을 통합합니다.
9개월 전
034.9K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: 모델 통합 및 데이터 흐름 관리를 지원하여 AI 채팅 인터페이스를 빠르게 구축할 수 있는 툴킷입니다.

종합 소개 Ant Design X는 개발자가 AI 기반 대화 인터페이스를 빠르게 구축할 수 있도록 설계된 Ant Group에서 오픈소스화한 툴킷입니다. 풍부한 구성 요소와 템플릿 세트를 제공하고 OpenAI 표준과 호환되는 모델 통합을 지원하며 지능형 고객 서비스, AI 어시스턴트 등 다양한 애플리케이션에 적합합니다.
1 년 전
034.9K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
11개월 전
034.8K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: 거의 모든 비디오 플랫폼을 지원하는 명령줄 비디오 다운로더

일반 소개 Lux는 Go로 작성된 빠르고 간단한 동영상 다운로드 라이브러리이자 명령줄 도구입니다. 유튜브, 빌리빌리, 유쿠 등 여러 웹사이트에서 동영상을 다운로드할 수 있습니다. Lux는 멀티 스레드 다운로드와 같은 다양한 다운로드 옵션과 기능을 제공합니다.
10개월 전
034.8K
Second Me:本地训练拥有个人记忆和习惯的AI分身

세컨드 미: 개인의 기억과 습관을 가진 로컬로 학습된 AI 도플갱어

Second Me는 Mindverse 팀이 개발한 오픈 소스 프로젝트로, 컴퓨터에서 '디지털 도플갱어'처럼 행동하는 AI를 만들어 사용자의 말과 기억을 통해 사용자의 말 패턴과 습관을 학습하고 사용자의 말을 이해하는 똑똑한 사람이 될 수 있게 해줍니다.
8개월 전
034.8K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git 리포지토리 텍스트 파일을 읽고 대형 모델을 위해 빠르게 청크 처리하기

일반 소개 Yek은 저장소나 디렉터리에서 텍스트 파일을 읽고, 청크화하여 대규모 언어 모델(LLM)에서 사용하기 위해 직렬화하기 위한 빠른 Rust 기반 도구입니다. 이 도구는 기본적으로 .gitignore 규칙을 사용하여 불필요한 파일을 건너뛰고, ...
10개월 전
034.8K
RLAMA:命令行操作的本地文档智能问答 RAG 系统

RLAMA: 명령줄에서 작동하는 로컬 문서의 지능형 퀴즈를 위한 RAG 시스템

일반 소개 RLAMA는 돈티지 오픈소스로 개발되어 깃허브에서 호스팅되는 문서 지능 퀴즈 RAG(검색 증강 생성) 시스템으로, 명령줄 작업을 통한 기능이 핵심 특징입니다. 사용자는 간단한 터미널 명령을 사용하여 로컬에 연결할 수 있습니다.
9개월 전
034.7K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

텍스트2비디오제로: 픽스아트 AI 연구팀에서 출시한 텍스트-비디오 제로 샘플 생성기

일반 소개 텍스트2비디오-제로는 픽스아트 AI 연구팀이 개발한 깃허브용 제로 샘플 텍스트-비디오 생성기의 공식 구현으로, 이 프로젝트는 텍스트 단서를 사용하여 시간적 일관성을 가진 텍스트를 생성하고 정확한 ...
1 년 전
034.7K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: 게임 채팅 콘텐츠의 실시간 번역을 위한 오픈 소스 클라이언트

일반 소개 DeepRant는 게이머를 위한 오픈 소스 번역 도구로, 국제 서버의 언어 장벽 문제를 해결하기 위해 설계되었습니다. 단축키를 통해 게임 내 텍스트를 즉시 번역할 수 있고, 여러 언어를 지원하여 서로 번역할 수 있으며, 플레이어가 게임을 종료하지 않고도 채팅 메시지를 빠르게 이해하고 답장할 수 있습니다....
9개월 전
034.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: 단일 피사체 및 다중 피사체 맞춤형 이미지 생성 도구 지원(전자상거래 그래픽에 적합)

UNO는 바이트댄스 인텔리전트 크리에이션 팀이 개발한 오픈 소스 이미지 생성 프레임워크입니다. FLUX.1 모델을 기반으로 하며 "적은 것에서 더 많은 것"으로 일반화 접근 방식을 통해 단일 피사체 및 다중 피사체 맞춤형 이미지 생성에 중점을 둡니다.UNO는 확산 변환기를 사용합니다...
7개월 전
034.6K
Quadratic:集成AI对话和代码执行的在线数据分析表格

쿼드래틱: AI 대화와 코드 실행을 통합하는 온라인 데이터 분석 양식

일반 설명 Quadratic은 사용자에게 강력한 데이터 처리 및 분석 기능을 제공하도록 설계된 AI, 코드 및 데이터 연결 기능을 결합한 오픈 소스 스마트 스프레드시트 도구입니다. Python, SQL, Rust와 같은 프로그래밍 언어를 지원함으로써 Quadratic은...
9개월 전
034.6K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

모델 컨텍스트 제공자 CLI: 모든 대형 모델에서 MCP 서비스를 사용하기 위한 명령줄 도구로, Claude에 의존하지 않습니다.

종합 소개 모델 컨텍스트 공급자 CLI(mcp-cli)는 모델 컨텍스트 공급자 서버와 상호 작용하기 위한 프로토콜 수준의 명령줄 도구입니다. 이 도구를 사용하면 명령을 보내고, 데이터를 쿼리하고, 서버에서 제공하는 다양한 리소스와 상호 작용할 수 있습니다....
9개월 전
034.6K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: 오디오 기반 인물 사진으로 말하는 동영상 생성(EchoMimicV2 가속 설치 프로그램)

일반 소개 EchoMimic은 오디오로 사실적인 인물 애니메이션을 생성하도록 설계된 오픈 소스 프로젝트입니다. Ant Group의 터미널 기술 부서에서 개발한 이 프로젝트는 편집 가능한 마커 포인트 조건을 활용하여 오디오와 얼굴 마커 포인트의 조합을 사용하여 역동적인 인물 비디오를 생성합니다.EchoMimic...
11개월 전
034.6K
Autiobooks:将epub电子书转换为m4b有声书

오디오북: epub 전자책을 m4b 오디오북으로 변환하기

일반 소개 오토북은 사용자가 .epub 형식의 전자책을 .m4b 형식의 오디오북으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구입니다. Kokoro에서 제공하는 고품질 음성 합성 기술을 사용하여 자연스럽고 부드러운 오디오를 생성합니다. 이 도구는 ...에 의해 구동됩니다.
9개월 전
034.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

라마 튜터: 개인 맞춤형 과외를 제공하는 AI 도구로, 라마 3.1을 기반으로 구축된 오픈 소스 AI 개인 튜터 프로젝트입니다.

일반 소개 라마 튜터는 사용자에게 개인화된 학습 경험을 제공하도록 설계된 라마 3.1 기반의 오픈 소스 AI 개인 비서 프로젝트입니다. Together AI, Next.js 및 T와 같은 여러 기술 스택을 통합하여 ...
1 년 전
034.5K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: 지역 지식 기반과 검색 정보를 혼합하는 AI 검색 엔진

일반 소개 MemFree는 텍스트, 이미지, 문서 및 웹 페이지를 통해 검색하고 질문할 수 있는 고급 하이브리드 AI 검색 엔진입니다. 텍스트, 마인드맵, 이미지, 동영상에 대한 검색 결과에 한 번의 클릭으로 액세스할 수 있으며, MemFree는 사용자의 지식 기반에서 정보를 추출하고...
1 년 전
034.5K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

조각: Anthropic의 클로드 아티팩트, Vercel v0 또는 GPT 엔지니어와 같은 애플리케이션의 오픈 소스 버전입니다.

일반 소개 E2B의 프래그먼트는 AI로만 생성된 애플리케이션을 구축하기 위한 Next.js 기반의 템플릿을 제공하는 오픈 소스 프로젝트입니다. E2B에서 개발한 이 프로젝트는 AI 애플리케이션의 개발 프로세스를 간소화하고 가속화하는 것을 목표로 합니다. 그것은 다양한 현재를 통합합니다 ...
1 년 전
034.5K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: 멀티모달 콘텐츠 구문 분석 및 지식 그래프와 하이브리드 검색의 결합을 위한 고급 AI 검색(RAG) 시스템

종합 소개 R2R(RAG to Riches)은 프로덕션에 바로 사용할 수 있는 기능을 갖춘 검색 증강 생성(RAG) 기능을 지원하는 고급 AI 검색 시스템입니다. 컨테이너화된 RESTful API를 기반으로 구축된 이 시스템은 멀티모달 콘텐츠 구문 분석, 하이브리드 검색 기능 등을 제공합니다.
11개월 전
034.5K
Langui:开源的AI用户界面组件库

Langui: AI 사용자 인터페이스 구성 요소의 오픈 소스 라이브러리

일반 소개 LangbaseInc의 Langui는 제너레이티브 AI 및 LLM(대규모 언어 모델링) 프로젝트를 위해 설계된 오픈 소스 사용자 인터페이스 컴포넌트 라이브러리입니다. 이 라이브러리는 Tailwind CSS를 기반으로 하며 개발자가 빠르게 구성할 수 있도록 미리 빌드된 UI 컴포넌트 모음을 제공합니다.
10개월 전
034.5K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: 멀티모달 인텔리전스를 사용한 자동화된 스마트폰 작동

포괄적인 소개 AppAgent는 스마트폰 애플리케이션을 조작하도록 설계된 LLM(대규모 언어 모델) 기반 멀티모달 에이전트 프레임워크입니다. 이 프레임워크는 단순화된 조작 공간을 통해 탭 및 스와이프와 같은 인간의 상호 작용을 모방하여 시스템 백엔드 액세스가 필요하지 않으므로 다양한 앱으로 범위를 확장할 수 있습니다.
11개월 전
034.4K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替

HelloMeme: 로컬 고 충실도 표현 액션 일관된 이미지 또는 비디오 생성, 런웨이 액트 원 오픈 소스 탁구!

포괄적 인 소개 HelloMeme은 HelloVision에서 개발 한 오픈 소스 프로젝트로, 공간 뜨개질주의를 통합하여 확산 모델에 고수준 및 고 충실도 스트립을 포함하는 것을 목표로합니다 ...
12개월 전
034.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: 안전한 오프라인을 위한 스마트 프로그래밍 지원, 네이티브 LLM 기반 Vim 프로그래밍 도우미

일반 소개 VimLM은 네이티브 LLM(대규모 언어 모델)으로 구동되는 코드 어시스턴트를 제공하는 Vim 플러그인입니다. Vim 명령을 통해 기본 LLM 모델과 상호 작용하여 코드 컨텍스트를 자동으로 가져와 사용자가 Vim에서 코드를 편집할 수 있도록 도와줍니다.VimLM은 다음에서 영감을 받았습니다.
9개월 전
034.4K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: 명령을 이해하고 하위 작업으로 분할하여 코드를 작성하는 오픈 소스 AI 소프트웨어 엔지니어 인텔리전스

일반 소개 Devika는 인간의 높은 수준의 지시를 이해하고, 이를 단계별로 세분화하여 관련 정보를 연구하고, 주어진 목표를 달성하기 위해 코드를 작성하는 고급 AI 소프트웨어 엔지니어입니다. 대규모 언어 모델, 계획 및 추론 알고리즘, 웹 브라우징 기능을 사용하여 소프트웨어를 지능적으로 개발합니다....
9개월 전
034.4K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: 단일 이미지에서 고해상도 3D 모델링 디지털 자산 생성

일반 소개 TripoSG는 단일 이미지에서 고품질 3D 모델을 생성하기 위해 VAST AI 연구팀에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 하이브리드 지도 학습 및 고품질 데이터 세트와 결합된 대규모 정류기-흐름 변환기 기술을 사용하여 생성된 3D 모델이 다음과 같은 기능을 갖출 수 있도록 합니다.
8개월 전
034.3K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: 대화형 이미지 편집 도구, 포인트 앤 클릭 및 드래그 앤 드롭으로 이미지 위치를 제어할 수 있습니다.

일반 소개 DragGAN은 생성적 적대 신경망(GAN)을 기반으로 하는 대화형 이미지 편집 도구입니다. 시그라프 2023에서 Xingang Pan 등이 발표한 이 도구는 간단한 포인트 앤 클릭과 드래그 앤 드롭 조작을 통해 사용자가 직관적으로 조작할 수 있도록 하는 것을 목표로 합니다.
12개월 전
034.3K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: 워크플로 자동화 및 자율적 작업 실행을 위한 지능형 바디 구축 플랫폼

일반 설명 AutoGPT는 사용자가 지속적으로 실행되는 AI 에이전트를 생성, 배포, 관리하고 복잡한 워크플로를 자동화할 수 있도록 설계된 강력한 플랫폼입니다. 시그니피컨트 그라비타스에서 개발한 이 플랫폼은 사용자가 집중할 수 있는 다양한 도구와 기능을 제공합니다.
12개월 전
034.3K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: 음성-텍스트 변환을 지원하는 휴대용 AI 음성 일기장 앱입니다.

개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....
10개월 전
034.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

딥 파인더: 로컬 지식을 이용한 심층 추론 검색을 위한 오픈 소스 프로젝트

종합 소개 Deep Searcher는 개인 데이터를 기반으로 검색, 평가 및 추론하도록 설계된 LLM(대규모 언어 모델)과 벡터 데이터베이스를 결합하여 매우 정확한 답변과 포괄적인 보고서를 제공하는 강력한 도구입니다. 엔터프라이즈 지식 관리에 적합합니다...
10개월 전
034.3K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: 멀티모달 검색 및 지식 그래프 구성을 지원하여 매우 긴 동영상을 이해하기 위한 RAG 프레임워크입니다.

포괄적인 소개 VideoRAG는 매우 긴 컨텍스트 비디오를 처리하고 이해하도록 설계된 검색 강화 생성 프레임워크입니다. 이 도구는 그래프 중심의 텍스트 지식 기반과 계층적 멀티모달 컨텍스트 인코딩을 결합하여 단일 NVIDIA RTX 3090 GPU에서 효율적으로 처리합니다....
10개월 전
034.3K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: 카툰 음영, 흑백 이미지의 자동 음영으로 이미지 색상 일관성 및 품질 향상

종합 소개 ColorFlow는 흑백 이미지 시퀀스의 자동 채색 문제를 해결하기 위해 Tencent ARC 팀에서 개발한 이미지 시퀀스 자동 채색 도구입니다. 이 도구는 검색 기능이 강화된 셰이딩 파이프라인을 사용하여 캐릭터의 헤어 컬러와 서비스를 포함한 참조 이미지 풀을 통해 다양한 요소의 컬러를 정확하게 생성합니다.
11개월 전
034.2K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: 고해상도 3D 모델링 디지털 에셋 생성을 위한 AI 플랫폼

일반 소개 Neural4D는 사용자가 간단한 텍스트 또는 이미지 입력으로 고품질 3D 모델과 애니메이션을 빠르게 생성할 수 있도록 지원하는 혁신적인 AI 기반 플랫폼입니다. 드림테크에서 개발한 이 플랫폼은 세계 최고의 엔드투엔드 3D 대형 모델 생성 기술을 기반으로 합니다....
9개월 전
034.2K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: 기술 문서를 빠르게 크롤링하고 정리할 수 있는 MCP 서비스

일반 소개 DevDocs는 CyberAGI 팀에서 개발하고 GitHub에서 호스팅하는 완전 무료 오픈 소스 도구입니다. 프로그래머와 소프트웨어 개발자를 위해 설계된 이 도구는 기술 문서의 URL로 시작하여 관련 페이지를 자동으로 크롤링하고 이를 간결한 마...
8개월 전
034.2K