AI 오픈 소스 프로젝트

총 1020개 문서
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: 의류 디테일의 사실감을 높여주는 고충실도 AI 가상 피팅 도구

종합 소개 FitDiT는 확산 변압기(확산 트랜스포머)를 기반으로 한 고충실도 가상 피팅 시스템입니다. 텐센트 AI 랩에서 개발한 이 프로젝트는 의류 디테일을 보여주는 기존 가상 피팅 시스템의 한계를 해결하는 것을 목표로 합니다.FitD...
7개월 전
02.6K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

일반 소개 박판 스플라인 모션 모델은 CVPR 2022에서 발표된 획기적인 이미지 애니메이션 생성 프로젝트입니다. 이 프로젝트는 박판 스플라인 변환 이론을 기반으로 하며, 주행 영상을 기반으로 정지 이미지에서 고품질의 모션을 구현할 수 있습니다.
7개월 전
02.7K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: 실시간 상호 작용을 위한 지능형 디지털 인력, 멀티 플랫폼 원클릭 배포 지원

일반 소개 DUIX(대화 사용자 인터페이스 시스템)는 실리콘 인텔리전스에서 만든 AI 기반 디지털 인간 상호작용 플랫폼입니다. 오픈 소스 디지털 인간 상호 작용 기능을 통해 개발자는 대규모 모델, 자동 음성 인식(ASR)을 쉽게 통합할 수 있습니다.
7개월 전
03.6K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

페이 디지털 휴먼 프레임워크: 언어 모델과 3D 디지털 캐릭터를 통합하여 다양한 애플리케이션 시나리오 지원

종합 소개 페이는 가상 쇼핑 가이드, 가상 앵커, 비서, 웨이터, 교사, 음성 또는 텍스트 기반 모바일 비서 등 다양한 애플리케이션 시나리오를 위해 언어 모델과 디지털 캐릭터를 통합하는 오픈 소스 3D 가상 디지털 휴먼 프레임워크입니다.페이 프레임워크는 완전한 오프라인 사용을 지원하여 ...
7개월 전
03K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFA 비디오: 정지 이미지를 비디오로 변환하는 모션 필드 적응 기술

일반 소개 MOFA-Video는 제너레이티브 모션 필드 적응 기술을 활용하여 정적인 이미지를 동적인 동영상으로 변환하는 최첨단 이미지 애니메이션 생성 툴입니다. 이 도구는 도쿄대학교 및 텐센트 AI 연구소와 공동으로 개발되었으며, 2024년 유럽 컴퓨터 비전 컨퍼런스에서 발표될 예정입니다(E...
7개월 전
02.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: 오픈 소스 AI 회의 녹음 도우미, 회의 내용을 자동으로 녹음하여 요약을 생성합니다.

일반 소개 Amurex는 지능형 기능을 통해 회의 효율성을 개선하도록 설계된 The Personal AI Company에서 개발한 오픈 소스 AI 회의 도우미로, 실시간 조언 제공, 지능형 요약 생성, 회의 내용 기록, 자동 팔로우 전송이 가능합니다.
7개월 전
03.3K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.
7개월 전
02.5K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

에이전트 실험실: 연구자를 위한 자동화된 코드 및 연구 작성 도우미

종합 소개 에이전트 실험실은 연구자가 연구 아이디어를 실현할 수 있도록 설계된 엔드투엔드 자율 연구 워크플로우입니다. 이 시스템은 문헌 검토 및 계획 개발부터 실행까지 전체 연구 워크플로우를 지원하는 대규모 언어 모델에 기반한 전용 에이전트로 구성되어 있습니다.
4개월 전
02.8K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

쿨클라인: 클라인루 클라인과 바오 클라인의 장점을 결합한 클라인의 지능형 코딩 어시스턴트의 또 다른 향상된 버전입니다.

일반 설명 쿨클라인은 클라인, 루클라인, 바오클라인의 최고의 기능을 결합한 강력한 코딩 어시스턴트입니다. 명령줄 인터페이스(CLI) 및 편집기와 원활하게 작동하여 가장 강력한 기능을 제공합니다.
7개월 전
02.8K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

AI 투자 시스템: 시장 데이터 분석을 위해 다중 지능 시스템을 사용하는 자동화된 A주 투자 의사결정 시스템

종합 소개 A_Share_investment_Agent는 다중 지능 시스템에 기반한 A주 투자 의사 결정 보조 시스템입니다. 이 시스템은 여러 협업 지능을 통해 시장 데이터를 분석하고, 주식의 내재 가치를 계산하고, 시장 심리 및 펀더멘털 데이터를 분석하여 다음과 같은 작업을 수행하도록 설계되었습니다.
7개월 전
02.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

회사 리서치: 회사 리서치 도구로, 회사의 웹 주소를 입력하면 자세한 리서치 정보를 확인할 수 있습니다.

일반 설명 회사 리서처(Company Researcher)는 사용자가 모든 회사에 대한 빠르고 포괄적인 개요를 얻을 수 있도록 설계된 무료 오픈 소스 도구입니다. 회사의 URL을 입력하기만 하면 이 도구가 웹에서 포괄적인 정보를 수집하여 조직, 제품 등에 대한 정보를 표시합니다.
4개월 전
02.2K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHub 리포지토리를 팟캐스트로 전환하고 언제 어디서나 코드 업데이트를 들을 수 있습니다!

일반 소개 GitPodcast는 개발자가 언제 어디서나 코드 업데이트를 들을 수 있도록 GitHub 리포지토리를 팟캐스트로 전환하도록 설계된 혁신적인 도구입니다. OpenAI 및 Azure Speech SDK를 사용하여 GitPodca...
7개월 전
02.3K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: 종이 없는 문서 관리 시스템을 위해 AI를 사용하여 문서를 자동으로 분석하고 태그를 지정합니다.

일반 소개 Paperless-AI는 Paperless-ngx 문서 관리 시스템을 위해 특별히 설계된 혁신적인 문서 자동화 분석 도구입니다. 이 도구는 OpenAI API를 다음과 같은 다양한 고급 AI 모델과 스마트하게 결합합니다.
7개월 전
04.8K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

코스모스: 세계 기본 모델, 물리적 세계의 AI 기본 모델을 구축하기 위한 플랫폼

포괄적인 소개 NVIDIA Cosmos는 개발자를 위한 월드 기반 모델링 플랫폼으로, 물리 AI 개발자가 물리 AI 시스템을 더 빠르고 효율적으로 구축할 수 있도록 특별히 설계되었습니다. 이 플랫폼은 확산 및 자동 회귀 월드 기반 등 다양한 사전 훈련된 모델을 제공합니다.
7개월 전
02.6K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

미니 LLM 흐름: 100줄의 코드로 '지시형 그래프 구조'로 LLM 미니 인텔리전트 구축하기

일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.
7개월 전
02.8K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI 챗봇: AI 채팅 동반자, 간편한 음성 대화 및 지능적인 상호 작용을 구축하세요.

종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.
5개월 전
03.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI 실시간 API Next.js: 실시간 음성 대화 AI 애플리케이션을 구축하기 위한 Next.js 템플릿

포괄적인 소개 OpenAI 실시간 API Next.js는 개발자가 실시간 음성 AI 애플리케이션을 빠르게 구축할 수 있도록 설계된 Next.js 프레임워크 기반의 오픈 소스 프로젝트입니다. 이 프로젝트는 OpenAI의 실시간 API와 WebRTC 기술을 통합하여 ...
7개월 전
02.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

일반 소개 Auto-Coder.Chat은 지능형 수단을 통해 개발자의 프로그래밍 효율성을 향상시키기 위해 설계된 터미널 기반 AI 지원 프로그래밍 도구입니다. 이 도구는 모든 IDE와 함께 사용하여 개발 도구에서 AI 지원 프로그래밍을 활성화할 수 있습니다.Auto...
4개월 전
02.7K
Kokoro:高效语音合成模型,生成自然流畅的语音

Kokoro: 자연스럽고 부드러운 음성을 생성하는 효율적인 음성 합성 모델

일반 소개 Kokoro 82M은 더 적은 매개변수와 데이터로 고품질의 음성을 생성하도록 설계된 Hugging Face에서 제공하는 효율적인 음성 합성 모델입니다. 이 모델에는 8,200만 개의 파라미터가 있으며 Apache 2.0에 따라 라이센스가 부여되어 있습니다.
7개월 전
03.2K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
7개월 전
03.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

액티브피스: AI 워크플로 자동화, 비기술 사용자를 위한 작업 스케줄링 도구, 오픈 소스 Zapier 대체 도구

일반 소개 Activepieces는 기업과 개인 사용자에게 직관적이고 강력한 자동화 솔루션을 제공하는 데 중점을 둔 오픈 소스 올인원 자동화 워크플로 플랫폼입니다. TypeScript로 개발된 이 플랫폼은 확장성이 뛰어나며 200개 이상의 통합 서비스를 지원합니다.
7개월 전
02.7K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션

종합 소개 SHMT(자기 지도 계층적 메이크업 전송)는 잠재 확산 모델을 기반으로 한 자기 지도 계층적 메이크업 마이그레이션 프로젝트로, 비지도 학습 방법을 통해 고품질의 메이크업 효과를 달성하는 것을 목표로 합니다....
7개월 전
02.9K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: 실시간 시각 및 음성 상호 작용을 위한 오픈 소스 멀티모달 대규모 언어 모델

일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...
7개월 전
03.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

트렌드 파인더: 마케팅 의사 결정을 위해 소셜 미디어 트렌드, 인기 주제 및 새 게시물을 실시간으로 추적합니다.

일반 소개 트렌드 파인더는 사용자가 소셜 미디어에서 인기 있는 주제와 트렌드를 실시간으로 추적할 수 있도록 설계된 강력한 도구입니다. 트렌드 파인더는 주요 인플루언서들의 게시물을 수집하고 분석하여 새로운 트렌드나 제품 출시를 적시에 감지할 수 있습니다.
7개월 전
02.9K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: Gemini 멀티모달 모델을 기반으로 중국어에서 영어로 번역하는 실시간 오디오 변환 도구

TransRouter는 영어와 중국어 간의 실시간 음성 번역을 위해 특별히 설계된 Google의 Gemini 모델을 기반으로 하는 실시간 음성 번역 도구입니다. 이 도구는 Zoom과 같은 화상 회의 소프트웨어에 원활하게 통합되어 언어 간 번역을 위한 강력한 도구를 제공합니다.
7개월 전
03K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3 및 PlayHT TTS를 기반으로 하는 NotebookLM의 오픈 소스 구현

일반 소개 오픈 소스 노트북LM은 딥시크-V3의 언어 이해 기능과 PlayHT의 음성 합성 기술을 결합한 혁신적인 인공지능 프로젝트로, 지능형 노트 필기 대화 시스템을 만드는 것을 목표로 합니다. 이 프로젝트는 Build Fast w에서 개발했습니다.
7개월 전
02.6K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

비전만 있으면 충분합니다: 시각 언어 모델을 사용한 지능형 문서 검색 시스템 구축(Vision RAG)

종합 소개 Vision-is-all-you-need는 시각 언어 모델링(VLM)을 문서 처리 영역에 적용하는 새로운 지평을 여는 혁신적인 시각적 RAG(검색 증강 생성) 시스템 데모 프로젝트입니다. 기존의 텍스트 청킹 방식과 달리 이 시스템은 직접적으로 ...
7개월 전
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira(미니퍼플엑스): 퍼플렉시티를 모방한 오픈 소스 프로젝트로, AI 대화, 웹 검색, 날씨 쿼리 등을 통합합니다.

일반 소개 미니퍼플엑스(Scira로 명칭 변경)는 미니멀하게 디자인된 AI 기반 검색 엔진으로, 다양한 유용한 기능을 통합하여 사용자에게 모든 범위의 정보 검색 서비스를 제공합니다. 이 프로젝트는 Next.js, Tailwi...를 포함한 최신 기술 스택을 사용합니다.
7개월 전
03.2K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: 외부 실시간 지식 그래프 데이터에 기반한 LLM 추론 서비스

종합 소개 Diffbot LLM Reasoning Server는 LLama 모델 아키텍처를 기반으로 특별한 최적화와 개선이 이루어진 혁신적인 대규모 언어 모델링 시스템입니다. 이 프로젝트의 가장 중요한 특징은 실시간 지식 그래프와 검색 기능이 강화된 생성 기능을 통합한 것입니다.
7개월 전
02.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: 스마트 페인트 도구로 이미지에 조명 추가하기

일반 소개 LuminaBrush는 인공 지능 기술로 구동되는 조명 효과를 위한 혁신적인 대화형 이미지 편집 도구입니다. 이 프로젝트는 2단계 프레임워크를 사용하여 이미지를 처리합니다. 첫 번째 단계에서는 입력 이미지를 "균일한 조명" 모양으로 변환하고 두 번째 단계에서는...
7개월 전
03.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: 자연어 프로그래밍을 위한 AI 소프트웨어 개발 팀을 구축하기 위한 다중 지능체 협업 프레임워크

종합 소개 MetaGPT는 완전한 AI 소프트웨어 회사의 운영을 시뮬레이션하도록 설계된 혁신적인 다중 지능 바디 프레임워크입니다. 이 프로젝트의 목표는 서로 다른 역할을 하는 GPT 모델을 협업 엔티티로 결합하는 것입니다....
5개월 전
03.4K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

레이캐스트-G4F: 레이캐스트를 통해 GPT-4, 라마-3 및 기타 여러 AI 모델에 무료로 액세스하세요!

일반 소개 레이캐스트-G4F(GPT4Free)는 사용자가 GPT-4, 라마-3을 포함한 다양한 고급 AI 모델에 무료로 액세스할 수 있는 강력한 레이캐스트 확장 프로그램입니다. 이 확장 프로그램은 실시간 대화 스트리밍을 제공할 뿐만 아니라...
7개월 전
03.1K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...
7개월 전
03.2K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.
7개월 전
03.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify API 기반의 데스크톱 지능형 대화 클라이언트로, 엔터프라이즈급 AI 대화 기능을 제공합니다.

종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.
7개월 전
03.4K
小红书AI运营助手:自动生成和发布小红书文章

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.
7개월 전
03.8K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

위챗 마크다운 에디터: 간단하고 효율적인 위챗 그래픽 레이아웃 도구, 위챗 공개 번호에 기사를 붙여넣는 열쇠입니다.

종합 소개 WeChat 마크다운 편집기(WeChat 마크다운 편집기)는 사용자가 아름다운 WeChat 게시물을 쉽게 작성할 수 있도록 설계된 매우 간결한 WeChat 그래픽 레이아웃 도구입니다. 이 에디터는 모든 기본 마크다운을 지원합니다.
7개월 전
02.7K
오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라는 대규모 언어 모델(LLM)을 기반으로 다중 지능 협업 시스템을 구축하는 데 중점을 둔 혁신적인 경량 Python 프레임워크입니다. 여러 AI 지능이 교향악단처럼 조화롭게 작동할 수 있도록 지능을 배열하는 고유한 방법을 사용합니다. 모델링으로 ...
7개월 전
02.1K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: 작업 계획 및 실행 자동화를 위한 지식 그래프 구축

종합 소개 그래프에이전트는 그래프 생성, 작업 계획, 작업 실행을 통합한 자동화된 지능형 바디 시스템입니다. 정형 및 비정형 데이터 처리, 복잡한 시맨틱 의존성 그래프 구축, 자체 계획 및 도구 매칭을 통해 사용자 작업을 효율적으로 실행할 수 있습니다.그래프...
7개월 전
02.3K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: 클릭 한 번으로 로컬 LLM 개발 환경을 배포하고 AI 서비스를 쉽게 관리 및 실행할 수 있는 컨테이너화된 도구 세트입니다.

개요 Harbor는 로컬 AI 개발 환경의 배포와 관리를 간소화하는 데 중점을 둔 혁신적인 컨테이너형 LLM 도구 세트입니다. 깔끔한 명령줄 인터페이스(CLI)와 컴패니언 애플리케이션을 통해 개발자는 클릭 한 번으로 LLM 백엔드, API 인터페이스, 프런트엔드 등을 시작하고 관리할 수 있습니다.
7개월 전
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: 문서를 구조화된 데이터로 추출하고 분류하여 문서 처리 프로세스를 최적화합니다.

포괄적인 소개 ExtractThinker는 LLM(대규모 언어 모델)을 사용하여 문서에서 구조화된 데이터를 추출하고 분류하는 유연한 문서 인텔리전스 도구로, 원활한 ORM과 같은 문서 처리 워크플로우를 제공합니다. Tess를 비롯한 다양한 문서 로더를 지원합니다.
7개월 전
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
7개월 전
04.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: 사람에서 의류를 타일형 의류 디스플레이 이미지로 추출하는 AI 도구

종합 소개 TryOffAnyone은 이커머스 분야의 의류 디스플레이 문제를 해결하기 위해 특별히 설계된 획기적인 AI 이미지 처리 툴입니다. 실제 사람이 옷을 입은 사진을 평평한 디스플레이 효과 이미지로 지능적으로 변환할 수 있으며, 이 기술은 최신 잠재 차이 기술을 기반으로 합니다.
7개월 전
02.6K
에이전타리움: 여러 AI 인텔리전스 간의 상호작용 관리 및 조정

에이전타리움: 여러 AI 인텔리전스 간의 상호작용 관리 및 조정

일반 소개 에이전타리움은 AI 지능형 에이전트(에이전트)를 관리하고 오케스트레이션하는 데 특화된 강력한 Python 프레임워크입니다. 이 프레임워크는 여러 AI 에이전트 간의 상호 작용을 생성, 관리 및 오케스트레이션하는 유연하고 직관적인 방법을 제공합니다. 이 프레임워크는 A...
7개월 전
02.9K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX 비디오(LTXV): 고품질 비디오를 생성하기 위한 실시간 비디오 생성의 오픈 소스 모델입니다.

일반 소개 LTX-Video는 라이트릭스에서 개발한 최초의 DiT(확산 변압기) 기반 실시간 동영상 생성 모델입니다. 이 모델은 초당 24프레임의 768x512 해상도로 고품질을 생성할 수 있습니다....
7개월 전
04.1K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

스크랩그래프AI: 웹 크롤링을 위한 한 마디로, 규칙을 작성할 필요가 없는 지능형 웹 콘텐츠 추출 도구

포괄적인 소개 ScrapeGraphAI는 대규모 언어 모델링(LLM)과 직접 그래프 로직을 영리하게 결합하여 웹사이트와 로컬 문서를 위한 스크래핑 파이프라인을 생성하는 혁신적인 Python 웹 스크래핑 라이브러리입니다. 이 도구를 독특하게 만드는 것은 완벽한 수준의 단순성과 강력함입니다...
7개월 전
02.2K
AnkiAIUtils: 메모리 카드를 자동으로 최적화하는 지능형 어시스턴트인 Anki 플래시카드 학습 AI 툴셋

AnkiAIUtils: 메모리 카드를 자동으로 최적화하는 지능형 어시스턴트인 Anki 플래시카드 학습 AI 툴셋

일반 설명 AnkiAIUtils는 Anki 플래시카드 학습 시스템을 위해 설계된 AI 강화 도구 세트입니다. 의대생이 개발한 이 도구는 AI 기술을 통해 사용자가 학습 과정에서 어려움을 겪고 있는 카드를 자동으로 개선하도록 설계되었습니다. 이 도구는 사용자에게 지능적으로 개인화된 ...
7개월 전
02.9K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.

일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.
7개월 전
02.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: GitHub 코드 저장소의 구조를 시각화하고 코드 저장소를 대화형 시스템 아키텍처 다이어그램으로 변환합니다.

일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.
7개월 전
04.4K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 자율적으로 실행되는 다중 지능 구축, 완전한 기능을 갖춘 오픈 소스 AI 지능체 개발 프레임워크

포괄적 인 소개 Eliza는 고급 다중 지능형 바디 (다중 에이전트) 개발 프레임 워크이며 자율 지능형 바디 (자율 에이전트) 프로세스의 구성 및 배포를 단순화하기 위해 최선을 다하고 있습니다. 역할 설정이 다른 여러 지능형 바디의 배포를 지원하고 지능적인 ...
7개월 전
04.1K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...
7개월 전
03.7K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: 지식 그래프를 사용하여 에이전트의 장기 기억력을 향상시키는 오픈 소스 프로젝트

일반 소개 Memary는 자율 지능을 위한 장기 메모리 관리 솔루션을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 지식 그래프와 특수 메모리 모듈을 통해 지능이 기존 컨텍스트 윈도우의 한계를 극복하고 더 스마트한 상호 작용 경험을 달성할 수 있도록 지원합니다.Memary는 ...
7개월 전
04.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AI가 책을 읽습니다: AI가 PDF 책을 한 페이지씩 읽고 지식의 요점을 자동으로 추출하여 요약을 생성합니다.

종합 소개 AI-reads-books-page-by-page는 PDF 책의 페이지별 분석을 자동화하고 핵심 지식 포인트를 추출하며 지정된 페이지 간격 후 단계를 생성하는 Python 기반 지능형 PDF 책 분석 도구입니다....
7개월 전
03.5K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: 다국어 이미지 텍스트를 생성하고 편집할 수 있으며, 이미지에 여러 줄의 중국어를 생성하도록 고도로 제어할 수 있습니다.

종합 소개 AnyText는 확산 모델을 기반으로 개발된 혁신적인 다국어 시각 텍스트 생성 및 편집 도구입니다. 이미지에서 자연스러운 고품질 다국어 텍스트를 생성하고 유연한 텍스트 편집 기능을 지원합니다. 연구팀이 개발하여 ICLR 2024에서 발표했습니다...
7개월 전
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: 디지털 맨 통합 시스템의 오픈 소스 클론, 무료 디지털 맨 클라이언트를 원클릭으로 배포할 수 있습니다.

종합 소개 AigcPanel은 모든 사용자를 위한 원스톱 AI 디지털 휴먼 제작 시스템으로, 전자+뷰3+타입스크립트 기술 스택으로 개발되어 Windows에서 원클릭 배포를 지원합니다. 이 시스템은 핵심인 사용자 친화적으로 설계되었습니다.
7개월 전
03.3K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.
7개월 전
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot 백엔드 프록시 서비스: 다른 모델로 GitHub Copilot 플러그인 서버 인수하기

일반 소개 Copilot 백엔드 에이전트 서비스는 여러 사람이 공식 계정을 공유하는 것을 지원하면서 DeepSeek와 같은 다른 FIM 모델을 활용하여 GitHub Copilot 플러그인 서버를 관리하도록 설계된 오픈 소스 프로젝트입니다. 이 서비스는 V를 포함한 다양한 IDE를 지원합니다.
8개월 전
02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

제미니 밸런스: 제미니 모델 API는 OpenAI 형식과 호환되며, 지역 제한을 해제하고 다중 API 키 폴링을 지원합니다.

종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...
4개월 전
02.9K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: 확장 가능한 플러그인을 갖춘 완전한 기능의 경량 크로스 플랫폼 AI 클라이언트

포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.
8개월 전
02.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

딥시크 엔지니어: 딥시크 API를 기반으로 하는 실험적인 코딩 도우미로, 큐워드가 포함되어 있습니다.

일반 설명 DeepSeek Engineer는 직관적인 명령줄 인터페이스를 통해 사용자와 상호 작용하여 다양한 소프트웨어 개발 작업을 지원하는 DeepSeek API 기반의 강력한 프로그래밍 도우미 도구입니다. 이 도구는 대규모 언어 모델링의 강력한 기능과 실제 ...
6개월 전
03K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: 통합된 멀티 플랫폼 AI 모델을 갖춘 간단한 웹 채팅 인터페이스(배포 필요 없음)

일반 소개 오리온챗은 사용자에게 여러 주류 AI 모델과 상호 작용할 수 있는 통합 플랫폼을 제공하는 웹 기반 AI 채팅 인터페이스입니다. 이 프로젝트는 Ollama(로컬에서 실행), OpenAI GPT, Google Gemi... 등 다양한 AI 모델을 지원합니다.
8개월 전
02.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: X 사용자 데이터 및 트윗을 위한 트위터 데이터 크롤링 및 애널리틱스

일반 소개 X-Kit은 X(이전의 트위터) 사용자 데이터와 트윗을 크롤링하고 분석하기 위해 설계된 오픈 소스 도구입니다. GitHub 사용자 xiaoxiunique가 개발한 이 도구는 사용자가 특정 X 사용자에 대한 기본 정보와 트윗을 얻는 프로세스를 자동화할 수 있도록 설계되었습니다.
8개월 전
02.9K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Gemini 모델을 사용하여 클릭 한 번으로 짧은 내레이션 동영상 또는 긴 동영상의 동영상 요약을 만듭니다.

개요 AI2SRT는 GeminiAI 빅 모델을 사용하여 한 번의 클릭으로 짧은 내레이션 동영상과 긴 동영상의 동영상 요약을 생성하는 동시에 오디오 및 동영상 전사 자막을 지원하는 오픈 소스 프로젝트입니다. 이 프로젝트는 동영상 콘텐츠 제작 과정을 간소화하고 효율적인 자막 생성 및 번역 기능을 제공하는 것을 목표로 합니다. 사용자는 통과할 수 있습니다...
8개월 전
03K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
8개월 전
02.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: 사람의 자세를 정밀하게 제어하여 춤추는 여성을 만드는 동영상 생성

개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
8개월 전
02.5K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
7개월 전
04.2K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
8개월 전
03.5K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
8개월 전
03.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: 명령줄 터미널에서 실행되는 지능형 프로그래밍 도우미, ChatGPT 코드 인터프리터의 현지화된 대안

종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...
8개월 전
02.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.
8개월 전
03.3K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: 하이브리드 지식 그래프 및 벡터 검색을 위한 전문 지식 베이스 Q&A 프레임워크

종합 소개 KAG(지식 증강 생성)는 OpenSPG 엔진과 LLM(대규모 언어 모델)을 기반으로 하는 논리적 형식 안내 추론 및 검색 프레임워크입니다. 이 프레임워크는 전문 도메인 지식 기반 구축을 위해 특별히 설계되었습니다...
8개월 전
04.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: 동영상 저작권을 보호하는 고급 오픈 소스 동영상 히든 워터마크 삽입 및 추출 도구

일반 소개 VideoSeal은 Facebook Research에서 개발한 오픈 소스 동영상 워터마킹 도구로, 효율적인 동영상 워터마크 삽입 및 추출을 제공하기 위해 설계되었습니다. 이 도구는 최신 오픈 소스 모델을 지원하며 사전 학습된 모델, 학습 코드, 추론 코드 및 평가 도구가 포함되어 있습니다.
8개월 전
02.8K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: 모든 주요 i18n 라이브러리와 호환되는 AI를 사용한 애플리케이션 번역

일반 소개 Languine은 개발자가 앱의 로컬라이제이션 프로세스를 간소화할 수 있도록 Midday에서 개발한 강력한 번역 도구입니다. Languine을 사용하면 개발자는 AI 기술을 활용하여 정확하고 문맥에 맞는 번역을 신속하게 생성할 수 있으며, 다음과 같은 기능을 지원합니다.
8개월 전
02.9K