AI 오픈 소스 프로젝트

총 1020개 문서
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

코스모스: 세계 기본 모델, 물리적 세계의 AI 기본 모델을 구축하기 위한 플랫폼

포괄적인 소개 NVIDIA Cosmos는 개발자를 위한 월드 기반 모델링 플랫폼으로, 물리 AI 개발자가 물리 AI 시스템을 더 빠르고 효율적으로 구축할 수 있도록 특별히 설계되었습니다. 이 플랫폼은 확산 및 자동 회귀 월드 기반 등 다양한 사전 훈련된 모델을 제공합니다.
1 년 전
061.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: 단일 동영상에서 멀티뷰 동영상을 생성하기 위한 렌더링 도구

일반 소개 ReCamMaster는 오픈 소스 동영상 처리 도구로, 핵심 기능은 단일 동영상에서 새로운 카메라 뷰를 생성하는 것입니다. 사용자는 카메라 트랙을 지정하고 비디오를 다시 렌더링하여 다양한 각도의 역동적인 영상을 얻을 수 있습니다. 절강대학교와 레이서 테크놀로지 팀이 개발한 이 도구는 텍스트-투-텍스트를 기반으로 합니다.
1 년 전
061.4K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: 정적 3D 모델에서 스켈레탈 구조 애니메이션 에셋 생성

개요 MagicArticulate는 ByteDance가 난양공과대학교(NTU)와 협력하여 개발한 AI 프레임워크로, 정적 3D 모델을 애니메이션이 가능한 디지털 에셋으로 빠르게 변환하는 데 중점을 두고 있습니다. 고급 자동 회귀 트랜스포머와 기능 확산 모델인 셀프 ...
1 년 전
061.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

딥 파인더: 로컬 지식을 이용한 심층 추론 검색을 위한 오픈 소스 프로젝트

종합 소개 Deep Searcher는 개인 데이터를 기반으로 검색, 평가 및 추론하도록 설계된 LLM(대규모 언어 모델)과 벡터 데이터베이스를 결합하여 매우 정확한 답변과 포괄적인 보고서를 제공하는 강력한 도구입니다. 엔터프라이즈 지식 관리에 적합합니다...
1 년 전
061.3K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

클로드 엔지니어: 클로드 모델을 사용하여 AI 도구를 자율적으로 생성하고 관리하는 지능형 바디 대화 도우미입니다.

일반 소개 클로드 엔지니어는 도리앤다코가 개발한 대화형 명령줄 인터페이스(CLI)로, 앤트로픽의 클로드 3.5-소넷 모델을 활용하여 소프트웨어 개발 작업을 지원합니다...
1 년 전
061.3K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: 안전한 오프라인을 위한 스마트 프로그래밍 지원, 네이티브 LLM 기반 Vim 프로그래밍 도우미

일반 소개 VimLM은 네이티브 LLM(대규모 언어 모델)으로 구동되는 코드 어시스턴트를 제공하는 Vim 플러그인입니다. Vim 명령을 통해 기본 LLM 모델과 상호 작용하여 코드 컨텍스트를 자동으로 가져와 사용자가 Vim에서 코드를 편집할 수 있도록 도와줍니다.VimLM은 다음에서 영감을 받았습니다.
1 년 전
061.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

검색 o1: 추론 모델이 능동적으로 검색할 수 있도록 지원하여 대규모 모델이 사고하면서 외부 지식을 검색할 수 있도록 합니다.

종합 소개 Search-o1은 고급 검색 메커니즘을 통합하여 대규모 추론 모델(LRM)의 성능을 향상시키는 것을 목표로 하는 오픈 소스 프로젝트입니다. 핵심 아이디어는 동적 검색과 지식 통합을 통해 추론 과정에서 발생하는 지식 결핍 문제를 해결하는 것입니다. 이 프로젝트는 sunn이 후원합니다...
1 년 전
061.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
11개월 전
061.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: 문서를 구조화된 데이터로 추출하고 분류하여 문서 처리 프로세스를 최적화합니다.

포괄적인 소개 ExtractThinker는 LLM(대규모 언어 모델)을 사용하여 문서에서 구조화된 데이터를 추출하고 분류하는 유연한 문서 인텔리전스 도구로, 원활한 ORM과 같은 문서 처리 워크플로우를 제공합니다. Tess를 비롯한 다양한 문서 로더를 지원합니다.
1 년 전
061.2K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: 자연어를 SQL 쿼리로 변환하는 오픈 소스 도구

포괄적 인 소개 OpenSearch-SQL은 오픈 소스 프로젝트로, 데이터베이스에 익숙하지 않은 사람들이 데이터에 쉽게 액세스 할 수 있도록 사용자의 자연어 설명을 SQL 쿼리 문으로 변환 할 수있는 강력한 Text-to-SQL 도구입니다. 이 프로젝트는 O에 의해 개발되었습니다 ...
1 년 전
061.2K
Plandex:支持超长上下文的开源AI编码助手

Plandex: 매우 긴 컨텍스트를 지원하는 오픈 소스 AI 코딩 도우미

일반 소개 Plandex는 대규모의 복잡한 소프트웨어 프로젝트를 위해 설계된 오픈 소스 엔드투엔드 AI 코딩 도우미입니다. 다단계 작업을 계획 및 실행하고 최대 2백만 토큰의 컨텍스트를 처리하며 30개 이상의 프로그래밍 언어를 지원할 수 있으며, Plandex는 ...
12개월 전
061.2K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

일반 설명 Charla는 모국어 모델과 대화할 수 있도록 설계된 엔드포인트 기반 채팅 애플리케이션입니다. 이 애플리케이션은 Ollama 백엔드와 통합되어 문맥 인식 대화를 지원하며 채팅 세션을 마크다운 파일로 저장합니다. 사용자는 간단히...
1 년 전
060.9K
오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라는 대규모 언어 모델(LLM)을 기반으로 다중 지능 협업 시스템을 구축하는 데 중점을 둔 혁신적인 경량 Python 프레임워크입니다. 여러 AI 지능이 교향악단처럼 조화롭게 작동할 수 있도록 지능을 배열하는 고유한 방법을 사용합니다. 모델링으로 ...
1 년 전
060.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.
1 년 전
060.9K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: 의류 디테일의 사실감을 높여주는 고충실도 AI 가상 피팅 도구

종합 소개 FitDiT는 확산 변압기(확산 트랜스포머)를 기반으로 한 고충실도 가상 피팅 시스템입니다. 텐센트 AI 랩에서 개발한 이 프로젝트는 의류 디테일을 보여주는 기존 가상 피팅 시스템의 한계를 해결하는 것을 목표로 합니다.FitD...
1 년 전
060.9K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

일반 소개 RAGLite는 검색 증강 생성(RAG)을 위한 Python 툴킷으로, PostgreSQL 또는 SQLite 데이터베이스를 지원합니다. 사용자가 다양한 언어 모델과 재주문자를 선택할 수 있는 유연한 구성 옵션을 제공합니다....
1 년 전
060.9K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

종합 소개 Maestro는 Roboflow에서 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하여 누구나 자신만의 시각적 매크로 모델을 훈련할 수 있도록 개발한 도구입니다. 이 도구는 F와 같이 널리 사용되는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공합니다.
1 년 전
060.9K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: 1분 안에 1분짜리 동영상을 생성한다고 주장하는 효율적인 동영상 오픈소스 프로젝트

종합 소개 Magic 1-For-1은 메모리 사용량을 최적화하고 추론 지연 시간을 줄이기 위해 설계된 효율적인 비디오 생성 모델입니다. 이 모델은 텍스트 대 비디오 생성 작업을 텍스트 대 이미지 생성 및 이미지 대 비디오 생성이라는 두 가지 하위 작업으로 분해하여 보다 효율적인 학습 및 증류 작업을 가능하게 합니다.
1 년 전
060.9K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: 클릭 한 번으로 로컬 LLM 개발 환경을 배포하고 AI 서비스를 쉽게 관리 및 실행할 수 있는 컨테이너화된 도구 세트입니다.

개요 Harbor는 로컬 AI 개발 환경의 배포와 관리를 간소화하는 데 중점을 둔 혁신적인 컨테이너형 LLM 도구 세트입니다. 깔끔한 명령줄 인터페이스(CLI)와 컴패니언 애플리케이션을 통해 개발자는 클릭 한 번으로 LLM 백엔드, API 인터페이스, 프런트엔드 등을 시작하고 관리할 수 있습니다.
1 년 전
060.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita: 모듈식 RAG 애플리케이션을 구축하고 다양한 RAG 전략을 신속하게 테스트하기 위한 오픈 소스 프레임워크

포괄적인 소개 Cognita는 RAG(검색 증강 세대) 기반 애플리케이션의 개발을 간소화하기 위해 TrueFoundry에서 개발한 오픈 소스 프레임워크입니다. 이 프레임워크는 구조화되고 수정 가능한 ...
1 년 전
060.8K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook: 완전한 TypeScript 프로젝트를 빠르게 빌드하고 반복하는 오픈 소스 풀스택 AI 엔지니어

일반 소개 Srcbook은 AI 어시스턴트를 사용하여 웹 애플리케이션을 빠르게 만들고 반복할 수 있도록 설계된 TypeScript 중심 애플리케이션 개발 플랫폼입니다. 기본 런타임을 지원하고, 대화형 노트북 인터페이스를 제공하며, 사용자가 백엔드 코드를 작성하고 실행할 수 있습니다.
1 년 전
060.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: 와이어프레임을 업로드하여 Llama4 기반 프런트엔드 코드 생성하기

일반 소개 Napkins.dev는 무료 오픈 소스 프로젝트로, 핵심 기능은 사용자가 인터페이스 스크린샷이나 와이어프레임을 업로드하여 실행 가능한 프런트엔드 코드를 자동으로 생성할 수 있도록 하는 것입니다. 사용자는 디자인 도면만 제공하면 되며, 도구는 Llama 4 모델(Together ...
1 년 전
060.7K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: 이미지 단서 단어의 일괄 역전파를 위한 오픈 소스 경량 시각 언어 모델

종합 소개 Moondream은 딥러닝과 컴퓨터 비전 기술을 통해 이미지 설명 기능을 구현하도록 설계된 오픈 소스 경량 시각 언어 모델입니다. 이 모델은 다양한 플랫폼에서 효율적으로 실행할 수 있으며 특히 엣지 디바이스에 적합합니다.Moondream은 고급 기술을 사용하며...
1 년 전
060.7K
Cloudflare Agents:在边缘网络上构建实时交互的智能体

Cloudflare 에이전트: 엣지 네트워크에서 실시간 대화형 인텔리전스 구축

일반 소개 Cloudflare 에이전트는 개발자가 글로벌 에지 네트워크에서 지능형 AI 에이전트를 구축할 수 있도록 설계된 Cloudflare의 오픈 소스 개발 프레임워크입니다. 에이전트는 상태를 유지하고, 실시간으로 통신하며, 자율적으로 실행할 수 있는 기능을 제공하며, 현재 항목...
1 년 전
060.6K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: 서로 다른 AI 인텔리전스 프레임워크를 연결하여 실시간으로 협업할 수 있는 통합 플랫폼

일반 소개 Mahilo는 오픈 소스 다중 지능 통합 플랫폼으로, 개발자 Jayesh Sharma가 GitHub에 공개했으며, 사용자가 서로 다른 프레임워크의 AI 지능을 연결하여 실시간 커뮤니케이션, 인간과 컴퓨터의 상호작용, 지능형 협업을 지원할 수 있도록 설계되었습니다. The ...
1 년 전
060.6K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: 무음 동영상에 생생한 동기화 사운드 추가하기

일반 소개 FoleyCrafter는 무음 동영상에 생생하고 동기화된 음향 효과를 생성하기 위해 OpenMMLab에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 고급 인공 지능 기술을 사용하여 비디오 콘텐츠를 분석하여 의미적으로 관련성이 높고 시간에 동기화된 음향 효과를 생성합니다....
1 년 전
060.6K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

판토매트릭스(EMAGE): 전신 제스처 생성 프레임워크, 오디오에서 전신 제스처를 생성하는 3D 애니메이션 프레임워크

종합 소개 판토매트릭스는 얼굴, 신체 일부, 손, 전신 움직임을 포함한 오디오 및 부분 제스처로부터 사람의 완전한 움직임을 생성할 수 있는 고급 전신 제스처 생성 프레임워크입니다. 이 프레임워크는 최신 멀티모달 데이터 세트와 딥러닝 기술을 활용하여 고품질의 3D...
1 년 전
060.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

라이트 카드: HTML5 카드 생성기 도구, 간단한 도구로 아름다운 콘텐츠 카드 만들기

일반 설명 라이트카드는 사용자가 멋진 콘텐츠 카드를 쉽게 만들 수 있도록 설계된 간단하고 우아한 카드 생성 도구입니다. 이 도구는 사용자 지정 텍스트 콘텐츠, 여러 테마 스타일 및 QR 코드를 지원하여 더 쉽고 재미있게 만들 수 있습니다. 사용자는 제목, 본문, 작성자를 편집할 수 있습니다.
1 년 전
060.6K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: 음성-텍스트 변환을 지원하는 휴대용 AI 음성 일기장 앱입니다.

개요 ALog는 사용자가 음성으로 일상을 기록할 수 있도록 설계된 AI 기반 음성 일기장 애플리케이션입니다. duxins가 개발했으며 GitHub에서 오픈소스입니다. 사용자는 음성 입력을 통해 일기 항목을 녹음할 수 있으며, 앱은 음성을 자동으로 텍스트로 변환합니다....
1 년 전
060.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

라마 튜터: 개인 맞춤형 과외를 제공하는 AI 도구로, 라마 3.1을 기반으로 구축된 오픈 소스 AI 개인 튜터 프로젝트입니다.

일반 소개 라마 튜터는 사용자에게 개인화된 학습 경험을 제공하도록 설계된 라마 3.1 기반의 오픈 소스 AI 개인 비서 프로젝트입니다. Together AI, Next.js 및 T와 같은 여러 기술 스택을 통합하여 ...
1 년 전
060.5K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: 한 문장으로 다중 지능 작업 협업 도구 구축하기

일반 소개 쿠라젠트는 칭화대학교의 LeapLab에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 에이전트 협업 프레임워크로, 사용자가 한 문장 설명으로 지능형 AI 에이전트를 만들 수 있으며 복잡한 작업에서 여러 에이전트가 협업할 수 있도록 지원합니다. 이 프레임워크는 두 가지 기능을 제공합니다.
11개월 전
060.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: 문서 정리를 위한 지식 관리 시스템으로, 모든 RAG 시스템에 원활하게 통합됩니다.

일반 소개 Simba는 모든 검색 증강 생성(RAG) 시스템과 원활하게 통합되도록 설계된 휴대용 지식 관리 시스템(KMS)입니다. GitHub 사용자 GitHamza0206이 만든 이 프로젝트는 다양한 분야에 효율적인 지식 관리 솔루션을 제공합니다.
1 년 전
060.5K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: 확장 가능한 플러그인을 갖춘 완전한 기능의 경량 크로스 플랫폼 AI 클라이언트

포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.
1 년 전
060.5K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

로컬 장치에서 여러 문서와 통신하여 데이터 프라이버시 보장: 로컬 장치에서 여러 문서와 통신하여 데이터 프라이버시 보장

일반 소개 LocalGPT는 사용자가 로컬 장치에서 문서와 대화할 수 있도록 설계된 오픈 소스 프로젝트로, 데이터 프라이버시를 보장합니다. 다양한 오픈 소스 모델을 사용하여 LocalGPT는 클라우드에 데이터를 업로드하지 않고도 문서 콘텐츠를 처리하고 이해할 수 있습니다. 이 프로젝트는 다양한 ...
1 년 전
060.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: 통합된 멀티 플랫폼 AI 모델을 갖춘 간단한 웹 채팅 인터페이스(배포 필요 없음)

일반 소개 오리온챗은 사용자에게 여러 주류 AI 모델과 상호 작용할 수 있는 통합 플랫폼을 제공하는 웹 기반 AI 채팅 인터페이스입니다. 이 프로젝트는 Ollama(로컬에서 실행), OpenAI GPT, Google Gemi... 등 다양한 AI 모델을 지원합니다.
1 년 전
060.3K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDF를 오픈 소스 도구의 팟캐스트로 변환하기

일반 소개 Open NotebookLM은 모든 PDF 문서를 팟캐스트로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 오픈 소스 LLM(대규모 언어 모델) 및 TTS(텍스트 음성 변환) 모델을 사용하여 PDF 콘텐츠를 처리하여 오디오 팟캐스트에 적합한 자연스러운 대화를 생성합니다....
1 년 전
060.3K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

롱라이터: 위즈덤 스펙트럼은 매우 긴 텍스트를 생성하는 강력한 모델을 출시하여 단일 대화에서 10,000개 이상의 단어를 생성할 수 있도록 지원합니다.

종합 소개 LongWriter는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 강력한 긴 텍스트 생성 도구입니다. 이 도구는 고급 장문 언어 모델(LLM)을 기반으로 하며 10,000단어 이상의 긴 텍스트를 생성할 수 있습니다.LongWriter...
1 년 전
060.3K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

딥 리서치: 효율적인 리서치 도구와 보고서 생성 기능을 제공하는 AI 기반 딥 리서치 도우미

일반 소개 딥 리서치는 검색 엔진, 웹 크롤링, 대규모 언어 모델을 결합하여 반복적인 심층 연구를 수행하도록 설계된 AI 기반 리서치 어시스턴트입니다. 이 프로젝트는 사용하기 쉬운 딥 리서치 제네레이션을 제공한다는 목표로 dzhng에 의해 GitHub에 공개되었습니다.
1 년 전
060.3K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

에이전트래버토리: 지능형 에이전트로 과학 연구의 전 과정을 완료하기 위한 오픈 소스 도구입니다.

일반 소개 에이전트래버러토리는 GitHub에서 호스팅되는 오픈 소스 도구로 Samuel Schmidgall이 개발했습니다. 이 도구는 대규모 언어 모델(LLM)로 구동되는 지능형 에이전트를 사용하여 연구자들이 과학의 전체 프로세스를 수행할 수 있도록 도와줍니다.
1 년 전
060.2K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

슈퍼위챗PC: 오픈소스 컴퓨터 소액 신용 기능 향상 도구, 2차 개발 지원

종합 소개 슈퍼위챗PC는 사용자와 개발자에게 편의를 제공하는 것이 핵심인 컴퓨터용 오픈소스 위챗 향상 도구입니다. 처음에는 위챗만 단독으로 열 수 있는 문제를 해결하고, 나중에 개발자가 메시지 전송과 같은 위챗 기능을 호출할 수 있도록 위챗SDK를 추가했습니다....
1 년 전
060.1K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: 모든 클라우드에서 AI 및 배치 작업을 효율적으로 실행하기 위한 오픈 소스 프레임워크

일반 소개 SkyPilot은 캘리포니아 버클리 대학교의 Sky Computing Lab에서 시작한 오픈 소스 프레임워크로, 사용자가 모든 클라우드 인프라에서 AI 및 일괄 처리 작업을 효율적으로 실행할 수 있도록 설계되었습니다. 14개 이상의 클라우드 서비스를 지원합니다(다음을 포함하여 ...
1 년 전
060.1K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

펭청스타링: 위스퍼-Large v3보다 더 작고 빠른 다국어 음성-텍스트 변환 도구

종합 소개 펭청스타링(PengChengStarling, 펭청랩스)은 다양한 언어의 음성을 해당 텍스트로 변환할 수 있는 다국어 자동 음성 인식(ASR) 툴입니다. 이 툴킷은 아이스폴 프로젝트를 기반으로 개발되었으며 완전한 음성 인식 프로세스를 제공합니다...
1 년 전
060.1K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: 프런트엔드 디자인을 위한 오픈 소스 커서, React 애플리케이션에서 코드를 디자인하고 게시하세요.

일반 소개 Onlook은 디자이너와 개발자를 위해 만들어진 오픈 소스 디자인 도구로, 사용자가 실행 중인 React 애플리케이션에서 직접 디자인하고 디자인 변경 사항을 코드로 변환할 수 있습니다. 이 도구는 Figma나 Webf...와 유사한 직관적인 시각적 편집 환경을 제공합니다.
1 년 전
060K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA, LangChain 출시: 분석을 위한 구조화된 보고서 작성을 위한 고급 가이드, AI 기반 기술 보고서 생성 지원

일반 소개 이 프로젝트는 랭체인과 엔비디아가 공동 개발한 구조화된 보고서 생성 청사진 프로젝트로, 깃허브의 주피터 노트북 튜토리얼에 소개되어 있습니다. 이 프로젝트는 고급 AI 기술, 특히 Llama-3.3-7...
1 년 전
060K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 메모리, 지식 및 도구로 AI 인텔리전스 구축

포괄적인 소개 PhiData는 지능형 AI 어시스턴트 개발을 위해 설계된 프레임워크입니다. 향상된 메모리, 지식 통합 및 도구 호출 기능을 통해 AI 어시스턴트가 장기적인 대화에 참여하고, 정확한 비즈니스 컨텍스트를 제공하며, 다양한 작업을 수행할 수 있도록 지원합니다.PhiData는 AI 어시스턴트의 기능을 향상시킬 뿐만 아니라...
1 년 전
060K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: 소스 코드 읽기 도구, LLM을 사용하여 코드를 분석하고, 자세한 코드 설명을 제공하고, 다양한 프로그래밍 언어를 지원합니다.

일반 소개 askrepo는 LLM(대규모 언어 모델)을 기반으로 하는 소스 코드 읽기 도구입니다. 지정된 디렉터리에 있는 Git 관리 텍스트 파일의 내용을 읽고 Google Gemini API로 전송하여 지정된 프롬프트에 따라 질문에 대한 답변을 제공할 수 있습니다.
1 년 전
060K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4: 중국어와 영어로 이중 언어 고해상도 이미지를 생성하는 오픈 소스 그래픽 모델

일반 소개 CogView4는 칭화대학교의 KEG Lab(THUDM)에서 개발한 오픈 소스 텍스트-그래프 모델로, 텍스트 설명을 고품질 이미지로 변환하는 데 중점을 두고 있습니다. 이중 언어 단서 단어 입력을 지원하며, 특히 중국어 단서를 이해하고 중국어 이외의 문자로 이미지를 생성하는 데 능숙합니다.
1 년 전
059.9K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.
1 년 전
059.9K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: 노드 오케스트레이션 기반의 AI 모델용 워크플로 시각화 클라이언트

일반 소개 노드툴은 AI 애호가, 개발자, 데이터 과학자, 크리에이터를 위한 간단하고 직관적인 인터페이스를 제공하도록 설계된 혁신적인 AI 저작 플랫폼입니다. 아티스트, 개발자, 초보자 모두 NodeTool을 사용하면 창의적인 프로토타입을 빠르게 제작할 수 있습니다.
1 년 전
059.7K
PromptWizard:优化提示工程的开源框架,提升任务性能

프롬프트 마법사: 프롬프트 프로젝트를 최적화하여 작업 성능을 향상시키는 오픈 소스 프레임워크

개요 PromptWizard는 Microsoft에서 개발한 오픈 소스 프레임워크로, 모델이 스스로 프롬프트 단어를 생성, 평가 및 개선하고 예제를 생성하여 지속적인 피드백을 통해 출력 품질을 개선할 수 있는 자체 진화 메커니즘을 사용합니다. 프롬프트 단어를 자율적으로 최적화하고 적절한 예제를 생성 및 선택할 수 있으며, ...
1 년 전
059.7K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: 엔터프라이즈급 제너레이티브 AI 애플리케이션을 위한 로우코드 개발 플랫폼

개요 BuffGPT는 대규모 언어 모델(LLM) 기반의 오픈 소스 AI 애플리케이션 개발 플랫폼으로, 데이터 처리, 모델 호출, RAG 검색, 시각적 워크플로 오케스트레이션 등의 기본 기능을 제공하여 사용자가 제너레이티브 AI 애플리케이션을 쉽게 구축하고 운영할 수 있도록 지원합니다. 이 플랫폼은 프라이빗을 지원합니다.
1 년 전
059.7K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: 인물 비디오를 사용하여 디지털 인물을 생성하도록 개선된 새드토커

일반 설명 새드토커 비디오 립싱크는 새드토커 구현에 기반한 비디오 립합성 도구입니다. 이 프로젝트는 음성 기반 생성을 통해 입술 모양을 생성하고 구성 가능한 얼굴 영역 향상을 사용하여 생성된 입술 모양의 선명도를 향상시킵니다....
1 년 전
059.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO: 단일 피사체 및 다중 피사체 맞춤형 이미지 생성 도구 지원(전자상거래 그래픽에 적합)

UNO는 바이트댄스 인텔리전트 크리에이션 팀이 개발한 오픈 소스 이미지 생성 프레임워크입니다. FLUX.1 모델을 기반으로 하며 "적은 것에서 더 많은 것"으로 일반화 접근 방식을 통해 단일 피사체 및 다중 피사체 맞춤형 이미지 생성에 중점을 둡니다.UNO는 확산 변환기를 사용합니다...
12개월 전
059.7K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: 지능형 자동 프로세스 승인과 인간 감사를 결합한 관리 도구

일반 소개 LLManager는 랭체인의 랭그래프 프레임워크를 기반으로 개발된 오픈소스 지능형 승인 관리 도구로, 승인 요청 처리를 자동화하는 동시에 사람의 검토와 함께 의사 결정을 최적화하는 데 중점을 둡니다. 시맨틱 검색, 샘플 적은 학습을 통해 이를 수행합니다.
12개월 전
059.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: 통합 OpenAI 인터페이스 스타일의 여러 대규모 모델 호출, 빠른 모델 전환 및 비교 테스트

포괄적인 소개 aisuite는 개발자가 여러 생성 AI 제공업체의 서비스를 쉽게 호출할 수 있도록 설계된 간단하고 통합된 인터페이스입니다. OpenAI와 유사한 인터페이스를 통해 가장 널리 사용되는 LLM(대규모 언어 모델)과 쉽게 상호 작용할 수 있는 aisuite...
1 년 전
059.6K
自动解析PDF内容并提取文字与表格的开源服务

PDF 콘텐츠를 자동으로 구문 분석하고 오픈 소스 서비스의 텍스트와 양식을 추출합니다.

종합 소개 PDF 문서의 레이아웃을 자동으로 분석하고 페이지의 텍스트, 제목, 이미지, 표, 수식 및 기타 요소를 식별하며 올바른 순서를 결정합니다. 이 도구는 OCR 기능을 지원하며 스캔한 PDF를 검색 가능한 텍스트로 변환할 수 있습니다. Docker에서 실행되며 두 가지 모델을 제공합니다...
1 년 전
059.5K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Nuxt 3 및 Ollama 기반의 로컬 실시간 채팅 애플리케이션 UI

포괄적 인 소개 ChatOllama는 대규모 언어 모델 (LLM)을 기반으로하는 오픈 소스 온라인 채팅 응용 프로그램 프로젝트로 수많은 언어 모델과 지식 기반 관리를 지원합니다. 사용자는 모델 관리(목록 표시, 다운로드, 삭제), 모델과의 채팅 및 기타 기능을 위해 플랫폼을 사용할 수 있습니다. 이 프로젝트는 ...
2 년 전
059.5K
OAK:可视化构建智能体应用的开源项目

OAK: 지능형 신체 애플리케이션을 시각적으로 구축하기 위한 오픈 소스 프로젝트

일반 소개 OAK(오픈 에이전트 키트)는 개발자가 AI 인텔리전스를 신속하게 구축, 사용자 지정 및 배포할 수 있도록 도와주는 오픈 소스 도구입니다. OpenAI, Google 또는 Anthropic과 같은 모든 대규모 언어 모델(LLM)을 연결할 수 있습니다.
1 년 전
059.5K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: 감독 지능을 사용하여 다중 지능 협업을 관리하기 위한 도구

일반 소개 LangGraph Supervisor는 다중 지능형 바디 시스템을 생성하고 관리하기 위해 설계된 LangGraph 프레임워크에 기반한 Python 라이브러리입니다. 이 라이브러리는 중앙 감독 에이전트를 통해 여러 전문 에이전트의 작업을 조정하여 통신 흐름과 작업을 분담합니다.
1 년 전
059.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus: 확장 가능한 AI 다중 지능 시스템 및 작업 자동화를 구축하기 위한 경량 프레임워크

일반 소개 PrimisAI Nexus는 GitHub에서 호스팅되고 PrimisAI 팀이 개발한 경량 오픈 소스 Python 프레임워크로, 사용자가 LLM(대규모 언어 모델링)을 통해 확장 가능한 AI 다중 지능형 바디 시스템을 구축하고 관리할 수 있도록 지원합니다....
1 년 전
059.4K
HumanOmni:分析人类视频情感和动作的多模态大模型

휴먼옴니: 사람의 비디오 감정과 행동을 분석하기 위한 멀티모달 매크로 모델

일반 소개 휴먼옴니는 HumanMLLM 팀에서 개발하여 깃허브에서 호스팅하는 오픈 소스 멀티모달 빅 모델입니다. 휴먼 비디오 분석에 중점을 두고 있으며, 영상과 소리를 모두 처리하여 감정, 행동 및 대화 내용을 이해하는 데 도움을 줍니다. 이 프로젝트에는 2...
1 년 전
059.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: 여러 플랫폼과 호환되는 현지화된 AI 채팅 도우미

일반 소개 NextChat은 사용자가 GPT-3, GPT-4, GPT-4.5 및 Gemini Pro와 같은 동급 최고의 언어 모델을 사용하여 채팅 서비스를 배포할 수 있는 혁신적인 AI 채팅 서비스입니다. 우아한 사용자 인터페이스, 공동 작업 기능, 통합, 템플릿 및 ...
1 년 전
059.3K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

로보 블로거: 랭그래프 기반의 음성 콘텐츠에서 블로그 게시물 생성, 자동화된 블로그 작성

일반 소개 Robo Blogger는 음성-텍스트 기술을 통해 콘텐츠 생성 과정을 간소화하도록 설계된 혁신적인 블로그 생성 도구입니다. 사용자는 모든 음성-텍스트 애플리케이션을 통해 아이디어를 녹음할 수 있으며, Robo Blogger는 이러한 아이디어를 구조화된 블로그 콘텐츠로 변환합니다....
1 년 전
059.3K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 자연어 설명으로 비디오 검색, 편집 및 생성 워크플로우를 수행하는 지능형 비디오 에이전트 프레임워크입니다.

개요 Director는 지능형 비디오 에이전트를 구축하여 비디오 상호 작용 및 워크플로우를 간소화하고 최적화하도록 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 VideoDB의 '데이터형 비디오' 인프라를 기반으로 하며 검색, 편집, 컴파일, 생성 등 복잡한 비디오 작업을 처리할 수 있습니다.
1 년 전
059.2K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

비전 에이전트: 다양한 시각적 표적 감지 작업을 해결하는 시각적 인텔리전스

일반 소개 비전 에이전트는 랜딩AI(팀 엔다 우)가 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트로, 사용자가 컴퓨터 비전 작업을 해결하기 위한 코드를 빠르게 생성할 수 있도록 설계되었습니다. 고급 에이전트 프레임워크와 멀티모달 모델을 사용합니다...
1 년 전
059.2K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: 코드 구조와 콘텐츠로부터 마크다운 문서를 자동으로 생성합니다.

일반 소개 CodeWeaver는 코드 라이브러리를 탐색하기 쉬운 하나의 마크다운 문서로 엮도록 설계된 명령줄 도구입니다. 디렉터리를 재귀적으로 스캔하고 각 파일의 내용을 코드 블록에 포함시켜 프로젝트의 파일 계층 구조를 구조적으로 표현합니다. 이 도구는...
1 년 전
059.1K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG 웹 UI: 지능형 문서 Q&A 시스템 구축 및 비공개 웹 사이드 지식창고 간편하게 구축하기

종합 소개 RAG 웹 UI는 RAG(검색 증강 생성) 기술을 기반으로 한 지능형 대화 시스템입니다. 기업과 개인이 자체 지식 베이스를 기반으로 지능형 Q&A 시스템을 구축할 수 있도록 도와줍니다. 문서 검색과 대규모 언어 모델을 결합하여 정확하고 신뢰할 수 있는 ...
1 년 전
059K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT: 워크플로 자동화 및 자율적 작업 실행을 위한 지능형 바디 구축 플랫폼

일반 설명 AutoGPT는 사용자가 지속적으로 실행되는 AI 에이전트를 생성, 배포, 관리하고 복잡한 워크플로를 자동화할 수 있도록 설계된 강력한 플랫폼입니다. 시그니피컨트 그라비타스에서 개발한 이 플랫폼은 사용자가 집중할 수 있는 다양한 도구와 기능을 제공합니다.
1 년 전
059K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: AI를 통해 마우스 동작을 셀레늄 파이썬 스크립트로 변환하는 브라우저 자동화 코드 생성

일반 소개 AutoMouser는 사용자 상호작용을 지능적으로 추적하고 OpenAI의 GPT 모델을 사용하여 셀레늄 테스트 코드를 자동으로 생성하는 Chrome 확장 프로그램입니다. 사용자 브라우저 동작을 기록하고 이를 변환하여 이를 수행합니다.
1 년 전
059K