AI 오픈 소스 프로젝트

총 1020개 문서
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 고품질 선화 및 스케치 생성, 이미지 단서 단어 역전파, 원클릭 패키지 설치

일반 소개 Sketch-Gen은 아티스트와 디자이너가 고품질의 선화와 스케치를 빠르게 생성할 수 있도록 설계된 AI 기술 기반의 선화 및 스케치 생성 도구입니다. 페인츠-언두 프로젝트에서 파생된 이 도구는 고급 머신 러닝 모델을 사용해 다음을 수행할 수 있습니다.
8개월 전
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: 다국어 입력 및 긴 비디오 생성을 지원하는 Vincennes 비디오 모델

종합 소개 Step-Video-T2V는 StepFun AI(StepFun Star)의 고급 텍스트-비디오 변환 모델입니다. 이 모델에는 30억 개의 매개변수가 있으며 최대 204fps의 동영상을 생성할 수 있습니다. 고도로 압축된 가변 자동 인코더(VAE)를 통해 이 모델은 ...
6개월 전
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

에이전트 클라이언트 데모: 직관적인 그래픽 사용자 인터페이스를 제공하여 지능형 바디를 실행하는 프로세스를 시연하는 Python 클라이언트

종합 소개 AgentClientDemo는 지능형(에이전트) 및 클라이언트(클라이언트) 기능을 통합하는 종합적인 Python 프로젝트입니다. 이 프로젝트는 PyQt 프레임워크를 기반으로 하며 직관적이고 사용하기 쉬운 그래픽 사용자 인터페이스(G...
8개월 전
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: LLM 취약점을 탐지하고 안전한 생성 AI를 위한 오픈 소스 도구

포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
9개월 전
02.7K
Coding Agent:基于Langgraph构建的简单编程助手

코딩 에이전트: 랭그래프 기반의 간단한 프로그래밍 도우미

일반 소개 코딩 에이전트는 개발자의 프로그래밍 효율성 향상을 돕기 위해 AbhinavTheDev에서 개발한 지능형 프로그래밍 어시스턴트입니다. 이 도구는 인공 지능 기술을 사용하여 자동으로 코드를 생성하고, 프로그래밍 제안을 제공하며, 개발자에게 다양한 코딩을 지원합니다.
7개월 전
02.7K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: 다중 지능형 협업 애플리케이션을 만들기 위한 효율적인 프레임워크

일반 소개 AIEvo는 멀티 에이전트 애플리케이션을 효율적으로 생성하기 위해 설계된 Ant Group의 오픈 소스 멀티 에이전트 프레임워크입니다. 이 프레임워크는 복잡한 작업의 실행 성공률을 높이기 위해 SOP 작업 그래프를 엄격하게 따르며, 피드백 및 모니터링 메커니즘을 통해 높은 유연성과 확장성을 보장합니다.AIEvo는 Ant Group 내에서 제작되었습니다...
7개월 전
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
6개월 전
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
5개월 전
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: 노드 오케스트레이션 기반의 AI 모델용 워크플로 시각화 클라이언트

일반 소개 노드툴은 AI 애호가, 개발자, 데이터 과학자, 크리에이터를 위한 간단하고 직관적인 인터페이스를 제공하도록 설계된 혁신적인 AI 저작 플랫폼입니다. 아티스트, 개발자, 초보자 모두 NodeTool을 사용하면 창의적인 프로토타입을 빠르게 제작할 수 있습니다.
8개월 전
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

솔라나 에이전트 키트: AI 인텔리전스를 솔라나 프로토콜에 연결하기 위한 오픈 소스 툴킷

일반 소개 솔라나 에이전트 키트는 AI 지능을 솔라나 블록체인 프로토콜에 원활하게 연결하도록 설계된 오픈 소스 툴킷입니다. 이 키트를 사용하면 AI 연구자와 암호화폐 개발자 모두 모델 훈련을 받은 지능형 기관을 사용하여 다음을 실행할 수 있습니다.
6개월 전
02.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: 와이어프레임을 업로드하여 Llama4 기반 프런트엔드 코드 생성하기

일반 소개 Napkins.dev는 무료 오픈 소스 프로젝트로, 핵심 기능은 사용자가 인터페이스 스크린샷이나 와이어프레임을 업로드하여 실행 가능한 프런트엔드 코드를 자동으로 생성할 수 있도록 하는 것입니다. 사용자는 디자인 도면만 제공하면 되며, 도구는 Llama 4 모델(Together ...
4개월 전
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

위챗 마크다운 에디터: 간단하고 효율적인 위챗 그래픽 레이아웃 도구, 위챗 공개 번호에 기사를 붙여넣는 열쇠입니다.

종합 소개 WeChat 마크다운 편집기(WeChat 마크다운 편집기)는 사용자가 아름다운 WeChat 게시물을 쉽게 작성할 수 있도록 설계된 매우 간결한 WeChat 그래픽 레이아웃 도구입니다. 이 에디터는 모든 기본 마크다운을 지원합니다.
7개월 전
02.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: 비정형 데이터 및 복잡한 쿼리를 위한 검색 엔진

일반 소개 dsRAG는 비정형 데이터에 대한 복잡한 쿼리를 처리하도록 설계된 고성능 검색 엔진입니다. 재무 보고서, 법률 문서, 학술 논문과 같은 밀도가 높은 텍스트의 까다로운 쿼리에서 특히 뛰어난 성능을 발휘합니다. dsRAG는 성능 향상을 위해 세 가지 주요 접근 방식을 사용합니다.
6개월 전
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 방대한 다중 소스 문서에서 콘텐츠를 검색하고 지식을 요약하세요.

종합 소개 wdoc은 대량의 다양한 문서를 처리하고 분석하기 위해 설계된 강력한 RAG(검색 증강 생성) 시스템입니다. PDF, 웹 페이지, YouTube 동영상, 오디오 파일 등 다양한 문서 유형에서 검색할 수 있으며, 특히 다음과 같은 처리에 적합합니다.
6개월 전
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: 실시간으로 AI 뉴스를 추적 및 요약하고, WeChat에 자동으로 게시합니다.

일반 소개 ai-trend-publish는 인공지능의 최신 트렌드를 실시간으로 추적하고 게시하는 데 중점을 두고 OpenAISpace 팀에서 개발한 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 이 도구는 개발자, 기술 애호가를 돕기 위해 설계되었습니다.
5개월 전
02.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

일반 소개 Agno는 개발자가 메모리, 지식 및 도구를 사용하여 AI 인텔리전스를 쉽게 구축할 수 있도록 지원하기 위해 agno-agi 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 Python 라이브러리입니다. 멀티모달 텍스트, 이미지, 오디오, 비디오를 지원합니다.
5개월 전
02.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: 오픈 소스 LLM 프로그래밍 기능 비교 아레나, 최고의 코드 생성 모델에 대한 실시간 보기

일반 소개 CodeArena는 실시간 대결을 통해 최고의 오픈 소스 코드 생성 모델(LLM)을 선보이기 위해 고안된 독특한 플랫폼입니다. 사용자는 동일한 프로그래밍 작업에서 서로 다른 LLM이 경쟁하는 모습을 보고 실시간 순위표를 통해 가장 우수한 모델을 확인할 수 있습니다. 이 플랫폼은 Tog...
8개월 전
02.6K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

크로노스: 뉴스 검색 및 타임라인 생성 효율성을 개선하는 뉴스 타임라인 요약 도구

일반 소개 CHRONOS는 Alibaba NLP 팀에서 개발한 뉴스 타임라인 요약 도구입니다. 이 도구는 반복적 인 자체 질문을 통해 뉴스 이벤트의 타임 라인 요약을 생성합니다.CHRONOS는 오픈 도메인 타임 라인 요약 작업을 처리 할 수있을뿐만 아니라 효율성과 확장 성 측면에서도 ...
7개월 전
02.6K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: 인기 기술 기사를 바로 들을 수 있는 오디오 팟캐스트로 전환하기

일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...
3 개월 전
02.6K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: 자연어 명령을 통해 CAD 소프트웨어를 제어하는 MCP 서비스

일반 소개 CAD-MCP는 사용자가 도면 작업을 위한 자연어 명령을 통해 CAD 소프트웨어를 제어할 수 있는 오픈 소스 프로젝트입니다. 자연어 처리와 CAD 자동화 기술을 결합하여 사용자가 CAD 인터페이스를 수동으로 조작할 필요 없이 간단한 텍스트 명령어를 입력하기만 하면 됩니다.
3 개월 전
02.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: 카툰 음영, 흑백 이미지의 자동 음영으로 이미지 색상 일관성 및 품질 향상

종합 소개 ColorFlow는 흑백 이미지 시퀀스의 자동 채색 문제를 해결하기 위해 Tencent ARC 팀에서 개발한 이미지 시퀀스 자동 채색 도구입니다. 이 도구는 검색 기능이 강화된 셰이딩 파이프라인을 사용하여 캐릭터의 헤어 컬러와 서비스를 포함한 참조 이미지 풀을 통해 다양한 요소의 컬러를 정확하게 생성합니다.
8개월 전
02.6K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

클릭클릭클릭: 모든 LLM을 활성화하여 Android 및 PC 작업을 자동화하세요.

일반 소개 클릭클릭클릭은 반다랩스에서 개발한 프레임워크로, 로컬 또는 원격 LLM(대규모 언어 모델)을 사용해 안드로이드와 PC 작업을 자동화하는 것을 목표로 합니다. 이 프로젝트는 현재 매우 실험적인 단계에 있으며 다음과 같은 다양한 모델을 지원합니다.
8개월 전
02.6K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: 아이들이 손으로 그린 낙서를 애니메이션으로 변환하는 자동화된 어린이 그림 애니메이션 생성 도구

일반 소개 AnimatedDrawings는 자동화 기술을 통해 어린이들의 그림을 애니메이션 캐릭터로 변환하기 위해 Facebook Research에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 "A Method for A...
8개월 전
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree(ChatAnywhere-2): 모든 창에서 대화를 완료할 수 있도록 지원하는 GPT API를 사용하여 만든 네이티브 코파일럿입니다.

일반 소개 ChatFree는 사용자의 AI 앱을 브라우저의 제약에서 벗어나 로컬에서 실행할 수 있도록 하는 것을 목표로 하는 오픈 소스 프로젝트입니다. GPT API를 사용하여 만들어진 Copilot은 Office, Word, WPS 등과 같은 다양한 오피스 소프트웨어를 지원하도록 설계되었습니다. 이 프로젝트의 개발자는 ...
8개월 전
02.6K
Easy Dataset:创建大模型微调数据集的简易工具

간편한 데이터 세트: 대규모 모델 미세 조정 데이터 세트를 생성하기 위한 간단한 도구

종합 소개 Easy Dataset은 대규모 모델(LLM)의 미세 조정을 위해 특별히 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 사용자가 파일을 업로드하고, 콘텐츠를 자동으로 분류하고, 질문과 답변을 생성하고, 궁극적으로 적합한 결과물을 출력할 수 있는 사용하기 쉬운 인터페이스를 제공합니다.
5개월 전
02.6K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: 여러 AI 제품을 통합하는 상용화 통합 플랫폼

종합 소개 AIBot PRO는 사용자에게 여러 AI 제품을 통합할 수 있는 편리한 플랫폼을 제공하도록 설계된 .NET 6 기반 AI 통합 클라이언트입니다. 이 클라이언트는 무의미한 전환 대화를 지원하며 ChatGPT, Gemini, Claude, Wenxin Yiyin을 통합합니다.
6개월 전
02.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: 사람의 자세를 정밀하게 제어하여 춤추는 여성을 만드는 동영상 생성

개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
8개월 전
02.6K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

옵저버: OpenAI 호환 API 요청 데이터를 추적하는 AI 통합 가시성을 위한 경량 라이브러리입니다.

일반 소개 옵저버는 생성형 AI API를 위한 포괄적인 관찰 기능을 제공하도록 설계된 오픈 소스 Python SDK입니다. 이 라이브러리를 통해 사용자는 AI 모델과의 상호작용을 쉽게 추적 및 기록하고 이러한 관찰 결과를 여러 백엔드에 저장할 수 있습니다. 여부...
8개월 전
02.6K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

제미니 넥스트 채팅: 클릭 한 번으로 비공개 멀티모달 제미니 앱을 무료로 배포하세요!

일반 소개 Gemini Next Chat은 사용자가 비공개 Gemini 애플리케이션을 쉽게 배포할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Gemini 1.5 및 Gemini 2.0 멀티모달 모델을 지원하며, 사용자는 클릭 한 번으로 배포할 수 있습니다.
7개월 전
02.6K
RooFlow:基于 Roo Code 扩展的记忆增强系统

루플로우: 루 코드 확장에 기반한 메모리 향상 시스템

포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...
4개월 전
02.6K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: 대규모 모델 그룹 채팅 프레임워크: 여러 개의 대규모 언어 모델과 동시에 채팅하기

종합 소개 OpenAOE는 오픈 소스 대규모 모델 그룹 채팅 프레임워크로, 현재 시장에 여러 모델이 병렬로 응답하는 채팅 프레임워크가 부족한 문제를 해결하기 위해 개발되었습니다. OpenAOE를 사용하면 사용자는 여러 LLM(대규모 언어 모델)과 동시에 대화하고 병렬 출력을 얻을 수 있습니다. 이 프레임워크는 다음을 지원합니다.
6개월 전
02.6K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: 타임스탬프별 동영상 포지셔닝 콘텐츠 및 Q&A 오픈 소스 프로젝트

일반 소개 비디오마인드는 긴 동영상을 위한 추론, Q&A 및 요약 생성에 중점을 둔 오픈 소스 멀티모달 AI 도구입니다. 홍콩 폴리테크닉 대학교의 예 리우와 싱가포르 국립대학교의 쇼 랩 팀이 개발했습니다. 이 도구는 비디오에 대한 인간의 이해를 모방합니다...
2개월 전
02.6K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHub 리포지토리를 팟캐스트로 전환하고 언제 어디서나 코드 업데이트를 들을 수 있습니다!

일반 소개 GitPodcast는 개발자가 언제 어디서나 코드 업데이트를 들을 수 있도록 GitHub 리포지토리를 팟캐스트로 전환하도록 설계된 혁신적인 도구입니다. OpenAI 및 Azure Speech SDK를 사용하여 GitPodca...
7개월 전
02.6K
Kimi-Audio:开源音频处理与对话基础模型

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
3 개월 전
02.6K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.
7개월 전
02.6K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: 중국어 법률 지식 모델링, 법률 퀴즈 및 사법시험 교육 지원

일반 소개 LaWGPT는 난징대학교의 기계 학습 및 데이터 마이닝 연구 그룹이 지원하는 오픈 소스 프로젝트로, 중국 법률 지식을 기반으로 대규모 언어 모델을 구축하는 데 전념하고 있습니다. 일반 중국어 모델(중국어-LLaMA 및 ChatGLM 등)을 기반으로 합니다...
5개월 전
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

뫼비우스 확산: 텍스트 프롬프트가 끊김 없이 반복되는 동영상 생성

일반 소개 Mobius Diffusion은 텍스트 입력에서 매끄럽게 반복되는 동영상 콘텐츠를 생성하는 데 중점을 둔 혁신적인 온라인 도구입니다. 사전 학습된 동영상 확산 모델을 기반으로 하며 사용자 교육이나 주석 데이터가 필요하지 않아 빠르게 시작할 수 있습니다. 이 사이트의 핵심 기술은 ...
5개월 전
02.6K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: LLM 애플리케이션을 위한 오픈 소스 관찰 및 디버깅 플랫폼

일반 소개 Langfuse는 오픈 소스 LLM(대규모 언어 모델) 엔지니어링 플랫폼입니다. 이 플랫폼은 호출 관찰, 단서 단어 관리, 실험 실행 및 결과 평가를 위한 도구를 제공하여 개발자가 LLM 애플리케이션을 추적, 디버그 및 최적화하는 데 도움을 줍니다. 이 플랫폼은 Langfuse 팀이 개발했습니다...
5개월 전
02.6K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

슈퍼위챗PC: 오픈소스 컴퓨터 소액 신용 기능 향상 도구, 2차 개발 지원

종합 소개 슈퍼위챗PC는 사용자와 개발자에게 편의를 제공하는 것이 핵심인 컴퓨터용 오픈소스 위챗 향상 도구입니다. 처음에는 위챗만 단독으로 열 수 있는 문제를 해결하고, 나중에 개발자가 메시지 전송과 같은 위챗 기능을 호출할 수 있도록 위챗SDK를 추가했습니다....
5개월 전
02.6K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
6개월 전
02.6K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AI 에이전트를 위한 오픈 소스 워크플로 빌더

개요 Sim Studio는 가볍고 직관적인 시각적 인터페이스를 통해 사용자가 대규모 언어 모델(LLM) 워크플로를 빠르게 설계, 테스트 및 배포할 수 있도록 지원하는 데 중점을 둔 오픈 소스 AI 에이전트 워크플로 구축 플랫폼입니다. 사용자는 드래그 앤 드롭을 통해 복잡한 워크플로를 심층적인 프로그래밍 없이도 만들 수 있습니다.
3 개월 전
02.6K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: 확산 모델을 기반으로 중기 전 세계 일기 예보를 학습하고 예측하는 효율적인 도구

일반 소개 GraphCast는 구글 딥마인드에서 개발한 고급 일기 예보 도구로, 딥러닝 기술을 통해 중기 전 세계 일기 예보의 정확도를 향상시키는 것을 목표로 합니다. 이 프로젝트는 사전 학습된 다양한 모델과 샘플 코드를 제공하며, 사용자는 이를 활용하여 리소스를 ...
8개월 전
02.6K
VACE:视频创作和编辑的开源模型(未开放)

VACE: 동영상 제작 및 편집을 위한 오픈 소스 모델(공개되지 않음)

개요 VACE는 동영상 제작 및 편집에 중점을 두고 알리통이 시각지능연구소(ali-vilab)에서 개발한 오픈소스 프로젝트입니다. 레퍼런스를 기반으로 동영상 생성, 기존 동영상 콘텐츠 편집, 현지화 수정 등 다양한 기능을 통합한 올인원 툴입니다.
5개월 전
02.6K
FinRobot:提升金融数据分析效率和投资研究的的智能体

핀로봇: 금융 데이터 분석 효율성과 투자 리서치를 개선하는 지능형 기관

종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....
6개월 전
02.6K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: 독점 코드 베이스를 빠르게 생성하기 위한 AI 엔지니어링 도우미

포괄적인 소개 Potpie AI는 개발자에게 맞춤형 AI 엔지니어링 어시스턴트를 제공하는 데 중점을 둔 오픈 소스 플랫폼입니다. AI 에이전트가 코드 구조와 로직을 심층적으로 이해하고 코드 베이스의 지식 그래프를 구축하여 디버깅, 테스트, 코드 생성과 같은 작업을 자동화할 수 있습니다. 사용자는 간단한...
4개월 전
02.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

비전 에이전트: 다양한 시각적 표적 감지 작업을 해결하는 시각적 인텔리전스

일반 소개 비전 에이전트는 랜딩AI(팀 엔다 우)가 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트로, 사용자가 컴퓨터 비전 작업을 해결하기 위한 코드를 빠르게 생성할 수 있도록 설계되었습니다. 고급 에이전트 프레임워크와 멀티모달 모델을 사용합니다...
5개월 전
02.6K
Vexa:实时会议转录与智能知识提取工具

Vexa: 실시간 회의 트랜스크립션 및 지능형 지식 추출 도구

종합 소개 벡사는 기업과 개인에게 효율적인 회의 녹음과 지능형 지식 추출 서비스를 제공하도록 설계된 오픈 소스 실시간 회의 녹취 및 지식 관리 플랫폼입니다. API 기반 회의 로봇을 통해 구글 미트, 줌 등과 같은 플랫폼에 자동으로 연결됩니다...
4개월 전
02.6K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: 정적 3D 모델에서 스켈레탈 구조 애니메이션 에셋 생성

개요 MagicArticulate는 ByteDance가 난양공과대학교(NTU)와 협력하여 개발한 AI 프레임워크로, 정적 3D 모델을 애니메이션이 가능한 디지털 에셋으로 빠르게 변환하는 데 중점을 두고 있습니다. 고급 자동 회귀 트랜스포머와 기능 확산 모델인 셀프 ...
6개월 전
02.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-데이터 빌더: 무료 빅 모델 API를 사용하여 AI 학습 데이터 생성, 0 비용 빅 모델 학습 데이터 생성

종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...
9개월 전
02.6K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

루이 모델: 렌즈 제어 및 모션 진폭 제어를 지원하는 이미지-투-비디오 오픈 소스 모델을 생성합니다.

일반 소개 Ruyi-Models는 이미지에서 고품질 동영상을 생성하도록 설계된 오픈 소스 프로젝트입니다. IamCreateAI 팀이 개발한 이 프로젝트는 768 해상도, 초당 24프레임, 5초에 120프레임의 시네마틱 비디오 생성을 지원합니다....
8개월 전
02.6K
Swarms:多智能体编排框架,企业级生产工具

스웜: 다중 인텔리전스 오케스트레이션 프레임워크, 엔터프라이즈 프로덕션 도구

일반 소개 스웜은 효율적인 에이전트 관리 및 작업 처리를 통해 비즈니스 생산성을 높이기 위해 설계된 엔터프라이즈급 프로덕션 지원 멀티에이전트 오케스트레이션 프레임워크입니다. 여러 모델, 여러 메모리 시스템 및 사용자 지정 에이전트 생성을 지원하는 이 프레임워크는 모듈식 설계와 포괄적인 로깅 기능을 제공하여 시스템이...
8개월 전
02.6K
LineAvatars:生成 Notion 风格线条头像的免费工具

라인아바타: 노션 스타일의 라인 아바타를 생성하는 무료 도구

일반 설명 라인아바타는 노션 스타일의 라인 아바타를 생성하기 위해 고안된 사용하기 쉬운 무료 온라인 도구입니다. 사용자는 사진을 업로드하거나 웹캠을 통해 사진을 찍으면 시스템이 AI를 사용해 자동으로 라인 아바타를 생성합니다. 이 도구는...
6개월 전
02.5K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: 다중 지능 협업을 지원하는 오픈 소스 AI 자동화 프레임워크

일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....
5개월 전
02.5K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: LLM 사전 교육을 위한 효율적인 웹 크롤링 도구

종합 소개 Crawl4LLM은 칭화대학교와 카네기멜론대학교가 공동으로 개발한 오픈 소스 프로젝트로, 대규모 모델(LLM)의 사전 학습을 위한 웹 크롤링의 효율성을 최적화하는 데 중점을 두고 있습니다. 고품질 웹 데이터를 지능적으로 선별하여 비효율적인 크롤링을 크게 줄이며, 원래 크롤링해야 하는 1...
6개월 전
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

흐름에 따라 이동: 동영상에서 움직이는 물체를 더하거나 빼는 등 동영상 속 물체의 움직임을 제어합니다.

일반 소개 Go-with-the-Flow는 넷플릭스 아이라인 스튜디오 연구팀에서 노이즈를 왜곡하여 동영상 확산 모델의 움직임 패턴을 제어하기 위해 개발한 오픈 소스 프로젝트입니다. 이 프로젝트를 통해 사용자는 장면의 카메라와 ...
7개월 전
02.5K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

로컬 다중 소스 PDF 문서 Q&A를 지원하는 지능형 채팅 도구: LocalPdfChatRAG

일반 소개 로컬 PDF 문서와 검색 증강 생성(RAG) 모델을 결합하여 지능형 채팅 기능을 구현하는 것을 목표로 하는 오픈 소스 프로젝트인 LocalPdfChatRAG입니다. 이 프로젝트를 통해 사용자는 PDF 문서를 업로드하고 자연어를 통해 질문하여 문서에서 관련 정보를 얻을 수 있습니다.
6개월 전
02.5K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

검색 o1: 추론 모델이 능동적으로 검색할 수 있도록 지원하여 대규모 모델이 사고하면서 외부 지식을 검색할 수 있도록 합니다.

종합 소개 Search-o1은 고급 검색 메커니즘을 통합하여 대규모 추론 모델(LRM)의 성능을 향상시키는 것을 목표로 하는 오픈 소스 프로젝트입니다. 핵심 아이디어는 동적 검색과 지식 통합을 통해 추론 과정에서 발생하는 지식 결핍 문제를 해결하는 것입니다. 이 프로젝트는 sunn이 후원합니다...
7개월 전
02.5K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: B-스테이션 라이브 스트리밍 및 음성 상호작용을 지원하는 보조 디지털 사람

VirtualWife는 개발자 yakami129가 만든 오픈 소스 가상 디지털 인물 프로젝트입니다. 현재 인큐베이션 단계에 있으며, 목표는 "영혼"을 가진 가상 캐릭터를 만들어 사용자가 친구처럼 상호 작용할 수 있도록 하는 것입니다. 이 프로젝트는 B 스테이션 라이브에서 지원합니다...
5개월 전
02.5K
Rowfill:批量提取文档结构化信息并自动化分析

행 채우기: 문서에서 구조화된 정보 일괄 추출 및 자동 분석

일반 소개 Rowfill은 지식 근로자를 위해 설계된 오픈 소스 문서 처리 플랫폼입니다. 고급 인공 지능 기술을 사용하여 복잡한 문서, 이미지 및 PDF에서 데이터를 추출, 분석 및 처리하며, Rowfill은 네이티브 LLM(대규모 언어 모델)과 Ope...
6개월 전
02.5K