AI 오픈 소스 프로젝트

총 1020개 문서
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: AI 기반 오픈소스 검색 엔진으로 스마트 Q&A, 동영상 검색, UI 코드 생성 기능을 제공합니다.

일반 소개 모픽은 지능형 Q&A와 효율적인 검색 환경을 제공하기 위해 설계된 생성형 사용자 인터페이스를 갖춘 AI 기술 기반의 검색 엔진입니다. 사용자는 모픽으로 텍스트, 동영상 등 다양한 검색을 수행할 수 있으며, 검색 기록을 저장하고 검색 결과를 공유할 수 있습니다.모픽은...
2 년 전
061.9K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

텍스트2비디오제로: 픽스아트 AI 연구팀에서 출시한 텍스트-비디오 제로 샘플 생성기

일반 소개 텍스트2비디오-제로는 픽스아트 AI 연구팀이 개발한 깃허브용 제로 샘플 텍스트-비디오 생성기의 공식 구현으로, 이 프로젝트는 텍스트 단서를 사용하여 시간적 일관성을 가진 텍스트를 생성하고 정확한 ...
2 년 전
061.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT 박스: 다른 웹 페이지에서 ChatGPT를 작동시키는 브라우저 플러그인

일반 소개 ChatGPT Box는 ChatGPT를 사용자의 브라우저에 긴밀하게 통합하도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. josStorer에서 개발한 이 도구는 여러 언어를 지원하며 모든 페이지에서 채팅 쌍을 호출하는 등 다양한 기능을 제공합니다.
1 년 전
061.8K
FantasyTalking:生成真实感说话肖像的开源工具

판타지토킹: 사실적으로 말하는 인물 사진을 생성하는 오픈 소스 툴

일반 소개 판타지토킹은 판타지-AMAP 팀이 개발한 오픈 소스 프로젝트로, 오디오 드라이브를 통해 사실적으로 말하는 인물 비디오를 생성하는 데 중점을 두고 있습니다. 이 프로젝트는 오디오 인코더 Wa와 결합된 고급 비디오 확산 모델 Wan2.1을 기반으로 합니다.
1 년 전
061.7K
Lecca:无代码构建AI智能体与AI工作流构建平台

레카: 코드 없이 AI 인텔리전스 및 AI 워크플로 구축 플랫폼 구축하기

포괄적인 소개 Lecca는 사용자가 여러 도구와 워크플로우를 사용하여 대규모 언어 모델(LLM)을 구성하고 배포할 수 있는 강력한 AI 플랫폼입니다. 사용자는 AI 에이전트를 쉽게 구축, 사용자 지정 및 자동화할 수 있으며, 다양한 AI 제공업체와 모델을 선택할 수 있습니다.
1 년 전
061.7K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

멀티포스트 확장: 한 번의 클릭으로 AI 생성 콘텐츠를 자체 퍼블리싱 플랫폼에 동기화하는 브라우저 확장 기능

일반 소개 멀티포스트 확장 프로그램은 사용자가 한 번의 클릭으로 여러 소셜 미디어 플랫폼에 콘텐츠를 게시할 수 있도록 설계된 강력한 브라우저 확장 프로그램입니다. 이 확장 프로그램은 지후, 웨이보, 샤오홍슈, 틱톡 등 10개 이상의 주요 플랫폼에 동시에 게시할 수 있도록 지원합니다.
1 년 전
061.7K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

개인 건강 데이터 관리를 위한 AI 비서, 맞춤형 건강 플랜을 위한 검사 보고서 업로드: OpenHealthForAll

일반 소개 오픈헬스포올은 사용자가 자신의 개인 건강 데이터를 관리하고 이해할 수 있도록 설계된 오픈소스 프로젝트입니다. 인공 지능 기술을 활용하여 사용자가 더 잘 관리할 수 있도록 로컬에서 실행되는 건강 도우미를 제공합니다.
1 년 전
061.7K
Instructor:简化大语言模型结构化输出工作流的Python库

인스트럭터: 대규모 언어 모델을 위한 구조화된 출력 워크플로우를 간소화하는 Python 라이브러리

일반 소개 인스트럭터는 대규모 언어 모델(LLM)의 구조화된 출력을 처리하기 위해 설계된 인기 있는 Python 라이브러리입니다. Pydantic을 기반으로 구축되어 데이터 관리를 위한 간단하고 투명하며 사용자 친화적인 API를 제공합니다....
1 년 전
061.6K
Claude生成深度研究报告的MCP服务

심층 연구 보고서 생성을 위한 Claude의 MCP 서비스

일반 소개 MCP 서버 딥 리서치는 인공지능과 웹 검색을 통해 복잡한 문제에 대한 구조화된 연구 보고서를 자동으로 생성하는 오픈 소스 도구입니다. 사용자가 연구 질문을 입력하면 도구가 질문을 분석하고, 권위 있는 정보를 검색하고, 출처 신뢰도를 평가합니다...
1 년 전
061.6K
self.so:一键生成精美的个人简历网页

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

일반 소개 self.so는 이력서나 LinkedIn 프로필을 개인 웹사이트로 빠르게 전환하도록 설계된 오픈 소스 도구입니다. 사용자가 PDF 이력서를 업로드하거나 LinkedIn 링크를 입력하기만 하면 시스템이 AI 기술을 사용하여 개인 웹사이트로 변환합니다(Tog...
1 년 전
061.6K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: 다중 지능 협업을 지원하는 오픈 소스 AI 자동화 프레임워크

일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....
1 년 전
061.6K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: 대화형 이미지 편집 도구, 포인트 앤 클릭 및 드래그 앤 드롭으로 이미지 위치를 제어할 수 있습니다.

일반 소개 DragGAN은 생성적 적대 신경망(GAN)을 기반으로 하는 대화형 이미지 편집 도구입니다. 시그라프 2023에서 Xingang Pan 등이 발표한 이 도구는 간단한 포인트 앤 클릭과 드래그 앤 드롭 조작을 통해 사용자가 직관적으로 조작할 수 있도록 하는 것을 목표로 합니다.
1 년 전
061.5K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT 아카데믹: 최고의 아카이브 논문 번역, 오류 수정 및 코드 해석

일반 소개 GPT Academic은 학술 연구에 최적화된 대규모 언어 모델을 위한 대화형 플랫폼으로, 특히 논문 번역, 논문 읽기, 다듬기 및 쓰기 경험에 최적화된 GPT/GLM과 같은 대규모 언어 모델에 실용적인 대화형 인터페이스를 위한 도구를 제공합니다. 모듈식 디자인을 사용합니다...
2 년 전
061.4K
Pyramid Flow:快手推出的开源版

Pyramid Flow: Racer에서 출시한 오픈 소스 버전의 "Kringle", SD3 기반이며 8GB 미만의 GPU에서 실행되는 버전(원클릭 배포 버전).

종합 소개 피라미드 플로우는 플로우 매칭 기법을 기반으로 하는 효율적인 자동 회귀 동영상 생성 방법입니다. 이 방법은 다양한 해상도와 노이즈 레벨 사이에서 보간하여 비디오 콘텐츠를 생성하고 압축 해제할 때 더 높은 계산 효율성을 달성합니다...
2 년 전
061.4K
GaiaNet node:安装和运行自己的本地模型在线代理服务

GaiaNet 노드: 자체 로컬 모델 온라인 프록시 서비스 설치 및 실행

일반 소개 GaiaNet-AI/gaianet-node는 사용자가 단일 명령으로 Mac, Linux 또는 Windows WSL에 기본 노드 소프트웨어 스택을 빠르게 설치할 수 있는 오픈 소스 프로젝트입니다. 사용자는 노드를 초기화하고, 구성을 사용자 지정하고, 다운로드할 수 있습니다.
2 년 전
061.4K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: Gradio를 기반으로 여러 AI 모델을 쉽게 통합하고 멀티모달 애플리케이션을 구축하세요.

일반 소개 ai-gradio는 개발자가 여러 AI 모델을 쉽게 통합하고 사용할 수 있도록 설계된 오픈 소스 Python 툴킷입니다. Gradio를 기반으로 구축된 이 프로젝트는 여러 AI 모델과 서비스를 지원하기 위한 통합 인터페이스를 제공합니다. 텍스트, 음성, 동영상 등 어떤 데이터든...
1 년 전
061.4K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI 초상화 마스터 중국어 버전: 초상화 생성을 최적화하는 큐 워드 도구

일반 소개 컴피유 포트레이트 마스터 중국어 버전은 AI 이미지 제작자를 위해 설계된 포트레이트 단서 단어 생성 도구입니다. 이 도구는 사용자가 큐 단어를 최적화하여 고품질의 인물 사진을 생성할 수 있도록 도와줍니다. 사용자는 수요에 따라 다른 렌즈를 선택할 수 있습니다 ...
2 년 전
061.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: 멀티모달 추론을 지원하는 오픈 소스 시각적 언어 모델

종합 소개 R1-Onevision은 Fancy-MLLM 팀이 개발한 오픈 소스 멀티모달 매크로 언어 모델로, 시각과 언어의 심층적인 결합에 중점을 두고 이미지와 텍스트 등의 멀티모달 입력을 처리할 수 있으며 시각 추론, 이미지 이해, 수학적 해결 등의 분야에서 수행할 수 있습니다.....
1 년 전
061.3K
Rankify:支持信息检索与重排序的Python工具包

Rankify: 정보 검색 및 재정렬을 지원하는 Python 툴킷

일반 소개 Rankify는 오스트리아 인스브루크 대학교의 데이터 과학 그룹에서 개발한 오픈 소스 Python 툴킷입니다. 이 툴킷은 정보 검색, 재정렬 및 검색 증강 생성(RAG)에 중점을 두고 통합 프레임워크를 제공합니다. 이 툴킷에는 미리 검색된 40개의 벤치마크가 내장되어 있습니다....
1 년 전
061.2K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: AI 애플리케이션 개발을 간소화하는 RAG 및 LLM 에이전트 지원 지능형 바디 오케스트레이션 프레임워크

포괄적인 소개 Dynamiq은 에이전트 AI 및 LLM(대규모 언어 모델링) 애플리케이션을 위해 설계된 오픈 소스 AI 오케스트레이션 프레임워크입니다. 특히 검색 증강 생성(RAG) 및 LLM 에이전트의 오케스트레이션 영역에서 AI 기반 애플리케이션 개발을 간소화하는 것을 목표로 합니다.Dynamiq은 다음과 같이 제안합니다.
2 년 전
061.1K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

텍스트 디스틸러: 한 번의 클릭으로 책 전체를 요약하고, 책의 내용을 효율적으로 추출하고, 핵심 아이디어를 빠르게 파악할 수 있습니다.

종합 소개 TextDistiller는 책을 챕터별로 또는 전체적으로 요약하여 간결하면서도 포괄적인 개요를 제공하도록 설계된 고급 AI 기반 도구입니다. 텍스트 디스틸러를 사용하면 어떤 책이든 핵심 아이디어와 요점을 빠르게 파악할 수 있습니다.
2 년 전
061.1K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: AI 애플리케이션을 위한 사용자 프로필 기반 장기 메모리 솔루션

일반 소개 메모베이스는 생성형 AI 애플리케이션을 위해 오래 지속되는 사용자 메모리를 지원하도록 설계된 사용자 프로필 기반 메모리 시스템입니다. 가상 동반자, 교육 도구 또는 개인화된 비서를 구축하든, Memobase는 AI가 다음을 사용하여 기억하고 이해하고 성장할 수 있도록 지원합니다.
1 년 전
061K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM: 토픽을 기반으로 웹 데이터를 검색하고, 인용이 포함된 논문, 긴 논문 보고서를 생성하세요.

일반 소개 STORM은 스탠포드 대학교의 Oval 팀에서 개발한 지식 통합 및 문서 생성 시스템입니다. 이 시스템은 처음부터 위키백과와 같은 철저한 문서(체계적 논문)를 생성하는 데 중점을 둡니다. 이 시스템은 주제 조사, 시놉시스 준비 및 실제 상호 연결된 시뮬레이션을 위해 대규모 언어 모델을 사용합니다.
1 년 전
061K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: HTML URL에서 본문 데이터 추출, 일반 텍스트/마크다운 출력

일반 소개 magic-html은 HTML에서 본문 영역 콘텐츠를 추출하는 프로세스를 간소화하도록 설계된 Python 라이브러리입니다. 복잡한 HTML 구조를 다루든 간단한 웹 페이지를 다루든 이 라이브러리는 사용자에게 편리하고 효율적인 인터페이스를 제공하는 것을 목표로 합니다. 멀티모달 추출을 지원합니다...
2 년 전
061K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 고품질 결과를 생성하기 위해 출력을 검토, 검증 및 서식 지정하는 다중 역할 인텔리전스

종합 소개 Kheish는 구조화된 단계별 협업이 필요한 대규모 언어 모델링(LLM) 작업을 위해 설계된 오픈 소스 다중 역할 에이전트로, 단순한 코디네이터를 넘어 필요에 따라 모듈을 요청하고 사용자 반전 기능을 통합하는 그 자체로 지능적인 에이전트입니다.
1 년 전
060.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: 사람의 자세를 정밀하게 제어하여 춤추는 여성을 만드는 동영상 생성

개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
1 년 전
060.9K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: 지역 지식 기반과 검색 정보를 혼합하는 AI 검색 엔진

일반 소개 MemFree는 텍스트, 이미지, 문서 및 웹 페이지를 통해 검색하고 질문할 수 있는 고급 하이브리드 AI 검색 엔진입니다. 텍스트, 마인드맵, 이미지, 동영상에 대한 검색 결과에 한 번의 클릭으로 액세스할 수 있으며, MemFree는 사용자의 지식 기반에서 정보를 추출하고...
2 년 전
060.9K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: 로컬에서 실행되는 지식 그래프 및 개인용 검색 엔진 구축하기

일반 소개 Unigraph는 사용자에게 개인 생활의 다양한 데이터를 관리하고 검색할 수 있는 통합 작업 공간을 제공하도록 설계된 국내 최초의 범용 지식 그래프 및 개인용 검색 엔진입니다. Unigraph를 통해 사용자는 다양한 소스의 데이터를 통합하여 ...
1 년 전
060.9K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait: 정지 이미지와 동영상에서 역동적인 인물 사진을 생성하는 애니메이션 도구

일반 소개 라이브포트트레이트는 레이서 테크놀로지에서 개발한 고급 AI 동적 인물 애니메이션 툴입니다. 혁신적인 AI 기술을 활용하여 정지 이미지를 생생한 비디오 애니메이션으로 변환합니다. 실제 사진, 애니메이션 스타일 또는 예술적 초상화를 사용하든 LivePo...
2 년 전
060.8K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: Mac 메뉴 표시줄에서 언제든 대화할 수 있는 Qwen의 대형 모델을 사용하세요!

일반 소개 Qwen4Mac은 사용자가 언제든지 쉽게 호출하여 사용할 수 있도록 Qwen LLM(대형 언어 모델)을 Mac의 메뉴 모음에 통합하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 andreaturchet에서 개발 및 유지 관리하며 사용자가 쉽게 사용할 수 있는 방법을 제공합니다.
1 년 전
060.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

Mac 어시스턴트: macOS 기기에서 데스크톱 작업을 자동화하는 AI 인텔리전스

일반 소개 맥 어시스턴트는 기본 소프트웨어와 웹 기능을 결합하여 사용자 작업을 간소화하는 것을 목표로 하는 macOS용으로 설계된 AI 인텔리전스 바디 프로젝트입니다. 이 프로젝트는 현재 OpenAI 및 GEMINI API를 지원하며 향후 지원할 계획입니다.
1 년 전
060.8K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

500개 이상의 연구 도구를 통합하여 연구 및 과학 작업을 자동화하는 인텔리전스, SciToolAgent

종합 소개 SciToolAgent는 항저우 절강대학교 혁신 센터(HICAI-ZJU)에서 개발한 오픈 소스 도구 플랫폼입니다. 지식 그래프(SciToolKG)와 빅 언어 모델링 기술을 통해 500개 이상의 과학 도구를 통합하여 연구자들이 다음과 같은 문제를 처리할 수 있도록 지원합니다.
1 년 전
060.7K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目

샤오위안커우쑤안 자동 질문과 답변 도구, 구두 산술 주제를 효율적으로 해결

종합 소개 Ape Mouth 계산기 자동 질문 답변 도구는 OCR 인식 및 자동화 스크립트를 통해 Ape Mouth 계산기 애플리케이션의 문제를 효율적으로 해결하기 위해 설계된 Python 기반 오픈 소스 프로젝트입니다. 이 도구는 OpenCV 및 Tesseract와 같은 기술을 사용하여 화면의 질문을 실시간으로 식별할 수 있습니다....
2 년 전
060.7K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: 인물 사진을 지브리 스타일의 이미지로 변환하는 무료 도구

일반 소개 EasyControl은 오픈 소스 프로젝트로, 효율적이고 유연한 이미지 생성 제어를 제공하기 위해 확산 변압기(DiT) 아키텍처를 기반으로 합니다. 그중에서도 지브리 컨트롤 LoRA는 100개의 서브만 사용하여 특별한 기능 중 하나입니다.
1 년 전
060.7K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: 시각적 모델을 사용해 문서를 수집하고 텍스트 단락 계층 구조를 기반으로 지능형 청킹을 수행하는 올인원 서비스입니다.

일반 소개 Chunkr는 PDF, PPTX, DOCX 및 Excel 파일을 RAG(검색 증강 생성) 및 LLM(대규모 언어 모델링)에 사용하기 적합한 데이터로 변환하는 데 전용으로 사용되는 자체 호스팅 API입니다. 이 프로젝트는 Lumina에서 개발했습니다...
1 년 전
060.6K
Rowfill:批量提取文档结构化信息并自动化分析

행 채우기: 문서에서 구조화된 정보 일괄 추출 및 자동 분석

일반 소개 Rowfill은 지식 근로자를 위해 설계된 오픈 소스 문서 처리 플랫폼입니다. 고급 인공 지능 기술을 사용하여 복잡한 문서, 이미지 및 PDF에서 데이터를 추출, 분석 및 처리하며, Rowfill은 네이티브 LLM(대규모 언어 모델)과 Ope...
1 년 전
060.5K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: AI 인텔리전스의 유연한 연결 및 관리를 위한 오픈 소스 도구

일반 소개 에이전트IQ는 개발자가 AI 인텔리전스를 효율적으로 연결하고 관리할 수 있도록 설계된 NVIDIA의 오픈 소스 툴입니다. 이를 통해 서로 다른 프레임워크의 인텔리전스를 원활하게 협업하고, 엔터프라이즈 데이터와 도구를 연결하고, 함수 호출과 같은 워크플로우를 구축할 수 있습니다. 이 도구의 가장 큰 장점은...
1 년 전
060.4K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: 대규모 언어 모델 힌트의 효과를 테스트하고 평가하기 위한 오픈 소스 시각적 프로그래밍 환경

일반 소개 ChainForge는 대규모 언어 모델(LLM) 단서의 효과를 테스트하고 평가하기 위해 설계된 오픈 소스 시각적 프로그래밍 환경입니다. 사용자가 LLM 응답에 대한 다양한 단서의 품질을 빠르게 탐색하고 분석할 수 있는 데이터 흐름 단서 엔지니어링 환경을 제공합니다.
2 년 전
060.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: 대규모 AI 모델 학습의 효율성을 향상시키는 양방향 파이프라인 병렬 알고리즘(DeepSeek 오픈 소스 주간 4일차)

일반 소개 DualPipe는 대규모 AI 모델 학습의 효율성을 개선하는 데 초점을 맞춘 DeepSeek-AI 팀이 개발한 오픈 소스 기술입니다. 주로 DeepSeek-V3 및 R1에서 사용되는 혁신적인 양방향 파이프라인 병렬 알고리즘입니다.
1 년 전
060.2K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: 미시의 사진을 춤추게 만드는 스틸 인물 레퍼런스 비디오 포즈 생성 비디오

일반 소개 X-Dyna는 제로 샘플 확산 기법을 사용하여 역동적인 인물 애니메이션을 생성하기 위해 ByteDance에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 드라이브 비디오의 얼굴 표정과 신체 움직임을 사용하여 개별 인물 이미지에 애니메이션을 적용하여 사실적이고 상황에 맞는 모션 효과를 생성합니다.X-D...
1 년 전
060.2K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: LLM 및 EKG(업계 지식)에 기반한 새로운 에이전트 오케스트레이션 프레임워크

일반 소개 뮤에이전트는 앤트 그룹에서 개발한 혁신적인 다중 지능 프레임워크입니다. 이 프레임워크는 사용자가 캔버스 드래그 앤 드롭과 간단한 텍스트 작성을 통해 다중 지능, 함수 호출, 코드 인터프리터 및 기타 기술과 협력하여 사람의 안내에 따라 다양하고 복잡한 표준 운영 절차(SOP)를 실행할 수 있도록 도와줍니다.
2 년 전
060.2K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

일반 소개 Auto-Coder.Chat은 지능형 수단을 통해 개발자의 프로그래밍 효율성을 향상시키기 위해 설계된 터미널 기반 AI 지원 프로그래밍 도구입니다. 이 도구는 모든 IDE와 함께 사용하여 개발 도구에서 AI 지원 프로그래밍을 활성화할 수 있습니다.Auto...
1 년 전
060.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: 복잡한 문제 해결을 위한 개방형 추론 모델을 탐색하기 위해 미세 조정을 지시하는 Qwen2-7B 기반 OpenAI o1 모델의 오픈 소스 버전입니다.

종합 소개 Marco-o1은 복잡한 현실 세계의 문제를 해결하기 위해 알리바바 국제 디지털 커머스 그룹(AIDC-AI)에서 개발한 개방형 추론 모델입니다. 이 모델은 생각의 사슬(CoT) 미세 조정, 몬테카를로 트리 검색(MCTS), 혁신적인 추론 전략을 결합합니다...
2 년 전
060.1K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션

종합 소개 SHMT(자기 지도 계층적 메이크업 전송)는 잠재 확산 모델을 기반으로 한 자기 지도 계층적 메이크업 마이그레이션 프로젝트로, 비지도 학습 방법을 통해 고품질의 메이크업 효과를 달성하는 것을 목표로 합니다....
1 년 전
060K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: DSPy 프레임워크에 기반한 LLM 프로세스 모니터링 및 최적화를 위한 시각화 도구

종합 소개 LangWatch는 대규모 언어 모델(LLM) 작업을 위해 설계된 종합 플랫폼으로, 모니터링, 분석, 평가, 데이터 세트 관리 및 큐 최적화를 제공합니다. 이 플랫폼은 스탠포드 대학의 DSPy 프레임워크를 기반으로 하며 사용자가 더 나은 관리와 최적화를 할 수 있도록 설계되었습니다.
1 년 전
060K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
1 년 전
060K
Audio-Reasoner:支持音频深度推理的大型语言模型

오디오 심층 추론을 지원하는 대규모 언어 모델: 오디오 심층 추론을 지원하는 대규모 언어 모델

종합 소개 Audio-Reasoner는 칭화대학교 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트로, 오디오에서 심층 추론을 지원하는 대규모 언어 모델 구축에 중점을 두고 있습니다. 이 모델은 Qwen2-Audio-Instruct를 기반으로 하며, 다음을 도입하여 ...
1 년 전
060K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

비디오리토킹: 오디오 기반 립싱크 및 비디오 편집 시스템

일반 소개 비디오리토킹은 사용자가 입력된 오디오를 기반으로 립싱크된 얼굴 비디오를 생성하여 다양한 감정에도 고품질의 립싱크된 출력 비디오를 생성할 수 있는 혁신적인 시스템입니다. 이 시스템은 이 목표를 세 가지 연속적인 작업으로 분류합니다: 일반적인 표정...
1 년 전
059.9K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: 중국어 법률 지식 모델링, 법률 퀴즈 및 사법시험 교육 지원

일반 소개 LaWGPT는 난징대학교의 기계 학습 및 데이터 마이닝 연구 그룹이 지원하는 오픈 소스 프로젝트로, 중국 법률 지식을 기반으로 대규모 언어 모델을 구축하는 데 전념하고 있습니다. 일반 중국어 모델(중국어-LLaMA 및 ChatGLM 등)을 기반으로 합니다...
1 년 전
059.9K
Quantum Swarm:多智能体集群协作框架

퀀텀 스웜: 다중 인텔리전스 클러스터 협업을 위한 프레임워크

퀀텀 스웜은 AI 집단 지능 개발 및 연구에 중점을 둔 오픈 소스 인공 지능 프레임워크입니다. 이 프로젝트는 깃허브의 퀀텀 AI 팀에서 관리하며 다중 지능 시스템을 구축하고 테스트할 수 있는 유연하고 효율적인 플랫폼을 제공하는 것을 목표로 합니다.
1 년 전
059.7K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: 기본 Ollama 모델과 상호 작용할 수 있는 깔끔한 채팅 인터페이스

일반 소개 HiOllama는 Python과 Gradio를 기반으로 구축된 사용자 친화적인 인터페이스로, 올라마 모델과 상호 작용하도록 설계되었습니다. 실시간 텍스트 생성 및 모델 관리 기능을 지원하는 간단하고 직관적인 웹 인터페이스를 제공합니다. 사용자는 온도와 같은 매개변수를 조정할 수 있으며 대부분의 ...
2 년 전
059.7K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

플립스케치: 정적인 그림을 텍스트 안내 스케치 애니메이션으로 변환하여 애니메이션 프로세스를 간소화합니다.

일반 소개 FlipSketch는 정적인 그림을 텍스트 안내 애니메이션으로 변환하도록 설계된 오픈 소스 프로젝트입니다. 깃허브에서 호스팅되는 이 프로젝트는 사용자가 텍스트 설명에서 애니메이션 효과를 생성할 수 있는 혁신적인 도구를 제공하며, 플립스케치는 ...
2 년 전
059.5K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: B-스테이션 라이브 스트리밍 및 음성 상호작용을 지원하는 보조 디지털 사람

VirtualWife는 개발자 yakami129가 만든 오픈 소스 가상 디지털 인물 프로젝트입니다. 현재 인큐베이션 단계에 있으며, 목표는 "영혼"을 가진 가상 캐릭터를 만들어 사용자가 친구처럼 상호 작용할 수 있도록 하는 것입니다. 이 프로젝트는 B 스테이션 라이브에서 지원합니다...
1 년 전
059.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu(Red Rabbit): 칭화 팀의 고성능 대규모 언어 모델 추론 프레임워크

Chitu는 대규모 언어 모델을 실행하도록 특별히 설계된 "Red Rabbit"이라는 칭화대학교의 PACMAN 팀이 개발한 오픈 소스 추론 프레임워크입니다. 효율성, 유연성 및 실용성에 중점을 두어 기업이 다양한 장치에 대규모 모델을 신속하게 배포할 수 있도록 합니다. Chitu는 다양한 하드웨어를 지원합니다.
1 년 전
059.5K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频

AI 동영상 스타터 키트: 브라우저에서 전체 흐름의 AI 동영상 제작 및 편집

일반 소개 비디오 스타터 키트(비디오 스타터 키트)는 브라우저에서 동영상 제작에 AI 모델을 사용하는 방법을 보여주기 위해 fal-ai-community에서 공개한 오픈 소스 프로젝트입니다. 이미지를 동영상으로 변환하는 도구를 제공합니다...
1 년 전
059.3K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: 멀티 모델 관리와 지능형 데이터 처리를 통합하는 AI 네이티브 데이터 애플리케이션 개발 프레임워크 구축

종합 소개 DB-GPT는 AWEL(에이전트 워크플로우 표현 언어)과 스마트 바디 기술을 사용하여 구축된 오픈소스 AI 네이티브 데이터 애플리케이션 개발 프레임워크입니다. 이 프로젝트는 대규모 모델 분야의 인프라 구축을 목표로 합니다.
1 년 전
059.3K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI 실시간 에이전트: 다중 지능형 신체 음성 인터랙션 애플리케이션(OpenAI 예제)

일반 소개 OpenAI 실시간 에이전트는 OpenAI의 실시간 API를 사용하여 다중 지능형 신체 음성 애플리케이션을 구축하는 방법을 보여주는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 높은 수준의 지능형 신체 모델(OpenAI Swarm에서 차용)을 제공하여 다음을 수행할 수 있습니다.
1 년 전
059.3K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: 개인 데이터를 위한 엔드사이드 빅데이터 모델 및 현지화된 AI 검색 플랫폼(미리 보기)

소개 퀀타 퀘스트는 세계 최초로 '엔드사이드 빅데이터 모델 + C사이드 데이터 현지화'를 핵심 진화 방향으로 삼은 제품입니다. 사용자가 Gmail, Notion, Dropbox 등의 모든 데이터를 로컬에 저장하고 벡터 데이터베이스를 통해 처리할 수 있도록 지원합니다.
2 년 전
059.3K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: 오픈 소스 AI 북마크 관리 도구, 여러 형식 지원, 지능형 태그 분류, 전체 텍스트 검색

일반 설명 Hoarder는 링크, 노트, PDF, 이미지의 저장을 지원하는 자체 호스팅 북마크 관리 도구입니다. 자동 태그 지정에 AI 기술을 사용하며 전체 텍스트 검색 기능을 제공합니다. 사용자는 크롬 플러그인과 파이어폭스 플러그인을 사용할 수 있습니다...
1 년 전
059.3K