AI 오픈 소스 프로젝트

총 1020개 문서
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: 게임 채팅 콘텐츠의 실시간 번역을 위한 오픈 소스 클라이언트

일반 소개 DeepRant는 게이머를 위한 오픈 소스 번역 도구로, 국제 서버의 언어 장벽 문제를 해결하기 위해 설계되었습니다. 단축키를 통해 게임 내 텍스트를 즉시 번역할 수 있고, 여러 언어를 지원하여 서로 번역할 수 있으며, 플레이어가 게임을 종료하지 않고도 채팅 메시지를 빠르게 이해하고 답장할 수 있습니다....
7개월 전
023.1K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: 사람의 시연을 통해 웹 작업을 수행하도록 AI를 훈련시키는 오픈 소스 프로젝트

일반 소개 옵텍스티는 옵텍스티 팀이 개발한 GitHub의 오픈 소스 프로젝트입니다. 이 프로젝트의 핵심은 인간의 데모 데이터를 사용하여 컴퓨터 작업, 특히 웹 페이지 작업을 완료하도록 AI를 훈련시키는 것입니다. 이 프로젝트에는 다음과 같은 세 가지 코드 라이브러리가 포함되어 있습니다.
7개월 전
023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: 사람에서 의류를 타일형 의류 디스플레이 이미지로 추출하는 AI 도구

종합 소개 TryOffAnyone은 이커머스 분야의 의류 디스플레이 문제를 해결하기 위해 특별히 설계된 획기적인 AI 이미지 처리 툴입니다. 실제 사람이 옷을 입은 사진을 평평한 디스플레이 효과 이미지로 지능적으로 변환할 수 있으며, 이 기술은 최신 잠재 차이 기술을 기반으로 합니다.
9개월 전
023.1K
Quick Prompt:快速管理和使用提示词的浏览器扩展

빠른 프롬프트: 프롬프트를 빠르게 관리하고 사용하기 위한 브라우저 확장 프로그램

일반 빠른 프롬프트는 프롬프트 단어(프롬프트) 관리와 빠른 입력에 중점을 둔 오픈 소스 브라우저 확장 프로그램입니다. 사용자는 프롬프트 라이브러리를 생성, 구성 및 저장하고 미리 설정된 프롬프트 콘텐츠를 웹 페이지의 입력 상자에 빠르게 삽입할 수 있습니다. 이 도구는 특히 ...
5개월 전
023.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

일반 설명 Charla는 모국어 모델과 대화할 수 있도록 설계된 엔드포인트 기반 채팅 애플리케이션입니다. 이 애플리케이션은 Ollama 백엔드와 통합되어 문맥 인식 대화를 지원하며 채팅 세션을 마크다운 파일로 저장합니다. 사용자는 간단히...
9개월 전
023.1K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

흐름에 따라 이동: 동영상에서 움직이는 물체를 더하거나 빼는 등 동영상 속 물체의 움직임을 제어합니다.

일반 소개 Go-with-the-Flow는 넷플릭스 아이라인 스튜디오 연구팀에서 노이즈를 왜곡하여 동영상 확산 모델의 움직임 패턴을 제어하기 위해 개발한 오픈 소스 프로젝트입니다. 이 프로젝트를 통해 사용자는 장면의 카메라와 ...
9개월 전
023.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

에이전트 실험실: 연구자를 위한 자동화된 코드 및 연구 작성 도우미

종합 소개 에이전트 실험실은 연구자가 연구 아이디어를 실현할 수 있도록 설계된 엔드투엔드 자율 연구 워크플로우입니다. 이 시스템은 문헌 검토 및 계획 개발부터 실행까지 전체 연구 워크플로우를 지원하는 대규모 언어 모델에 기반한 전용 에이전트로 구성되어 있습니다.
7개월 전
023.1K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: 멀티모달 스마트 디바이스 구축을 위한 인텔리전트 바디 프레임워크

종합 소개 OmAgent는 Om AI Lab에서 개발한 멀티모달 지능형 바디 프레임워크로, 스마트 디바이스를 위한 강력한 AI 기반 기능을 제공하는 것을 목표로 합니다. 이 프로젝트는 최첨단 멀티모달 기본 모델과 지능형 바디 알고리즘을 통합하여 개발자가 다양한 스마트 디바이스에서 효율적인 스마트 디바이스를 만들 수 있도록 지원합니다.
9개월 전
023.1K
Autiobooks:将epub电子书转换为m4b有声书

오디오북: epub 전자책을 m4b 오디오북으로 변환하기

일반 소개 오토북은 사용자가 .epub 형식의 전자책을 .m4b 형식의 오디오북으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구입니다. Kokoro에서 제공하는 고품질 음성 합성 기술을 사용하여 자연스럽고 부드러운 오디오를 생성합니다. 이 도구는 ...에 의해 구동됩니다.
7개월 전
023.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: 세밀하고 일관된 동영상을 생성하여 캐릭터와 사물이 세밀하게 묘사된 광고 제작에 이상적입니다.

종합 소개 Goku는 업계 최고 수준의 성능을 달성하도록 설계된 스트림 변환 기술을 기반으로 한 연합 이미지 및 동영상 생성 모델입니다. 세분화된 데이터 대조, 모델 디자인, 스트림 변환 공식화 등 고급 고품질 시각적 생성 기술을 통합하고 있으며, Goku의 주요 기능으로는 고품질의 세분화된...
8개월 전
023.1K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDF를 오픈 소스 도구의 팟캐스트로 변환하기

일반 소개 Open NotebookLM은 모든 PDF 문서를 팟캐스트로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 오픈 소스 LLM(대규모 언어 모델) 및 TTS(텍스트 음성 변환) 모델을 사용하여 PDF 콘텐츠를 처리하여 오디오 팟캐스트에 적합한 자연스러운 대화를 생성합니다....
9개월 전
023.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: 서로 다른 AI 인텔리전스 프레임워크를 연결하여 실시간으로 협업할 수 있는 통합 플랫폼

일반 소개 Mahilo는 오픈 소스 다중 지능 통합 플랫폼으로, 개발자 Jayesh Sharma가 GitHub에 공개했으며, 사용자가 서로 다른 프레임워크의 AI 지능을 연결하여 실시간 커뮤니케이션, 인간과 컴퓨터의 상호작용, 지능형 협업을 지원할 수 있도록 설계되었습니다. The ...
8개월 전
023.1K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.
10개월 전
023K
X-R1:在普通设备中低成本训练0.5B模型

X-R1: 일반 디바이스에서 0.5B 모델에 대한 저렴한 비용의 교육

일반 소개 X-R1은 개발자에게 엔드투엔드 강화 학습을 기반으로 모델을 훈련할 수 있는 저비용의 효율적인 도구를 제공하는 것을 목표로 하는 dhcode-cpp 팀이 GitHub에서 오픈소스화한 강화 학습 프레임워크입니다. 이 프로젝트는 DeepSeek...에서 지원합니다.
7개월 전
023K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: 여러 AI 제품을 통합하는 상용화 통합 플랫폼

종합 소개 AIBot PRO는 사용자에게 여러 AI 제품을 통합할 수 있는 편리한 플랫폼을 제공하도록 설계된 .NET 6 기반 AI 통합 클라이언트입니다. 이 클라이언트는 무의미한 전환 대화를 지원하며 ChatGPT, Gemini, Claude, Wenxin Yiyin을 통합합니다.
8개월 전
023K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

슈퍼위챗PC: 오픈소스 컴퓨터 소액 신용 기능 향상 도구, 2차 개발 지원

종합 소개 슈퍼위챗PC는 사용자와 개발자에게 편의를 제공하는 것이 핵심인 컴퓨터용 오픈소스 위챗 향상 도구입니다. 처음에는 위챗만 단독으로 열 수 있는 문제를 해결하고, 나중에 개발자가 메시지 전송과 같은 위챗 기능을 호출할 수 있도록 위챗SDK를 추가했습니다....
7개월 전
023K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: 1분 안에 1분짜리 동영상을 생성한다고 주장하는 효율적인 동영상 오픈소스 프로젝트

종합 소개 Magic 1-For-1은 메모리 사용량을 최적화하고 추론 지연 시간을 줄이기 위해 설계된 효율적인 비디오 생성 모델입니다. 이 모델은 텍스트 대 비디오 생성 작업을 텍스트 대 이미지 생성 및 이미지 대 비디오 생성이라는 두 가지 하위 작업으로 분해하여 보다 효율적인 학습 및 증류 작업을 가능하게 합니다.
8개월 전
023K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: 맞춤형 면접 질문과 지능형 분석을 생성하는 오픈 소스 AI 음성 면접 플랫폼

일반 소개 FoloUp은 기업을 위한 AI 기반 음성 면접 솔루션을 제공하기 위해 설계된 오픈 소스 플랫폼입니다. FoloUp을 통해 기업은 직무 설명에 맞는 맞춤형 면접 질문을 빠르게 생성하고 AI와 자연스러운 대화형 면접을 진행할 수 있습니다. 이 플랫폼은 또한 상세한 인터뷰 분석도 제공합니다...
7개월 전
023K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: 모든 OpenAI 모델 및 API와 상호 작용하기 위한 웹 GUI

일반 소개 Ortlin은 기술 및 비기술 사용자 모두가 OpenAI의 API 및 기본 모델과 쉽게 상호 작용할 수 있도록 설계된 웹 기반 그래픽 사용자 인터페이스입니다. 완전 무료 오픈 소스이므로 사용자가 번거로움 없이 OpenAI를 활용할 수 있습니다...
12개월 전
023K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: 자동화된 AI 인텔리전스를 생성하고 실행하는 오픈 소스 프로젝트

일반 소개 AgentGPT는 사용자가 브라우저를 통해 자율적으로 AI 인텔리전스를 생성, 구성 및 배포할 수 있도록 설계된 오픈 소스 프로젝트로, Reworkd 팀에서 개발하여 GitHub에서 호스팅하고 있습니다. 사용자는 목표를 설정하기만 하면 AgentGPT는 다음을 수행할 수 있습니다.
7개월 전
023K
Browse AI:无代码提取和监控结构化数据

AI 찾아보기: 코드 없이 구조화된 데이터 추출 및 모니터링

Browse Browse AI는 코딩 없이도 모든 웹사이트에서 데이터를 추출하고 모니터링할 수 있도록 설계된 클라우드 기반 웹 자동화 소프트웨어입니다. 마우스 클릭 한 번으로 데이터 추출, 모니터링 및 자동화 작업을 수행하도록 봇을 훈련시킬 수 있습니다....
1 년 전
023K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

펭청스타링: 위스퍼-Large v3보다 더 작고 빠른 다국어 음성-텍스트 변환 도구

종합 소개 펭청스타링(PengChengStarling, 펭청랩스)은 다양한 언어의 음성을 해당 텍스트로 변환할 수 있는 다국어 자동 음성 인식(ASR) 툴입니다. 이 툴킷은 아이스폴 프로젝트를 기반으로 개발되었으며 완전한 음성 인식 프로세스를 제공합니다...
9개월 전
022.9K
Quantum Swarm:多智能体集群协作框架

퀀텀 스웜: 다중 인텔리전스 클러스터 협업을 위한 프레임워크

퀀텀 스웜은 AI 집단 지능 개발 및 연구에 중점을 둔 오픈 소스 인공 지능 프레임워크입니다. 이 프로젝트는 깃허브의 퀀텀 AI 팀에서 관리하며 다중 지능 시스템을 구축하고 테스트할 수 있는 유연하고 효율적인 플랫폼을 제공하는 것을 목표로 합니다.
9개월 전
022.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: 자동화된 대규모 언어 모델 평가를 위한 프레임워크로, 다양한 대규모 모델 단서 단어의 출력 품질을 비교합니다.

종합 소개 DeepEval은 대규모 언어 모델링 시스템을 평가하고 테스트하기 위한 사용하기 쉬운 오픈 소스 LLM 평가 프레임워크입니다. Pytest와 유사하지만 LLM 출력의 단위 테스트에 중점을 두며, DeepEval은 G-Eval, 팬텀을 통한 최신 연구 결과를 결합합니다.
8개월 전
022.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 지식 그래프를 사용하여 합성 데이터를 생성하기 위한 언어 모델 미세 조정

개요 GraphGen은 상하이의 AI 연구소인 OpenScienceLab에서 개발한 오픈 소스 프레임워크로, 지식 그래프를 통해 합성 데이터 생성을 안내하여 대규모 언어 모델(LLM)의 감독 미세 조정을 최적화하는 데 중점을 두고 있으며, GitHub에 호스팅되어 있습니다. 개발 배경은 ...
5개월 전
022.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: LLM 사전 교육을 위한 효율적인 웹 크롤링 도구

종합 소개 Crawl4LLM은 칭화대학교와 카네기멜론대학교가 공동으로 개발한 오픈 소스 프로젝트로, 대규모 모델(LLM)의 사전 학습을 위한 웹 크롤링의 효율성을 최적화하는 데 중점을 두고 있습니다. 고품질 웹 데이터를 지능적으로 선별하여 비효율적인 크롤링을 크게 줄이며, 원래 크롤링해야 하는 1...
8개월 전
022.9K
MoshiVis:实时语音对话和图像理解的开源模型

MoshiVis: 실시간 음성 대화 및 이미지 이해를 위한 오픈 소스 모델

일반 소개 모시비스는 규타이 연구소에서 개발하여 깃허브에서 호스팅하는 오픈 소스 프로젝트입니다. 약 2억 6천 6백만 개의 새로운 적응 매개변수와 고정된 Pal...을 갖춘 Moshi 음성-텍스트 모델(7B 매개변수)을 기반으로 합니다.
7개월 전
022.9K
AI Logo:AI快速生成定制化品牌Logo

AI 로고: AI가 맞춤형 브랜드 로고를 빠르게 생성합니다.

일반 소개 AI Logo은 사용자가 인공지능을 통해 개인화된 브랜드 로고를 빠르게 생성할 수 있도록 지원하는 오픈 소스 인공지능 애플리케이션 프로젝트입니다. 스테이블 디퓨전 및 딥AI와 같은 강력한 AI 기술을 결합하여 사용자가 간단한 브랜드 로고를 입력할 수 있습니다.
7개월 전
022.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: Gradio를 기반으로 여러 AI 모델을 쉽게 통합하고 멀티모달 애플리케이션을 구축하세요.

일반 소개 ai-gradio는 개발자가 여러 AI 모델을 쉽게 통합하고 사용할 수 있도록 설계된 오픈 소스 Python 툴킷입니다. Gradio를 기반으로 구축된 이 프로젝트는 여러 AI 모델과 서비스를 지원하기 위한 통합 인터페이스를 제공합니다. 텍스트, 음성, 동영상 등 어떤 데이터든...
8개월 전
022.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

로보 블로거: 랭그래프 기반의 음성 콘텐츠에서 블로그 게시물 생성, 자동화된 블로그 작성

일반 소개 Robo Blogger는 음성-텍스트 기술을 통해 콘텐츠 생성 과정을 간소화하도록 설계된 혁신적인 블로그 생성 도구입니다. 사용자는 모든 음성-텍스트 애플리케이션을 통해 아이디어를 녹음할 수 있으며, Robo Blogger는 이러한 아이디어를 구조화된 블로그 콘텐츠로 변환합니다....
10개월 전
022.9K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

미니 커버: 블로그, 짧은 동영상, 소셜 미디어 등을 위한 맞춤형 커버를 제작할 수 있는 온라인 커버 메이커!

일반 소개 미니 커버는 블로그, 짧은 동영상, 소셜 미디어 등의 플랫폼을 위한 맞춤형 커버를 생성하도록 설계된 오픈 소스 온라인 커버 생성 도구입니다. JLinMr에서 개발한 이 도구는 사용자가 자신의 필요에 맞는 표지를 빠르게 생성할 수 있는 간단하고 효율적인 솔루션을 제공하는 것을 목표로 합니다.
10개월 전
022.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: 확산 모델을 기반으로 중기 전 세계 일기 예보를 학습하고 예측하는 효율적인 도구

일반 소개 GraphCast는 구글 딥마인드에서 개발한 고급 일기 예보 도구로, 딥러닝 기술을 통해 중기 전 세계 일기 예보의 정확도를 향상시키는 것을 목표로 합니다. 이 프로젝트는 사전 학습된 다양한 모델과 샘플 코드를 제공하며, 사용자는 이를 활용하여 리소스를 ...
10개월 전
022.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: LLM 및 EKG(업계 지식)에 기반한 새로운 에이전트 오케스트레이션 프레임워크

일반 소개 뮤에이전트는 앤트 그룹에서 개발한 혁신적인 다중 지능 프레임워크입니다. 이 프레임워크는 사용자가 캔버스 드래그 앤 드롭과 간단한 텍스트 작성을 통해 다중 지능, 함수 호출, 코드 인터프리터 및 기타 기술과 협력하여 사람의 안내에 따라 다양하고 복잡한 표준 운영 절차(SOP)를 실행할 수 있도록 도와줍니다.
11개월 전
022.8K
PromptWizard:优化提示工程的开源框架,提升任务性能

프롬프트 마법사: 프롬프트 프로젝트를 최적화하여 작업 성능을 향상시키는 오픈 소스 프레임워크

개요 PromptWizard는 Microsoft에서 개발한 오픈 소스 프레임워크로, 모델이 스스로 프롬프트 단어를 생성, 평가 및 개선하고 예제를 생성하여 지속적인 피드백을 통해 출력 품질을 개선할 수 있는 자체 진화 메커니즘을 사용합니다. 프롬프트 단어를 자율적으로 최적화하고 적절한 예제를 생성 및 선택할 수 있으며, ...
10개월 전
022.8K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션

종합 소개 SHMT(자기 지도 계층적 메이크업 전송)는 잠재 확산 모델을 기반으로 한 자기 지도 계층적 메이크업 마이그레이션 프로젝트로, 비지도 학습 방법을 통해 고품질의 메이크업 효과를 달성하는 것을 목표로 합니다....
9개월 전
022.8K
Atomic Agents:构建轻量级模块化AI智能体框架

원자 에이전트: 경량 모듈식 AI 인텔리전스를 구축하기 위한 프레임워크

일반 소개 원자 에이전트는 에이전트 AI 파이프라인 및 애플리케이션 구축을 위해 원자 개념을 중심으로 설계된 매우 가벼운 모듈식 프레임워크입니다. 이 프레임워크는 강력한 애플리케이션을 만들기 위해 결합할 수 있는 일련의 도구와 에이전트를 제공합니다. 이 프레임워크는 Instruc ...
10개월 전
022.8K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: 인물 비디오를 사용하여 디지털 인물을 생성하도록 개선된 새드토커

일반 설명 새드토커 비디오 립싱크는 새드토커 구현에 기반한 비디오 립합성 도구입니다. 이 프로젝트는 음성 기반 생성을 통해 입술 모양을 생성하고 구성 가능한 얼굴 영역 향상을 사용하여 생성된 입술 모양의 선명도를 향상시킵니다....
8개월 전
022.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: 로컬에서 실행되는 지식 그래프 및 개인용 검색 엔진 구축하기

일반 소개 Unigraph는 사용자에게 개인 생활의 다양한 데이터를 관리하고 검색할 수 있는 통합 작업 공간을 제공하도록 설계된 국내 최초의 범용 지식 그래프 및 개인용 검색 엔진입니다. Unigraph를 통해 사용자는 다양한 소스의 데이터를 통합하여 ...
9개월 전
022.8K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI: 오픈 소스 경량 AI 도구 탐색 프로젝트

포괄적 인 소개 Tap4 AI WebUI는 사용자가 자신 만의 AI 도구 카탈로그를 쉽게 구축 할 수 있도록 설계된 오픈 소스 경량 AI 도구 탐색 웹 사이트 프로젝트입니다. 이 프로젝트는 Next.js 및 Supabase 기술 스택을 사용하고 다국어 SEO 최적화를 지원하여 AI ...
12개월 전
022.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI 에이전트 SDK: 협업형 멀티 인텔리전스 워크플로우 구축을 위한 파이썬 프레임워크

일반 소개 OpenAI 에이전트 SDK는 다중 지능 워크플로우를 구축하기 위해 설계된 OpenAI의 경량 개발 도구입니다. 파이썬을 기반으로 하며 사용하기 쉬워 개발자가 에이전트를 구성하고 작업을 단축할 수 있습니다.
7개월 전
022.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.
9개월 전
022.8K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: 의료 영상 분석 및 진단 Q&A를 지원하는 의료용 빅 모델

종합 소개 HealthGPT는 이기종 지식 적응을 통해 통합된 의료 시각적 이해 및 생성 기능을 달성하는 것을 목표로 하는 고급 의료 그랜드 비주얼 언어 모델입니다. 이 프로젝트의 목표는 의료 시각적 이해 및 생성 기능을 통합된 자동 회귀 프레임워크에 통합하여 의료 그래프를 크게 개선하는 것입니다.
8개월 전
022.8K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: 지식 베이스 + LLM 기반 지능형 코드 검토 멘토(GitHub용)

종합 소개 CR-Mentor는 전문 지식 베이스와 LLM(대규모 언어 모델링)의 강력한 기능을 결합한 지능형 코드 리뷰 도구입니다. 모든 프로그래밍 언어에 대한 코드 리뷰를 지원할 뿐만 아니라 지식 기반에 축적된 모범 사례를 기반으로 팀을 위한 전용 검토 기준과 집중 영역을 사용자 지정할 수 있습니다. 다음을 통해...
11개월 전
022.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Marco-o1: 복잡한 문제 해결을 위한 개방형 추론 모델을 탐색하기 위해 미세 조정을 지시하는 Qwen2-7B 기반 OpenAI o1 모델의 오픈 소스 버전입니다.

종합 소개 Marco-o1은 복잡한 현실 세계의 문제를 해결하기 위해 알리바바 국제 디지털 커머스 그룹(AIDC-AI)에서 개발한 개방형 추론 모델입니다. 이 모델은 생각의 사슬(CoT) 미세 조정, 몬테카를로 트리 검색(MCTS), 혁신적인 추론 전략을 결합합니다...
10개월 전
022.8K
Plandex:支持超长上下文的开源AI编码助手

Plandex: 매우 긴 컨텍스트를 지원하는 오픈 소스 AI 코딩 도우미

일반 소개 Plandex는 대규모의 복잡한 소프트웨어 프로젝트를 위해 설계된 오픈 소스 엔드투엔드 AI 코딩 도우미입니다. 다단계 작업을 계획 및 실행하고 최대 2백만 토큰의 컨텍스트를 처리하며 30개 이상의 프로그래밍 언어를 지원할 수 있으며, Plandex는 ...
6개월 전
022.8K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 빠르고 제어 가능한 다국어(7000개 이상의 언어 지원) 텍스트 음성 변환 도구

일반 소개 IMS Toucan은 독일 슈투트가르트 대학교의 자연어 처리 연구소(IMS)에서 개발한 최첨단 텍스트 음성 변환(TTS) 툴킷입니다. 이 툴킷은 7000개 이상의 언어를 지원하며 빠르고 제어 가능하며 컴퓨팅 리소스 요구 사항이 낮습니다.IMS...
8개월 전
022.7K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

스크랩그래프AI: 웹 크롤링을 위한 한 마디로, 규칙을 작성할 필요가 없는 지능형 웹 콘텐츠 추출 도구

포괄적인 소개 ScrapeGraphAI는 대규모 언어 모델링(LLM)과 직접 그래프 로직을 영리하게 결합하여 웹사이트와 로컬 문서를 위한 스크래핑 파이프라인을 생성하는 혁신적인 Python 웹 스크래핑 라이브러리입니다. 이 도구를 독특하게 만드는 것은 완벽한 수준의 단순성과 강력함입니다...
9개월 전
022.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

미니 LLM 흐름: 100줄의 코드로 '지시형 그래프 구조'로 LLM 미니 인텔리전트 구축하기

일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.
9개월 전
022.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: 얼굴 특징을 보존하는 사진 생성 및 편집 도구

일반 소개 인피니트유는 바이트댄스 인텔리전트 크리에이션 팀에서 개발한 오픈소스 프로젝트입니다. FLUX.1-dev 모델을 사용하는 확산 트랜스포머(DiT) 기술을 기반으로 하며, 핵심 기능은 사용자가 사진을 업로드하고 텍스트 설명을 입력하여 생성할 수 있도록 하는 것입니다.
7개월 전
022.7K
Pyramid Flow:快手推出的开源版

Pyramid Flow: Racer에서 출시한 오픈 소스 버전의 "Kringle", SD3 기반이며 8GB 미만의 GPU에서 실행되는 버전(원클릭 배포 버전).

종합 소개 피라미드 플로우는 플로우 매칭 기법을 기반으로 하는 효율적인 자동 회귀 동영상 생성 방법입니다. 이 방법은 다양한 해상도와 노이즈 레벨 사이에서 보간하여 비디오 콘텐츠를 생성하고 압축 해제할 때 더 높은 계산 효율성을 달성합니다...
11개월 전
022.7K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: AI 시스템의 잠재적 보안 위험을 탐지하기 위한 오픈 소스 도구

종합 소개 AI-Infra-Guard는 Tencent의 하이브리드 보안 팀인 Zhuqiao Labs에서 개발한 오픈 소스 AI 인프라 보안 평가 도구로, 사용자가 AI 시스템에서 잠재적인 보안 위험을 신속하게 발견하고 탐지할 수 있도록 설계되었습니다. 이 도구는 30개 이상의 AI 프레임워크와 구성 요소를 지원합니다.
8개월 전
022.7K
Novel:模仿Notion AI的开源写作编辑器

Novel: Notion AI를 모방한 오픈 소스 글쓰기 편집기

포괄적 인 소개 이것은 Novel이라고 불리는 Steven Tey가 개발 한 오픈 소스 프로젝트로, 사용자가 텍스트 입력의 효율성을 향상시키는 데 도움이되는 통합 AI 자동 완성 기능인 Notion 스타일 WYSIWYG 텍스트 편집기입니다. 이 프로젝트는 자세한 문서 및 설치 지침을 제공합니다 ...
1 년 전
022.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

스웜: 경량 다중 지능 신체 시스템을 학습하기 위한 실험적 교육 프로젝트(OpenAI 예시)

일반 소개 스웜은 다중 에이전트 시스템을 위한 가볍고 제어 가능하며 테스트하기 쉬운 인터페이스를 탐색하기 위해 OpenAI에서 개발한 실험적인 교육용 프레임워크입니다. 이 프레임워크는 주로 에이전트 간의 핸드오프와 일상적인 패턴을 시연하는 데 사용되며, 개발자가 멀티 에이전트 시스템의 조정 및 실행을 이해하고 구현하는 데 도움이 됩니다.
9개월 전
022.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: 문서/멀티미디어에서 비정형 데이터를 추출하여 정형 데이터로 구문 분석합니다.

일반 소개 OmniParse는 모든 비정형 데이터를 GenAI(생성 인공 지능) 프레임워크에 최적화된 정형화된 실행 가능한 데이터로 변환하도록 설계된 강력한 데이터 구문 분석 및 최적화 플랫폼입니다. 문서, 표, 이미지, 동영상, 오디오 파일 등 어떤 종류의 데이터를 작업하든 상관없습니다.
11개월 전
022.7K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: 모델 통합 및 데이터 흐름 관리를 지원하여 AI 채팅 인터페이스를 빠르게 구축할 수 있는 툴킷입니다.

종합 소개 Ant Design X는 개발자가 AI 기반 대화 인터페이스를 빠르게 구축할 수 있도록 설계된 Ant Group에서 오픈소스화한 툴킷입니다. 풍부한 구성 요소와 템플릿 세트를 제공하고 OpenAI 표준과 호환되는 모델 통합을 지원하며 지능형 고객 서비스, AI 어시스턴트 등 다양한 애플리케이션에 적합합니다.
11개월 전
022.6K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: 다른 웹사이트에 통합할 수 있는 대화형 GraphRAG 기반 대화형 지식창고/심층 웹 검색 도구

일반 소개 AutoFlow는 TiDB 서버리스 벡터 스토리지로 그래프 기반 지식 베이스를 구축하기 위해 PingCAP에서 개발한 오픈 소스 도구입니다. 복잡한 대화 검색과 지식 그래프를 지원하기 위해 LlamaIndex와 DSPy 프레임워크를 통합합니다.
9개월 전
022.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

에이전트래버토리: 지능형 에이전트로 과학 연구의 전 과정을 완료하기 위한 오픈 소스 도구입니다.

일반 소개 에이전트래버러토리는 GitHub에서 호스팅되는 오픈 소스 도구로 Samuel Schmidgall이 개발했습니다. 이 도구는 대규모 언어 모델(LLM)로 구동되는 지능형 에이전트를 사용하여 연구자들이 과학의 전체 프로세스를 수행할 수 있도록 도와줍니다.
7개월 전
022.6K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: Wikipedia 데이터를 사용하여 지식을 검색할 수 있는 채팅 도구

일반 소개 위키챗은 스탠포드 대학교에서 개발한 실험적인 챗봇으로, 위키백과에서 데이터를 검색하여 대규모 언어 모델의 사실성을 개선하는 것을 목표로 합니다. 대규모 언어 모델(예: ChatGPT 및 GPT-4)은 최신 정보나 덜 인기 있는 주제를 처리하는 경향이 있습니다.
9개월 전
022.6K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPT 아카데믹: 최고의 아카이브 논문 번역, 오류 수정 및 코드 해석

일반 소개 GPT Academic은 학술 연구에 최적화된 대규모 언어 모델을 위한 대화형 플랫폼으로, 특히 논문 번역, 논문 읽기, 다듬기 및 쓰기 경험에 최적화된 GPT/GLM과 같은 대규모 언어 모델에 실용적인 대화형 인터페이스를 위한 도구를 제공합니다. 모듈식 디자인을 사용합니다...
11개월 전
022.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow: 제어되고 투명한 AI 인텔리전스 바디 워크플로우를 구축하기 위한 Python 프레임워크

일반 소개 ControlFlow는 AI 워크플로우 구축 및 관리에 중점을 두고 PrefectHQ에서 개발한 Python 프레임워크입니다. 워크플로우를 정의하고 대규모 언어 모델(LLM) 생성에 작업을 위임하기 위한 구조화된 개발자 중심 프레임워크를 제공합니다.
10개월 전
022.6K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI 초상화 마스터 중국어 버전: 초상화 생성을 최적화하는 큐 워드 도구

일반 소개 컴피유 포트레이트 마스터 중국어 버전은 AI 이미지 제작자를 위해 설계된 포트레이트 단서 단어 생성 도구입니다. 이 도구는 사용자가 큐 단어를 최적화하여 고품질의 인물 사진을 생성할 수 있도록 도와줍니다. 사용자는 수요에 따라 다른 렌즈를 선택할 수 있습니다 ...
1 년 전
022.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

소셜 미디어 에이전트: 소셜 미디어 콘텐츠를 자동으로 생성하고 관리하는 소셜 미디어용 지능형 어시스턴트

일반 소개 소셜 미디어 에이전트는 사용자가 소셜 미디어 콘텐츠의 생성 및 관리를 자동화할 수 있도록 설계된 새로운 에이전트 인박스로 상호 작용 정보를 관리하는 오픈 소스 프로젝트입니다. 이 프로젝트는 LangChain 팀에 의해 개발되었습니다...
9개월 전
022.6K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
8개월 전
022.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: 효율적인 데이터 분석 및 AI 애플리케이션을 위한 데이터 과학자를 위한 오픈 소스 Python 라이브러리

일반 소개 Taipy는 데이터 과학자와 머신 러닝 엔지니어가 데이터 기반 웹 애플리케이션을 신속하게 구축하고 배포할 수 있도록 Avaiga에서 개발한 강력한 Python 라이브러리로, Taipy는 다음과 같은 전체 도구 및 구성 요소를 제공합니다.
10개월 전
022.6K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

잘못된 JSON 문자열을 수정하고 LLM에서 생성된 JSON 데이터에서 발생할 수 있는 서식 지정 오류를 해결합니다.

일반 설명 잘못된 JSON 파일을 수정하는 모듈로, 특히 LLM(대규모 언어 모델)에서 출력되는 잘못된 JSON 데이터를 구문 분석하기 위한 모듈입니다. 이 모듈은 따옴표 누락, 잘못된 쉼표, 이스케이프되지 않은 문자 및 불완전한 키-값과 같은 일반적인 JSON 구문 오류를 수정합니다.
12개월 전
022.6K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: 단일 이미지에서 고해상도 3D 모델링 디지털 자산 생성

일반 소개 TripoSG는 단일 이미지에서 고품질 3D 모델을 생성하기 위해 VAST AI 연구팀에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 하이브리드 지도 학습 및 고품질 데이터 세트와 결합된 대규모 정류기-흐름 변환기 기술을 사용하여 생성된 3D 모델이 다음과 같은 기능을 갖출 수 있도록 합니다.
7개월 전
022.6K