AI 오픈 소스 프로젝트

총 1020개 문서
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

애그리게이터: 원스톱 에이전트 크롤링 및 집계 플랫폼, 무료 에이전트 풀(규정을 준수하여 사용하세요)

포괄적 인 소개 애그리 게이터는 사용 가능한 다양한 프록시 노드를 크롤링 할 수있는 무료 프록시 풀을 만드는 것을 목표로하는 오픈 소스 프로젝트입니다. 플랫폼에는 유연한 플러그인 시스템이 있으며 사용자는 대상 사이트의 특별한 요구에 따라 플러그인을 통해 특정 기능을 달성 할 수 있습니다. 이 프로젝트는 주로 크롤링하는 법을 배우는 데 사용됩니다 ...
11개월 전
022.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

딥시크 엔지니어: 딥시크 API를 기반으로 하는 실험적인 코딩 도우미로, 큐워드가 포함되어 있습니다.

일반 설명 DeepSeek Engineer는 직관적인 명령줄 인터페이스를 통해 사용자와 상호 작용하여 다양한 소프트웨어 개발 작업을 지원하는 DeepSeek API 기반의 강력한 프로그래밍 도우미 도구입니다. 이 도구는 대규모 언어 모델링의 강력한 기능과 실제 ...
8개월 전
022.5K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

라마 튜터: 개인 맞춤형 과외를 제공하는 AI 도구로, 라마 3.1을 기반으로 구축된 오픈 소스 AI 개인 튜터 프로젝트입니다.

일반 소개 라마 튜터는 사용자에게 개인화된 학습 경험을 제공하도록 설계된 라마 3.1 기반의 오픈 소스 AI 개인 비서 프로젝트입니다. Together AI, Next.js 및 T와 같은 여러 기술 스택을 통합하여 ...
11개월 전
022.5K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: 다중 지능 협업을 지원하는 오픈 소스 AI 자동화 프레임워크

일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....
7개월 전
022.5K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

팟캐스트파이: 멀티소스 콘텐츠를 다국어 오디오 대화로 변환하는 도구, NotebookLM의 팟캐스팅 기능을 대체하는 오픈 소스 대안

일반 소개 Podcastfy는 생성 인공 지능(GenAI) 기술을 사용하여 웹 콘텐츠, PDF 파일, 텍스트, 이미지, 유튜브 동영상 및 기타 여러 소스를 매력적인 다국어 소스로 변환하는 오픈 소스 Python 패키지입니다.
12개월 전
022.5K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch: DSPy 프레임워크에 기반한 LLM 프로세스 모니터링 및 최적화를 위한 시각화 도구

종합 소개 LangWatch는 대규모 언어 모델(LLM) 작업을 위해 설계된 종합 플랫폼으로, 모니터링, 분석, 평가, 데이터 세트 관리 및 큐 최적화를 제공합니다. 이 플랫폼은 스탠포드 대학의 DSPy 프레임워크를 기반으로 하며 사용자가 더 나은 관리와 최적화를 할 수 있도록 설계되었습니다.
9개월 전
022.5K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4: 중국어와 영어로 이중 언어 고해상도 이미지를 생성하는 오픈 소스 그래픽 모델

일반 소개 CogView4는 칭화대학교의 KEG Lab(THUDM)에서 개발한 오픈 소스 텍스트-그래프 모델로, 텍스트 설명을 고품질 이미지로 변환하는 데 중점을 두고 있습니다. 이중 언어 단서 단어 입력을 지원하며, 특히 중국어 단서를 이해하고 중국어 이외의 문자로 이미지를 생성하는 데 능숙합니다.
7개월 전
022.5K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

마이크로 에이전트: 자동으로 코드를 생성하고 테스트 및 수정하는 AI 프로그래밍 인텔리전스입니다.

일반 소개 마이크로 에이전트는 Builder.io에서 개발한 오픈 소스 AI 코딩 도우미로, 개발자에게 코드를 자동으로 생성하고 테스트할 수 있는 기능을 제공하도록 설계되었습니다. 자연어 설명을 이해하여 테스트 케이스를 생성하고 모든 테스트가 통과할 때까지 코드를 반복하여 오픈 ...
9개월 전
022.5K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: 기술 PDF 문서에 자동으로 주석을 달고 관련 인용을 제공합니다.

종합 소개 SmartRead는 기술 문서용으로 설계된 AI 기반 오픈 소스 도구입니다. PDF 파일을 자동으로 분석하고 중요한 용어, 제목 또는 핵심 아이디어와 같은 주요 내용을 표시하여 사용자가 복잡한 문서를 빠르게 이해할 수 있도록 도와줍니다. 동시에 주요 내용을 제공하고 문서화할 수도 있습니다.
7개월 전
022.5K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIA, LangChain 출시: 분석을 위한 구조화된 보고서 작성을 위한 고급 가이드, AI 기반 기술 보고서 생성 지원

일반 소개 이 프로젝트는 랭체인과 엔비디아가 공동 개발한 구조화된 보고서 생성 청사진 프로젝트로, 깃허브의 주피터 노트북 튜토리얼에 소개되어 있습니다. 이 프로젝트는 고급 AI 기술, 특히 Llama-3.3-7...
7개월 전
022.5K
Story-Flicks:输入主题自动生成儿童短故事视频

스토리-플릭: 주제를 입력하면 어린이용 단편 동화 동영상이 자동으로 생성됩니다.

종합 소개 스토리 플릭스는 사용자가 HD 스토리 동영상을 빠르게 생성할 수 있도록 지원하는 오픈 소스 AI 툴입니다. 사용자는 스토리 주제만 입력하면 시스템이 대규모 언어 모델을 통해 스토리 콘텐츠를 생성하고 AI가 생성한 이미지, 오디오 및 자막을 결합하여 완전한 비디오를 출력합니다....
7개월 전
022.4K
FramePainter:AI驱动的涂鸦式图像编辑工具

프레임페인터: AI 기반 낙서 스타일의 이미지 편집 도구

일반 소개 프레임페인터는 고급 동영상 확산 기술과 직관적인 스케치 컨트롤을 활용하여 사용자가 복잡한 이미지 편집을 쉽게 할 수 있도록 도와주는 혁신적인 AI 기반 이미지 편집 도구입니다. 간단한 조정이든 복잡한 창의적 변형이든, 프레임페인터는 ...
9개월 전
022.4K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

프롬프타이머: 대형 모델 프롬프트 단어를 최적화하는 실험적인 라이브러리로, 프롬프트를 자동으로 최적화합니다.

일반 소개 프롬프타이마이저는 사용자가 AI 시스템의 단서를 체계적으로 개선할 수 있도록 설계된 실험적인 단서 단어 최적화 라이브러리입니다. 프롬프타이마이저는 최적화 프로세스를 자동화함으로써 특정 작업에서 프롬프트 단어의 성능을 향상시킬 수 있습니다. 사용자는 다음 정보만 제공하면 됩니다.
11개월 전
022.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: 통합된 멀티 플랫폼 AI 모델을 갖춘 간단한 웹 채팅 인터페이스(배포 필요 없음)

일반 소개 오리온챗은 사용자에게 여러 주류 AI 모델과 상호 작용할 수 있는 통합 플랫폼을 제공하는 웹 기반 AI 채팅 인터페이스입니다. 이 프로젝트는 Ollama(로컬에서 실행), OpenAI GPT, Google Gemi... 등 다양한 AI 모델을 지원합니다.
10개월 전
022.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus: 확장 가능한 AI 다중 지능 시스템 및 작업 자동화를 구축하기 위한 경량 프레임워크

일반 소개 PrimisAI Nexus는 GitHub에서 호스팅되고 PrimisAI 팀이 개발한 경량 오픈 소스 Python 프레임워크로, 사용자가 LLM(대규모 언어 모델링)을 통해 확장 가능한 AI 다중 지능형 바디 시스템을 구축하고 관리할 수 있도록 지원합니다....
7개월 전
022.4K
Mobius Diffusion:文本提示生成无缝循环视频

뫼비우스 확산: 텍스트 프롬프트가 끊김 없이 반복되는 동영상 생성

일반 소개 Mobius Diffusion은 텍스트 입력에서 매끄럽게 반복되는 동영상 콘텐츠를 생성하는 데 중점을 둔 혁신적인 온라인 도구입니다. 사전 학습된 동영상 확산 모델을 기반으로 하며 사용자 교육이나 주석 데이터가 필요하지 않아 빠르게 시작할 수 있습니다. 이 사이트의 핵심 기술은 ...
8개월 전
022.4K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

제미니 넥스트 채팅: 클릭 한 번으로 비공개 멀티모달 제미니 앱을 무료로 배포하세요!

일반 소개 Gemini Next Chat은 사용자가 비공개 Gemini 애플리케이션을 쉽게 배포할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Gemini 1.5 및 Gemini 2.0 멀티모달 모델을 지원하며, 사용자는 클릭 한 번으로 배포할 수 있습니다.
9개월 전
022.4K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

멀티포스트 확장: 한 번의 클릭으로 AI 생성 콘텐츠를 자체 퍼블리싱 플랫폼에 동기화하는 브라우저 확장 기능

일반 소개 멀티포스트 확장 프로그램은 사용자가 한 번의 클릭으로 여러 소셜 미디어 플랫폼에 콘텐츠를 게시할 수 있도록 설계된 강력한 브라우저 확장 프로그램입니다. 이 확장 프로그램은 지후, 웨이보, 샤오홍슈, 틱톡 등 10개 이상의 주요 플랫폼에 동시에 게시할 수 있도록 지원합니다.
8개월 전
022.4K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: 다중 지능형 협업 애플리케이션을 만들기 위한 효율적인 프레임워크

일반 소개 AIEvo는 멀티 에이전트 애플리케이션을 효율적으로 생성하기 위해 설계된 Ant Group의 오픈 소스 멀티 에이전트 프레임워크입니다. 이 프레임워크는 복잡한 작업의 실행 성공률을 높이기 위해 SOP 작업 그래프를 엄격하게 따르며, 피드백 및 모니터링 메커니즘을 통해 높은 유연성과 확장성을 보장합니다.AIEvo는 Ant Group 내에서 제작되었습니다...
9개월 전
022.4K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: 웹사이트 자동 포함 및 다국어 오픈 소스 AI 도구 탐색 사이트 지원

일반 소개 AigoTools는 사용자가 탐색 사이트를 빠르게 만들고 관리할 수 있도록 설계된 오픈 소스 AI 웹 사이트 탐색입니다. 내장된 사이트 관리 및 AI 기반 자동 포함 기능, 다국어 지원, 어둡고 밝은 테마 전환, SEO 최적화 기능을 갖추고 있습니다.AigoTools는 ...
12개월 전
022.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: 동영상 저작권을 보호하는 고급 오픈 소스 동영상 히든 워터마크 삽입 및 추출 도구

일반 소개 VideoSeal은 Facebook Research에서 개발한 오픈 소스 동영상 워터마킹 도구로, 효율적인 동영상 워터마크 삽입 및 추출을 제공하기 위해 설계되었습니다. 이 도구는 최신 오픈 소스 모델을 지원하며 사전 학습된 모델, 학습 코드, 추론 코드 및 평가 도구가 포함되어 있습니다.
10개월 전
022.3K
MemFree:本地知识库与搜索信息混合的AI搜索引擎

MemFree: 지역 지식 기반과 검색 정보를 혼합하는 AI 검색 엔진

일반 소개 MemFree는 텍스트, 이미지, 문서 및 웹 페이지를 통해 검색하고 질문할 수 있는 고급 하이브리드 AI 검색 엔진입니다. 텍스트, 마인드맵, 이미지, 동영상에 대한 검색 결과에 한 번의 클릭으로 액세스할 수 있으며, MemFree는 사용자의 지식 기반에서 정보를 추출하고...
1 년 전
022.3K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。

XDOllama: MacOS에서 Ollama\Dify\Xinference를 빠르게 호출할 수 있는 AI 모델 인터페이스입니다.

일반 설명 XDOllama는 MacOS 사용자가 Ollama, Dify 및 Xinference와 같은 AI 모델을 빠르게 호출할 수 있도록 설계된 데스크톱 애플리케이션입니다. 간소화된 인터페이스와 워크플로우를 통해 사용자는 이 애플리케이션을 통해 다음을 수행할 수 있습니다.
11개월 전
022.3K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: 명령줄 터미널에서 실행되는 지능형 프로그래밍 도우미, ChatGPT 코드 인터프리터의 현지화된 대안

종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...
10개월 전
022.3K
BotSharp:基于.NET的多智能体AI应开发与管理平台

BotSharp: .NET 기반 다중 인텔리전스 AI 개발 및 관리 플랫폼

개요 BotSharp는 포괄적인 AI 챗봇 플랫폼 구축 도구를 제공하기 위한 .NET Core 기반의 오픈 소스 프로젝트입니다. C# 프로그래밍을 사용하고 크로스 플랫폼 운영을 지원하며 머신러닝 알고리즘의 적용을 단순화하여 엔터프라이즈급 개발자가 효율적으로 사용할 수 있도록 하는 것을 목표로 합니다.
9개월 전
022.3K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent: 의사가 약물 효과와 치료 옵션을 분석하는 데 도움을 주는 AI 도구

종합 소개 TxAgent는 의사가 약물 상호작용을 분석하고 맞춤형 치료 계획을 개발할 수 있도록 하버드 대학교의 의료 및 과학 인공 지능 팀(MIMS)에서 개발한 오픈 소스 AI 도구입니다. 다단계 추론과 생의학 지식의 실시간 검색을 통해 환자별 상황을 결합하여...
7개월 전
022.3K
Reactive Resume:支持多语言、多模板的开源免费简历生成器

반응형 이력서: 다국어 및 다중 템플릿을 지원하는 오픈 소스 무료 이력서 작성기

일반 설명 반응형 이력서는 이력서 작성, 업데이트 및 공유 프로세스를 간소화하도록 설계된 무료 오픈 소스 이력서 작성기입니다. 이 플랫폼은 사용자 추적이나 광고 없이 사용자 개인정보 보호에 중점을 두고 있습니다. 사용자는 30초 이내에 앱을 셀프 호스팅할 수 있으며, 앱을 완전히 제어할 수 있습니다.
10개월 전
022.2K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

텍스트 디스틸러: 한 번의 클릭으로 책 전체를 요약하고, 책의 내용을 효율적으로 추출하고, 핵심 아이디어를 빠르게 파악할 수 있습니다.

종합 소개 TextDistiller는 책을 챕터별로 또는 전체적으로 요약하여 간결하면서도 포괄적인 개요를 제공하도록 설계된 고급 AI 기반 도구입니다. 텍스트 디스틸러를 사용하면 어떤 책이든 핵심 아이디어와 요점을 빠르게 파악할 수 있습니다.
10개월 전
022.2K
Claude生成深度研究报告的MCP服务

심층 연구 보고서 생성을 위한 Claude의 MCP 서비스

일반 소개 MCP 서버 딥 리서치는 인공지능과 웹 검색을 통해 복잡한 문제에 대한 구조화된 연구 보고서를 자동으로 생성하는 오픈 소스 도구입니다. 사용자가 연구 질문을 입력하면 도구가 질문을 분석하고, 권위 있는 정보를 검색하고, 출처 신뢰도를 평가합니다...
5개월 전
022.2K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

일반 소개 Auto-Coder.Chat은 지능형 수단을 통해 개발자의 프로그래밍 효율성을 향상시키기 위해 설계된 터미널 기반 AI 지원 프로그래밍 도구입니다. 이 도구는 모든 IDE와 함께 사용하여 개발 도구에서 AI 지원 프로그래밍을 활성화할 수 있습니다.Auto...
6개월 전
022.2K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

크로노스: 뉴스 검색 및 타임라인 생성 효율성을 개선하는 뉴스 타임라인 요약 도구

일반 소개 CHRONOS는 Alibaba NLP 팀에서 개발한 뉴스 타임라인 요약 도구입니다. 이 도구는 반복적 인 자체 질문을 통해 뉴스 이벤트의 타임 라인 요약을 생성합니다.CHRONOS는 오픈 도메인 타임 라인 요약 작업을 처리 할 수있을뿐만 아니라 효율성과 확장 성 측면에서도 ...
9개월 전
022.2K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: 모든 클라우드에서 AI 및 배치 작업을 효율적으로 실행하기 위한 오픈 소스 프레임워크

일반 소개 SkyPilot은 캘리포니아 버클리 대학교의 Sky Computing Lab에서 시작한 오픈 소스 프레임워크로, 사용자가 모든 클라우드 인프라에서 AI 및 일괄 처리 작업을 효율적으로 실행할 수 있도록 설계되었습니다. 14개 이상의 클라우드 서비스를 지원합니다(다음을 포함하여 ...
8개월 전
022.1K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: 단일 동영상에서 멀티뷰 동영상을 생성하기 위한 렌더링 도구

일반 소개 ReCamMaster는 오픈 소스 동영상 처리 도구로, 핵심 기능은 단일 동영상에서 새로운 카메라 뷰를 생성하는 것입니다. 사용자는 카메라 트랙을 지정하고 비디오를 다시 렌더링하여 다양한 각도의 역동적인 영상을 얻을 수 있습니다. 절강대학교와 레이서 테크놀로지 팀이 개발한 이 도구는 텍스트-투-텍스트를 기반으로 합니다.
6개월 전
022.1K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw: 손으로 그린 스케치를 3D 모델로 변환하는 창의적인 도구

일반 소개 Vibe Draw는 Martin Sit이 개발한 오픈 소스 프로젝트로, 사용자가 손으로 그린 스케치를 아름다운 3D 모델로 변환할 수 있게 해줍니다. 이 도구의 목표는 간단합니다. 뛰어난 예술적 기술이나 재주가 없어도 누구나 쉽게 3D 모델링을 할 수 있도록 하는 것입니다.
7개월 전
022.1K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: 고품질의 긴 글을 작성하고, 외부 지식을 검색한 다음 이를 반영하여 단계별로 지식 트리를 구축하기 위한 글쓰기 프레임워크입니다.

포괄적인 소개 OmniThink는 인간의 인지 과정의 반복적인 확장과 반영을 모방하여 고품질의 긴 형식의 에세이를 생성하도록 설계된 혁신적인 기계 글쓰기 프레임워크입니다. 이 프레임워크는 지식의 경계를 확장하고 풍부하고 깊이 있는 정보를 생성하는 데 중점을 두며, 이를 위해 다음과 같이 구성됩니다.
9개월 전
022.1K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: 중국어 법률 지식 모델링, 법률 퀴즈 및 사법시험 교육 지원

일반 소개 LaWGPT는 난징대학교의 기계 학습 및 데이터 마이닝 연구 그룹이 지원하는 오픈 소스 프로젝트로, 중국 법률 지식을 기반으로 대규모 언어 모델을 구축하는 데 전념하고 있습니다. 일반 중국어 모델(중국어-LLaMA 및 ChatGLM 등)을 기반으로 합니다...
7개월 전
022.1K
Cloudflare Agents:在边缘网络上构建实时交互的智能体

Cloudflare 에이전트: 엣지 네트워크에서 실시간 대화형 인텔리전스 구축

일반 소개 Cloudflare 에이전트는 개발자가 글로벌 에지 네트워크에서 지능형 AI 에이전트를 구축할 수 있도록 설계된 Cloudflare의 오픈 소스 개발 프레임워크입니다. 에이전트는 상태를 유지하고, 실시간으로 통신하며, 자율적으로 실행할 수 있는 기능을 제공하며, 현재 항목...
7개월 전
022.1K
SuperCoder:命令行终端运行的智能代码助手

슈퍼코더: 명령줄 터미널 실행을 위한 지능형 코드 도우미

일반 소개 슈퍼코더는 터미널에서 실행되는 지능형 도구로 프로그래머를 위해 설계되었습니다. AI 기술을 사용하여 사용자가 코드를 검색하고, 프로젝트 구조를 보고, 파일을 편집하고, 버그를 수정할 수 있도록 도와주며, 이 프로젝트는 GitHub의 huytd에서 오픈 소스이며 다음을 지원합니다.
7개월 전
022K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI: 고부가가치 AI 모델 전달 인터페이스 관리 시스템, 공식 웹사이트에서 매일 무료 API 할당량을 제공합니다.

종합 소개 VoAPI는 주로 개인 또는 기업 내부 관리 및 배포 채널에 사용되는 새로운 고도의 고성능 AI 모델 인터페이스 관리 및 배포 시스템입니다. NewAPI를 기반으로 개발된 이 시스템은 풍부한 기능 모듈과 최적화된 사용자 인터페이스를 제공하여 다음을 향상시키는 것을 목표로 합니다.
11개월 전
022K
Vector Vein(向量脉络):无代码AI工作流构建平台

벡터 베인: 코드 없는 AI 워크플로 구축 플랫폼

포괄적인 소개 벡터 베인은 사용자가 지능적이고 자동화된 워크플로우를 쉽게 만들 수 있도록 설계된 코드 없는 AI 워크플로우 구축 플랫폼입니다. 프로그래밍 기반이 필요하지 않으므로 사용자는 드래그 앤 드롭 작업을 통해 다양한 기능 모듈을 간단히 연결하여 복잡한 AI 작업을 구축할 수 있습니다.
11개월 전
022K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

개인 건강 데이터 관리를 위한 AI 비서, 맞춤형 건강 플랜을 위한 검사 보고서 업로드: OpenHealthForAll

일반 소개 오픈헬스포올은 사용자가 자신의 개인 건강 데이터를 관리하고 이해할 수 있도록 설계된 오픈소스 프로젝트입니다. 인공 지능 기술을 활용하여 사용자가 더 잘 관리할 수 있도록 로컬에서 실행되는 건강 도우미를 제공합니다.
8개월 전
022K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: 인기 기술 기사를 바로 들을 수 있는 오디오 팟캐스트로 전환하기

일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...
5개월 전
022K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: 위즈덤 스펙트럼의 오픈 소스 캐스케이드 확산 텍스트 생성 이미지 모델

종합 소개 CogView3는 칭화대학교와 싱크탱크 팀(Chi Spectrum Qingyan)이 개발한 고급 텍스트 생성 이미지 시스템입니다. 계단식 확산 모델을 기반으로 하며 여러 단계를 거쳐 고해상도 이미지를 생성하며, 다단계 생성, 혁신적인 아키텍처 및 효율적인 성능을 포함한 CogView3의 주요 기능은 다음과 같습니다.
1 년 전
022K
BrownChat:开源实时语音聊天的AI助手

브라운챗: 오픈 소스 실시간 음성 채팅 AI 비서

일반 소개 브라운챗은 대규모 언어 모델링(LLM) 기술을 기반으로 한 실시간 오디오 채팅 애플리케이션입니다. 깃허브 사용자 sugarforever가 개발한 이 프로젝트는 고급 자연어 처리 기술을 통해 사용자의 커뮤니케이션 경험을 향상시키는 것을 목표로 합니다....
9개월 전
021.9K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

판토매트릭스(EMAGE): 전신 제스처 생성 프레임워크, 오디오에서 전신 제스처를 생성하는 3D 애니메이션 프레임워크

종합 소개 판토매트릭스는 얼굴, 신체 일부, 손, 전신 움직임을 포함한 오디오 및 부분 제스처로부터 사람의 완전한 움직임을 생성할 수 있는 고급 전신 제스처 생성 프레임워크입니다. 이 프레임워크는 최신 멀티모달 데이터 세트와 딥러닝 기술을 활용하여 고품질의 3D...
11개월 전
021.9K
gpt prompt engineer:语言模型提示工程工具|优化提示指令

gpt 프롬프트 엔지니어: 언어 모델 프롬프트 엔지니어링 도구 | 프롬프트 명령 최적화하기

일반 소개 gpt-prompt-engineer는 GitHub의 오픈 소스 프로젝트로, GPT 모델의 프롬프트 엔지니어링에 중점을 두고 있습니다. 사용자는 작업 설명과 테스트 케이스를 입력할 수 있으며, 이 도구는 다양한 프롬프트를 생성, 테스트 및 순위를 매겨 가장 우수한 프롬프트를 찾을 수 있습니다....
1 년 전
021.9K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

루이 모델: 렌즈 제어 및 모션 진폭 제어를 지원하는 이미지-투-비디오 오픈 소스 모델을 생성합니다.

일반 소개 Ruyi-Models는 이미지에서 고품질 동영상을 생성하도록 설계된 오픈 소스 프로젝트입니다. IamCreateAI 팀이 개발한 이 프로젝트는 768 해상도, 초당 24프레임, 5초에 120프레임의 시네마틱 비디오 생성을 지원합니다....
10개월 전
021.9K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: 작업 계획 및 실행 자동화를 위한 지식 그래프 구축

종합 소개 그래프에이전트는 그래프 생성, 작업 계획, 작업 실행을 통합한 자동화된 지능형 바디 시스템입니다. 정형 및 비정형 데이터 처리, 복잡한 시맨틱 의존성 그래프 구축, 자체 계획 및 도구 매칭을 통해 사용자 작업을 효율적으로 실행할 수 있습니다.그래프...
9개월 전
021.9K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: 텍스트 메뉴를 멋진 그래픽 메뉴로 변환하기

개요 PicMenu는 간단한 사진 조작을 통해 기존의 종이 메뉴판을 생생하고 직관적인 그림 메뉴판으로 바꿔주는 혁신적인 AI 도구입니다. 이 도구는 각 요리의 고품질 이미지를 자동으로 생성할 뿐만 아니라 요식업의 디지털 혁신을 위해 요리에 대한 풍부한 정보를 제공합니다...
11개월 전
021.9K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: 대형 모델을 쉽게 이해하고 조작할 수 있도록 사용자 인터페이스 스크린샷을 구조화된 요소로 파싱합니다.

일반 소개 OmniParser는 사용자 인터페이스 스크린샷을 구조화되고 이해하기 쉬운 요소로 구문 분석하기 위해 Microsoft에서 개발한 도구입니다. 이 도구는 해당 인터페이스 영역에서 정확한 동작을 생성하는 GPT-4V의 기능을 크게 향상시킵니다.OmniParser는 다음을 지원할 뿐만 아니라...
8개월 전
021.8K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: 시각적 추론 탐구를 위한 다중 모드 강화 학습 도구

종합 소개 MM-EUREKA는 상하이 인공 지능 연구소, 상하이 자오통 대학교 및 기타 관계자들이 개발한 오픈 소스 프로젝트입니다. 이 도구는 규칙 기반 강화 학습 기법을 통해 텍스트 추론 기능을 멀티모달 시나리오로 확장하여 모델이 이미지와 텍스트 정보를 처리할 수 있도록 지원합니다. 이 도구의 핵심은...
7개월 전
021.8K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델

종합 소개 Omni-RGPT는 이미지와 동영상에 대한 영역 수준의 이해를 가능하게 하도록 설계된 멀티모달 대규모 언어 모델입니다. 토큰 마크 기술을 도입함으로써 Omni-RGPT는 시각적 특징 공간에서 영역 단서(예: 상자 또는...)로 대상 영역을 강조 표시할 수 있습니다.
9개월 전
021.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

비전만 있으면 충분합니다: 시각 언어 모델을 사용한 지능형 문서 검색 시스템 구축(Vision RAG)

종합 소개 Vision-is-all-you-need는 시각 언어 모델링(VLM)을 문서 처리 영역에 적용하는 새로운 지평을 여는 혁신적인 시각적 RAG(검색 증강 생성) 시스템 데모 프로젝트입니다. 기존의 텍스트 청킹 방식과 달리 이 시스템은 직접적으로 ...
9개월 전
021.8K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-데이터 빌더: 무료 빅 모델 API를 사용하여 AI 학습 데이터 생성, 0 비용 빅 모델 학습 데이터 생성

종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...
11개월 전
021.8K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: 확장 가능한 플러그인을 갖춘 완전한 기능의 경량 크로스 플랫폼 AI 클라이언트

포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.
10개월 전
021.8K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: 비정형 데이터 및 복잡한 쿼리를 위한 검색 엔진

일반 소개 dsRAG는 비정형 데이터에 대한 복잡한 쿼리를 처리하도록 설계된 고성능 검색 엔진입니다. 재무 보고서, 법률 문서, 학술 논문과 같은 밀도가 높은 텍스트의 까다로운 쿼리에서 특히 뛰어난 성능을 발휘합니다. dsRAG는 성능 향상을 위해 세 가지 주요 접근 방식을 사용합니다.
8개월 전
021.8K
Denser Chat:与PDF文件互动,提供源代码高亮显示

더 밀도 높은 채팅: PDF 파일과 상호 작용하고, 소스 코드 강조 표시 기능 제공

일반 설명 Denser Chat은 소스 코드 강조 표시를 통해 PDF 파일과 웹 페이지에서 텍스트와 표를 추출하기 위해 denser.ai에서 개발 및 유지 관리하는 챗봇 프로젝트입니다. 이 프로젝트는 밀도 높은 챗봇 구축을 지원합니다.
10개월 전
021.8K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目

샤오위안커우쑤안 자동 질문과 답변 도구, 구두 산술 주제를 효율적으로 해결

종합 소개 Ape Mouth 계산기 자동 질문 답변 도구는 OCR 인식 및 자동화 스크립트를 통해 Ape Mouth 계산기 애플리케이션의 문제를 효율적으로 해결하기 위해 설계된 Python 기반 오픈 소스 프로젝트입니다. 이 도구는 OpenCV 및 Tesseract와 같은 기술을 사용하여 화면의 질문을 실시간으로 식별할 수 있습니다....
1 년 전
021.8K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

롱라이터: 위즈덤 스펙트럼은 매우 긴 텍스트를 생성하는 강력한 모델을 출시하여 단일 대화에서 10,000개 이상의 단어를 생성할 수 있도록 지원합니다.

종합 소개 LongWriter는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 강력한 긴 텍스트 생성 도구입니다. 이 도구는 고급 장문 언어 모델(LLM)을 기반으로 하며 10,000단어 이상의 긴 텍스트를 생성할 수 있습니다.LongWriter...
10개월 전
021.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

Mac 어시스턴트: macOS 기기에서 데스크톱 작업을 자동화하는 AI 인텔리전스

일반 소개 맥 어시스턴트는 기본 소프트웨어와 웹 기능을 결합하여 사용자 작업을 간소화하는 것을 목표로 하는 macOS용으로 설계된 AI 인텔리전스 바디 프로젝트입니다. 이 프로젝트는 현재 OpenAI 및 GEMINI API를 지원하며 향후 지원할 계획입니다.
8개월 전
021.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT 박스: 다른 웹 페이지에서 ChatGPT를 작동시키는 브라우저 플러그인

일반 소개 ChatGPT Box는 ChatGPT를 사용자의 브라우저에 긴밀하게 통합하도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. josStorer에서 개발한 이 도구는 여러 언어를 지원하며 모든 페이지에서 채팅 쌍을 호출하는 등 다양한 기능을 제공합니다.
6개월 전
021.8K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

솔라나 에이전트 키트: AI 인텔리전스를 솔라나 프로토콜에 연결하기 위한 오픈 소스 툴킷

일반 소개 솔라나 에이전트 키트는 AI 지능을 솔라나 블록체인 프로토콜에 원활하게 연결하도록 설계된 오픈 소스 툴킷입니다. 이 키트를 사용하면 AI 연구자와 암호화폐 개발자 모두 모델 훈련을 받은 지능형 기관을 사용하여 다음을 실행할 수 있습니다.
8개월 전
021.8K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: 복잡한 작업을 위한 자동화 솔루션을 간소화하는 로우코드 멀티 인텔리전트 바디 프레임워크

종합 소개 PraisonAI는 프로덕션 환경을 위한 즉시 사용 가능한 다중 지능 바디 프레임워크로, 간단한 작업부터 복잡한 과제까지 다양한 문제를 자동화하고 해결할 수 있는 AI 지능을 생성하도록 설계되었습니다. 이 프레임워크는 다중 지능 바디 LLM 시스템 구축을 간소화하는 로우코드 솔루션을 제공하며...
8개월 전
021.7K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: AI 기반 일일 예산 관리로 일일 예산을 쉽게 추적할 수 있습니다.

일반 설명 Porkybank는 사용자가 일일 예산을 쉽게 추적할 수 있도록 설계된 오픈 소스 개인 재무 관리 애플리케이션입니다. (수입 - 지출) / 일수 = 현금이라는 간단한 공식으로 사용자는 자신의 재정 상황을 시각화할 수 있습니다. 이 프로젝트는 깃허브에서 호스팅됩니다...
9개월 전
021.7K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: 임의의 3D 및 4D 장면의 동영상을 생성하기 위한 오픈 소스 프레임워크

일반 소개 GenXD는 싱가포르 국립대학교(NUS)와 마이크로소프트 팀이 개발한 오픈 소스 프로젝트입니다. 불충분한 데이터와 모델 설계 복잡성으로 인한 실제 3D 및 4D 생성 문제를 해결하기 위해 임의의 3D 및 4D 장면을 생성하는 데 중점을 둡니다. 이 프로젝트는 ...
7개월 전
021.7K