AI 오픈 소스 프로젝트

총 1020개 문서
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: 소스 코드 읽기 도구, LLM을 사용하여 코드를 분석하고, 자세한 코드 설명을 제공하고, 다양한 프로그래밍 언어를 지원합니다.

일반 소개 askrepo는 LLM(대규모 언어 모델)을 기반으로 하는 소스 코드 읽기 도구입니다. 지정된 디렉터리에 있는 Git 관리 텍스트 파일의 내용을 읽고 Google Gemini API로 전송하여 지정된 프롬프트에 따라 질문에 대한 답변을 제공할 수 있습니다.
11개월 전
023.7K
集成多种先进语音合成服务的开源运营项目

여러 고급 음성 합성 서비스를 통합하는 오픈 소스 운영 프로젝트

일반 소개 오픈 보이스 캔버스는 ItusiAI 팀에서 개발한 오픈 소스 음성 합성 플랫폼입니다. 50개 이상의 언어를 지원하며, 텍스트를 자연스러운 음성으로 변환하고 오디오를 업로드하여 개인화된 음성을 복제할 수 있습니다. 이 프로젝트는 Ope...
6개월 전
023.7K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: 거의 모든 비디오 플랫폼을 지원하는 명령줄 비디오 다운로더

일반 소개 Lux는 Go로 작성된 빠르고 간단한 동영상 다운로드 라이브러리이자 명령줄 도구입니다. 유튜브, 빌리빌리, 유쿠 등 여러 웹사이트에서 동영상을 다운로드할 수 있습니다. Lux는 멀티 스레드 다운로드와 같은 다양한 다운로드 옵션과 기능을 제공합니다.
9개월 전
023.7K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: 나만의 퍼플렉서티 검색 엔진을 배포할 수 있는 오픈 소스 AI 검색 엔진 프레임워크!

종합 소개 MindSearch는 상하이 인공 지능 연구소(SAL)에서 출시한 오픈 소스 AI 검색 엔진 프레임워크로, 복잡한 정보 수집 및 통합을 위한 인간의 사고 과정을 시뮬레이션하는 것을 목표로 합니다. 이 도구는 다중 지능을 통해 대규모 언어 모델링(LLM)과 검색 엔진의 고급 기술을 결합합니다....
10개월 전
023.7K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: 안전한 오프라인을 위한 스마트 프로그래밍 지원, 네이티브 LLM 기반 Vim 프로그래밍 도우미

일반 소개 VimLM은 네이티브 LLM(대규모 언어 모델)으로 구동되는 코드 어시스턴트를 제공하는 Vim 플러그인입니다. Vim 명령을 통해 기본 LLM 모델과 상호 작용하여 코드 컨텍스트를 자동으로 가져와 사용자가 Vim에서 코드를 편집할 수 있도록 도와줍니다.VimLM은 다음에서 영감을 받았습니다.
8개월 전
023.7K
RAIN:实时捕捉真人表情生成动漫形象视频流

RAIN: 실제 사람의 표정을 실시간으로 캡처하여 애니메이션 이미지의 비디오 스트림을 생성합니다.

일반 소개 RAIN(Real-time Animation Of Infinite Video Stream)은 무한 비디오 스트림에 대한 애니메이션 효과를 실시간으로 생성하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Pscgylotti에 의해 개발되었습니다.
9개월 전
023.7K
自动解析PDF内容并提取文字与表格的开源服务

PDF 콘텐츠를 자동으로 구문 분석하고 오픈 소스 서비스의 텍스트와 양식을 추출합니다.

종합 소개 PDF 문서의 레이아웃을 자동으로 분석하고 페이지의 텍스트, 제목, 이미지, 표, 수식 및 기타 요소를 식별하며 올바른 순서를 결정합니다. 이 도구는 OCR 기능을 지원하며 스캔한 PDF를 검색 가능한 텍스트로 변환할 수 있습니다. Docker에서 실행되며 두 가지 모델을 제공합니다...
6개월 전
023.7K
오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라는 대규모 언어 모델(LLM)을 기반으로 다중 지능 협업 시스템을 구축하는 데 중점을 둔 혁신적인 경량 Python 프레임워크입니다. 여러 AI 지능이 교향악단처럼 조화롭게 작동할 수 있도록 지능을 배열하는 고유한 방법을 사용합니다. 모델링으로 ...
9개월 전
023.7K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: 완전히 현지화된 RAG 처리 흐름을 갖춘 문서 Q&A 시스템

일반 소개 PrivateGPT는 프로덕션 환경에서 사용할 수 있는 AI 프로젝트로, 사용자가 인터넷 연결 없이도 대규모 언어 모델(LLM)을 사용하여 문서를 퀴즈할 수 있습니다. 이 프로젝트는 모든 데이터를 사용자의 실행 환경에 배치하여 100%의 데이터 프라이버시를 보장합니다...
10개월 전
023.6K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AI 챗봇 Supabase: 오픈 소스 Next.js와 Supabase는 Vercel에 신속하게 배포할 수 있도록 AI 챗봇을 구축했습니다.

일반 소개 AI 챗봇 수파베이스는 Next.js와 수파베이스를 기반으로 구축된 오픈 소스 AI 챗봇 템플릿입니다. Vercel에서 개발한 이 프로젝트는 완전한 기능을 갖춘 사용자 지정 가능한 챗봇 솔루션을 제공하는 것을 목표로 합니다. 작성자 ...
11개월 전
023.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 고품질 결과를 생성하기 위해 출력을 검토, 검증 및 서식 지정하는 다중 역할 인텔리전스

종합 소개 Kheish는 구조화된 단계별 협업이 필요한 대규모 언어 모델링(LLM) 작업을 위해 설계된 오픈 소스 다중 역할 에이전트로, 단순한 코디네이터를 넘어 필요에 따라 모듈을 요청하고 사용자 반전 기능을 통합하는 그 자체로 지능적인 에이전트입니다.
9개월 전
023.6K
AI Podcast Generator:自动抓取新闻生成音频播客

AI 팟캐스트 생성기: 뉴스를 자동으로 캡처하여 오디오 팟캐스트 생성하기

일반 소개 AI 팟캐스트 생성기는 고급 AI 기술을 사용하여 웹 소스에서 매력적인 오디오 콘텐츠를 자동으로 생성하는 지능형 팟캐스트 생성 도구입니다. 이 시스템은 뉴스 콘텐츠를 캡처하여 오디오 팟캐스트로 변환함으로써 자연스럽게 흐르는 내러티브를 생성합니다. 이 프로젝트는 다음...
11개월 전
023.6K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

500개 이상의 연구 도구를 통합하여 연구 및 과학 작업을 자동화하는 인텔리전스, SciToolAgent

종합 소개 SciToolAgent는 항저우 절강대학교 혁신 센터(HICAI-ZJU)에서 개발한 오픈 소스 도구 플랫폼입니다. 지식 그래프(SciToolKG)와 빅 언어 모델링 기술을 통해 500개 이상의 과학 도구를 통합하여 연구자들이 다음과 같은 문제를 처리할 수 있도록 지원합니다.
7개월 전
023.6K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 오디오 및 비디오 콘텐츠를 빠르게 추출하고 구조화된 노트를 생성하세요.

종합 소개 AudioNotes는 FunASR과 Qwen2를 기반으로 구축된 오디오/비디오-구조화된 노트 시스템입니다. 오디오/비디오 콘텐츠를 빠르게 추출하고 빅 모델을 호출하여 구조화된 마크다운 노트를 생성할 수 있어 다음과 같은 경우에 편리합니다.
8개월 전
023.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
10개월 전
023.6K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: AI 애플리케이션을 위한 사용자 프로필 기반 장기 메모리 솔루션

일반 소개 메모베이스는 생성형 AI 애플리케이션을 위해 오래 지속되는 사용자 메모리를 지원하도록 설계된 사용자 프로필 기반 메모리 시스템입니다. 가상 동반자, 교육 도구 또는 개인화된 비서를 구축하든, Memobase는 AI가 다음을 사용하여 기억하고 이해하고 성장할 수 있도록 지원합니다.
8개월 전
023.6K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

비디오리토킹: 오디오 기반 립싱크 및 비디오 편집 시스템

일반 소개 비디오리토킹은 사용자가 입력된 오디오를 기반으로 립싱크된 얼굴 비디오를 생성하여 다양한 감정에도 고품질의 립싱크된 출력 비디오를 생성할 수 있는 혁신적인 시스템입니다. 이 시스템은 이 목표를 세 가지 연속적인 작업으로 분류합니다: 일반적인 표정...
10개월 전
023.6K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

비디오챗: 사용자 지정 이미지 및 톤 복제가 가능한 실시간 음성 대화형 디지털 사람, 엔드투엔드 음성 솔루션 및 캐스케이딩 솔루션 지원

일반 소개 비디오챗은 오픈 소스 기술을 기반으로 하는 실시간 음성 상호작용 디지털 사람 프로젝트로, 엔드투엔드 음성 체계(GLM-4-Voice - THG)와 캐스케이드 체계(ASR-LLM-TTS-THG)를 모두 지원합니다. 이 프로젝트를 통해 사용자는 디지털 ...
11개월 전
023.6K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: 초안 이메일(Gmail) 응답의 신속한 생성을 위한 현지화된 AI 이메일 자동화 시스템

일반 소개 LAMBDA(로컬 자동 받은 편지함 초안 작성 도우미)는 사용자의 이메일 스타일을 학습하여 Gmail 받은 편지함의 읽지 않은 모든 이메일에 대해 초안을 생성하도록 설계된 현지화된 AI 이메일 자동화 시스템입니다....
10개월 전
023.5K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: 통합 OpenAI 인터페이스 스타일의 여러 대규모 모델 호출, 빠른 모델 전환 및 비교 테스트

포괄적인 소개 aisuite는 개발자가 여러 생성 AI 제공업체의 서비스를 쉽게 호출할 수 있도록 설계된 간단하고 통합된 인터페이스입니다. OpenAI와 유사한 인터페이스를 통해 가장 널리 사용되는 LLM(대규모 언어 모델)과 쉽게 상호 작용할 수 있는 aisuite...
11개월 전
023.5K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs: 기술 문서를 빠르게 크롤링하고 정리할 수 있는 MCP 서비스

일반 소개 DevDocs는 CyberAGI 팀에서 개발하고 GitHub에서 호스팅하는 완전 무료 오픈 소스 도구입니다. 프로그래머와 소프트웨어 개발자를 위해 설계된 이 도구는 기술 문서의 URL로 시작하여 관련 페이지를 자동으로 크롤링하고 이를 간결한 마...
6개월 전
023.5K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 자연어 설명으로 비디오 검색, 편집 및 생성 워크플로우를 수행하는 지능형 비디오 에이전트 프레임워크입니다.

개요 Director는 지능형 비디오 에이전트를 구축하여 비디오 상호 작용 및 워크플로우를 간소화하고 최적화하도록 설계된 오픈 소스 프레임워크입니다. 이 프레임워크는 VideoDB의 '데이터형 비디오' 인프라를 기반으로 하며 검색, 편집, 컴파일, 생성 등 복잡한 비디오 작업을 처리할 수 있습니다.
10개월 전
023.5K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG: 대규모 모델을 사용하여 인간 행동 시뮬레이션을 위한 사회적 관계 그래프 생성하기

일반 소개 GraphAgent는 GitHub에서 호스팅되고 Ji-Cather가 개발한 오픈 소스 프레임워크입니다. 대규모 언어 모델(LLM)을 사용하여 인간의 행동을 시뮬레이션하고 텍스트 속성을 가진 동적인 소셜 그래프를 생성합니다. 이 도구는 온라인 소셜 미디어에 적합합니다...
7개월 전
023.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net: 사진 및 비디오를 애니메이션 스타일로 변환하는 오픈 소스 도구

일반 소개 DCT-Net은 이미지의 애니메이션 스타일 변환을 목표로 북경대학교 왕쉬안 컴퓨터 기술 연구소와 DAMO 아카데미에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 도메인 캘리브레이션 번역(Domain-Calibrat...
9개월 전
023.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

종합 소개 Maestro는 Roboflow에서 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하여 누구나 자신만의 시각적 매크로 모델을 훈련할 수 있도록 개발한 도구입니다. 이 도구는 F와 같이 널리 사용되는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공합니다.
8개월 전
023.5K
에이전타리움: 여러 AI 인텔리전스 간의 상호작용 관리 및 조정

에이전타리움: 여러 AI 인텔리전스 간의 상호작용 관리 및 조정

일반 소개 에이전타리움은 AI 지능형 에이전트(에이전트)를 관리하고 오케스트레이션하는 데 특화된 강력한 Python 프레임워크입니다. 이 프레임워크는 여러 AI 에이전트 간의 상호 작용을 생성, 관리 및 오케스트레이션하는 유연하고 직관적인 방법을 제공합니다. 이 프레임워크는 A...
9개월 전
023.5K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: 오디오 기반 3D 깊이 인식 인물 토킹 비디오 편집 도구

종합 소개 JoyGen은 말하는 얼굴을 위한 혁신적인 2단계 비디오 생성 프레임워크로, 오디오 기반 표정 생성 문제를 해결하는 데 중점을 두고 있습니다. 징동 테크놀로지 팀이 개발한 이 프레임워크는 고급 3D 재구성 기술과 오디오 특징 추출 방법을 사용하여 화자의 신원 특성과 표정을 정확하게 포착합니다.
9개월 전
023.4K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: 실시간으로 AI 뉴스를 추적 및 요약하고, WeChat에 자동으로 게시합니다.

일반 소개 ai-trend-publish는 인공지능의 최신 트렌드를 실시간으로 추적하고 게시하는 데 중점을 두고 OpenAISpace 팀에서 개발한 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 이 도구는 개발자, 기술 애호가를 돕기 위해 설계되었습니다.
8개월 전
023.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

딥 파인더: 로컬 지식을 이용한 심층 추론 검색을 위한 오픈 소스 프로젝트

종합 소개 Deep Searcher는 개인 데이터를 기반으로 검색, 평가 및 추론하도록 설계된 LLM(대규모 언어 모델)과 벡터 데이터베이스를 결합하여 매우 정확한 답변과 포괄적인 보고서를 제공하는 강력한 도구입니다. 엔터프라이즈 지식 관리에 적합합니다...
8개월 전
023.4K
HivisionIDPhotos:开源智能AI证件照制作工具

하이비전ID사진: 오픈 소스 지능형 AI 사진 신분증 생성 도구

종합 소개 HivisionIDPhotos는 오픈 소스 경량 AI 문서 사진 제작 도구로, 사용자 사진 장면과 키잉을 지능적으로 식별하여 다양한 사양에 맞는 표준 문서 사진을 생성할 수 있습니다. 이 도구는 사용자 정의 배경 색상과 크기를 지원하며 향후 뷰티 및 ...
1 년 전
023.4K
GaiaNet node:安装和运行自己的本地模型在线代理服务

GaiaNet 노드: 자체 로컬 모델 온라인 프록시 서비스 설치 및 실행

일반 소개 GaiaNet-AI/gaianet-node는 사용자가 단일 명령으로 Mac, Linux 또는 Windows WSL에 기본 노드 소프트웨어 스택을 빠르게 설치할 수 있는 오픈 소스 프로젝트입니다. 사용자는 노드를 초기화하고, 구성을 사용자 지정하고, 다운로드할 수 있습니다.
1 년 전
023.4K
Kimi-Audio:开源音频处理与对话基础模型

키미 오디오: 오픈 소스 오디오 처리 및 대화 기반 모델

일반 소개 키미오디오는 문샷 AI에서 개발한 오픈 소스 오디오 기반 모델로, 오디오 이해, 생성 및 대화에 중점을 두고 있습니다. 음성 인식, 오디오 질의응답, 음성 감정 인식 등 다양한 오디오 처리 작업을 지원합니다. 이 모델은 130개 이상의 테스트를 거쳤습니다...
5개월 전
023.4K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: 대규모 언어 모델 힌트의 효과를 테스트하고 평가하기 위한 오픈 소스 시각적 프로그래밍 환경

일반 소개 ChainForge는 대규모 언어 모델(LLM) 단서의 효과를 테스트하고 평가하기 위해 설계된 오픈 소스 시각적 프로그래밍 환경입니다. 사용자가 LLM 응답에 대한 다양한 단서의 품질을 빠르게 탐색하고 분석할 수 있는 데이터 흐름 단서 엔지니어링 환경을 제공합니다.
10개월 전
023.4K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr 컴퓨터: PyAutoGUI 라이브러리를 사용한 데스크톱 조작 인텔리전스 자동화

일반 소개 Clevrr Computer는 PyAutoGUI 라이브러리를 사용하여 시스템 운영을 자동화하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 다음을 사용하여 정확하고 효율적으로 작업을 수행할 수 있는 자동화 에이전트를 설계하기 위해 Anthropic에서 영감을 받았습니다.
10개월 전
023.3K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT 에이전트: 복잡한 표 형식의 데이터를 분석하도록 설계된 지능형 도구

종합 소개 TableGPT 에이전트는 표 형식의 데이터를 처리하고 분석하기 위해 설계된 GitHub 오픈 소스 프로젝트에 기반한 지능형 도구입니다. TableGPT2 빅 언어 모델에 의존하며 자연어 상호 작용을 사용하여 사용자가 쉽게 쿼리하고 조작할 수 있도록 합니다.
8개월 전
023.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision: 멀티모달 추론을 지원하는 오픈 소스 시각적 언어 모델

종합 소개 R1-Onevision은 Fancy-MLLM 팀이 개발한 오픈 소스 멀티모달 매크로 언어 모델로, 시각과 언어의 심층적인 결합에 중점을 두고 이미지와 텍스트 등의 멀티모달 입력을 처리할 수 있으며 시각 추론, 이미지 이해, 수학적 해결 등의 분야에서 수행할 수 있습니다.....
8개월 전
023.3K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

일반 소개 RAGLite는 검색 증강 생성(RAG)을 위한 Python 툴킷으로, PostgreSQL 또는 SQLite 데이터베이스를 지원합니다. 사용자가 다양한 언어 모델과 재주문자를 선택할 수 있는 유연한 구성 옵션을 제공합니다....
11개월 전
023.3K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

마크다운을 포스터로: 온라인 편집 및 원클릭 배포 지원을 통해 마크다운을 소셜 미디어/작은 빨간색 포스터로 변환하세요.

일반 설명 마크다운 투 이미지는 마크다운 텍스트를 시각적으로 매력적인 소셜 미디어 이미지로 렌더링하기 위한 React 컴포넌트입니다. 이 프로젝트에는 온라인 마크다운 투 포스터 에디터로 사용할 수 있는 내장 웹 에디터도 포함되어 있습니다.
11개월 전
023.3K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

라이트 카드: HTML5 카드 생성기 도구, 간단한 도구로 아름다운 콘텐츠 카드 만들기

일반 설명 라이트카드는 사용자가 멋진 콘텐츠 카드를 쉽게 만들 수 있도록 설계된 간단하고 우아한 카드 생성 도구입니다. 이 도구는 사용자 지정 텍스트 콘텐츠, 여러 테마 스타일 및 QR 코드를 지원하여 더 쉽고 재미있게 만들 수 있습니다. 사용자는 제목, 본문, 작성자를 편집할 수 있습니다.
10개월 전
023.3K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: 지능형 기관을 위한 가볍고 유연한 프레임워크로, 역할과 도구를 간단하게 구성하여 여러 작업을 처리할 수 있습니다.

일반 소개 Bambo는 새로운 유형의 프록시 프레임워크로, 주류 프레임워크보다 가볍고 유연하며 다양한 로드 작업을 처리할 수 있으며, 도구 카탈로그의 모든 도구를 정의하고 비동기 사용자 정의 함수를 사용하여 효율적인 프록시 기능을 구현합니다. 사용자는 llm_c...
10개월 전
023.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver: AI를 사용하여 소프트웨어 테스트를 자동화하는 스마트 도구

일반 소개 TestDriver는 인공 지능 기술을 사용하여 개발자가 소프트웨어를 테스트할 수 있도록 도와주는 웹사이트입니다. 마우스를 클릭하거나 텍스트를 입력하는 등 사람의 동작을 시뮬레이션하여 소프트웨어 테스트 작업을 자동화합니다. 이 사이트의 중심에는 실제 사람처럼 작동하는 'AI 에이전트를 사용하는 컴퓨터'가 있습니다....
6개월 전
023.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun: 뉴스에 대한 자동 태그 지정 및 필터링 기능이 있는 RSS 피드

일반 소개 Feeds.Fun은 뉴스에 자동으로 태그를 지정하고 사용자 선호도에 따라 콘텐츠를 필터링하는 등의 핵심 기능을 통해 사용자가 효율적으로 뉴스를 읽을 수 있도록 도와주는 도구입니다. 개발자 알리악세이 얄레츠키(화면명 티엔딜)가 만들었으며 다음에서 호스팅됩니다.
7개월 전
023.3K
Deep Research Web UI:支持多语言深度研究的AI助手

딥 리서치 웹 UI: 다국어 딥 리서치를 지원하는 AI 비서

종합 소개 심층 연구 웹 UI는 사용자가 모든 주제에 대해 심층적인 반복 연구를 수행할 수 있도록 설계된 AI 기술 기반의 오픈 소스 연구 보조 도구입니다. 직관적인 웹 인터페이스를 통해 검색 엔진, 웹 크롤링 및 대규모 언어 모델링의 힘을 결합합니다...
7개월 전
023.2K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: 문서 정리를 위한 지식 관리 시스템으로, 모든 RAG 시스템에 원활하게 통합됩니다.

일반 소개 Simba는 모든 검색 증강 생성(RAG) 시스템과 원활하게 통합되도록 설계된 휴대용 지식 관리 시스템(KMS)입니다. GitHub 사용자 GitHamza0206이 만든 이 프로젝트는 다양한 분야에 효율적인 지식 관리 솔루션을 제공합니다.
8개월 전
023.2K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFA 비디오: 정지 이미지를 비디오로 변환하는 모션 필드 적응 기술

일반 소개 MOFA-Video는 제너레이티브 모션 필드 적응 기술을 활용하여 정적인 이미지를 동적인 동영상으로 변환하는 최첨단 이미지 애니메이션 생성 툴입니다. 이 도구는 도쿄대학교 및 텐센트 AI 연구소와 공동으로 개발되었으며, 2024년 유럽 컴퓨터 비전 컨퍼런스에서 발표될 예정입니다(E...
9개월 전
023.2K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: 단일 이미지에서 멀티 오브젝트 3D 씬을 빠르게 생성하는 오픈 소스 툴입니다.

일반 소개 MIDI-3D는 개발자, 연구원 및 크리에이터를 위해 단일 이미지에서 여러 오브젝트가 포함된 3D 장면을 빠르게 생성하기 위해 VAST-AI-Research 팀에서 개발한 오픈 소스 프로젝트입니다. 이 도구는 다중 인스턴스 확산 모델링 기법을 기반으로 합니다...
7개월 전
023.2K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: 책 속 인물 관계를 분석하고 그래프를 생성하는 AI 도구

일반 소개 Austen은 Angular 프레임워크와 Analogjs 초기화를 사용하는 오픈 소스 AI 도구로, Mermaidjs 기술과 결합하여 사용자가 책 속 인물 관계를 분석하는 데 도움이 되는 차트를 생성합니다. 사용자는 열기...를 입력할 수 있습니다.
6개월 전
023.2K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent: AI 인텔리전스를 빠르게 구축하기 위한 TypeScript 오픈 소스 프레임워크

일반 소개 VoltAgent는 개발자가 AI 인텔리전스를 빠르게 구축하고 조율할 수 있도록 설계된 오픈 소스 TypeScript 프레임워크입니다. 모듈식 도구와 표준화된 개발 모델을 제공하여 대규모 언어 모델(LLM)과의 상호 작용을 간소화하고, 상태...
5개월 전
023.2K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: 노드 오케스트레이션 기반의 AI 모델용 워크플로 시각화 클라이언트

일반 소개 노드툴은 AI 애호가, 개발자, 데이터 과학자, 크리에이터를 위한 간단하고 직관적인 인터페이스를 제공하도록 설계된 혁신적인 AI 저작 플랫폼입니다. 아티스트, 개발자, 초보자 모두 NodeTool을 사용하면 창의적인 프로토타입을 빠르게 제작할 수 있습니다.
10개월 전
023.2K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 고품질 선화 및 스케치 생성, 이미지 단서 단어 역전파, 원클릭 패키지 설치

일반 소개 Sketch-Gen은 아티스트와 디자이너가 고품질의 선화와 스케치를 빠르게 생성할 수 있도록 설계된 AI 기술 기반의 선화 및 스케치 생성 도구입니다. 페인츠-언두 프로젝트에서 파생된 이 도구는 고급 머신 러닝 모델을 사용해 다음을 수행할 수 있습니다.
10개월 전
023.2K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

조각: Anthropic의 클로드 아티팩트, Vercel v0 또는 GPT 엔지니어와 같은 애플리케이션의 오픈 소스 버전입니다.

일반 소개 E2B의 프래그먼트는 AI로만 생성된 애플리케이션을 구축하기 위한 Next.js 기반의 템플릿을 제공하는 오픈 소스 프로젝트입니다. E2B에서 개발한 이 프로젝트는 AI 애플리케이션의 개발 프로세스를 간소화하고 가속화하는 것을 목표로 합니다. 그것은 다양한 현재를 통합합니다 ...
11개월 전
023.2K
LLManager:智能自动化流程审批与人类审核结合的管理工具

LLManager: 지능형 자동 프로세스 승인과 인간 감사를 결합한 관리 도구

일반 소개 LLManager는 랭체인의 랭그래프 프레임워크를 기반으로 개발된 오픈소스 지능형 승인 관리 도구로, 승인 요청 처리를 자동화하는 동시에 사람의 검토와 함께 의사 결정을 최적화하는 데 중점을 둡니다. 시맨틱 검색, 샘플 적은 학습을 통해 이를 수행합니다.
6개월 전
023.2K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档

클라우드 문서 변환기: 플라잉북 문서 다운로드 플러그인, 플라잉북 클라우드 문서를 로컬 마크다운 형식 문서로 변환합니다.

일반 소개 클라우드 문서 변환기는 플라잉북 클라우드 문서를 마크다운 형식으로 변환하기 위해 설계된 Chrome 확장 프로그램입니다. 사용자는 플라잉북 클라우드 문서를 마크다운으로 쉽게 다운로드하거나 복사할 수 있습니다.
11개월 전
023.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: 인물 이미지의 자연광 렌더링(미공개)

일반 설명 SynthLight는 확산 모델에 기반한 인물 사진 재조명 도구입니다. 합성 얼굴 이미지를 다시 렌더링하여 실제 인물 사진에 조명 효과를 조정하는 방법을 학습합니다. 이 도구는 물리적 렌더링 엔진을 사용하여 다양한 조명 조건에서 조명 변환을 시뮬레이션하는 데이터 세트를 생성합니다....
9개월 전
023.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: 기본 Ollama 모델과 상호 작용할 수 있는 깔끔한 채팅 인터페이스

일반 소개 HiOllama는 Python과 Gradio를 기반으로 구축된 사용자 친화적인 인터페이스로, 올라마 모델과 상호 작용하도록 설계되었습니다. 실시간 텍스트 생성 및 모델 관리 기능을 지원하는 간단하고 직관적인 웹 인터페이스를 제공합니다. 사용자는 온도와 같은 매개변수를 조정할 수 있으며 대부분의 ...
11개월 전
023.2K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

Research Rabbit: 기본 LLM을 사용한 웹 조사 및 보고서 작성, 사용자가 지정한 주제로 자동 드릴다운하고 요약을 생성합니다.

일반 소개 리서치 래빗은 네이티브 LLM(대규모 언어 모델) 기반의 웹 리서치 및 요약 도우미입니다. 사용자가 연구 주제를 제공하면 Research Rabbit이 검색 쿼리를 생성하고 관련 웹 결과를 가져와서 이 결과를 요약해줍니다.
7개월 전
023.2K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.

일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.
9개월 전
023.1K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: 게임 채팅 콘텐츠의 실시간 번역을 위한 오픈 소스 클라이언트

일반 소개 DeepRant는 게이머를 위한 오픈 소스 번역 도구로, 국제 서버의 언어 장벽 문제를 해결하기 위해 설계되었습니다. 단축키를 통해 게임 내 텍스트를 즉시 번역할 수 있고, 여러 언어를 지원하여 서로 번역할 수 있으며, 플레이어가 게임을 종료하지 않고도 채팅 메시지를 빠르게 이해하고 답장할 수 있습니다....
7개월 전
023.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: PDF를 HTML로 무손실 변환하여 텍스트 서식을 유지하며 학술 논문 및 잡지 조판에 적합합니다.

포괄적 인 소개 pdf2htmlEX는 PDF 파일의 내용을 분석하고 HTML + CSS를 사용하여 시각 효과를 정확하게 복원하여 PDF 파일을 HTML 형식으로 변환하도록 설계된 오픈 소스 도구로, PDF 문서가 브라우저로 변환됩니다 ...
11개월 전
023.1K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: 사진으로 반신 디지털 인물 동영상을 생성하는 도구

일반 소개 채팅애니원은 HumanAIGC 팀이 개발한 혁신적인 프로젝트입니다. 인공 지능 기술을 사용하여 한 장의 사진과 오디오 입력으로 상체 움직임이 있는 디지털 인물 동영상을 생성합니다. 이 프로젝트는 머리 움직임을 생성하는 계층적 모션 확산 모델을 기반으로 합니다...
7개월 전
023.1K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

랩뱅크: 가사와 백킹 트랙에서 랩(Rap) 보컬을 직접 생성하는 모델(현재 오픈 데이터 세트)

일반 소개 랩뱅크는 랩 가사 생성을 위해 설계된 데이터 세트 및 도구 세트입니다. 이 프로젝트는 연구자와 개발자에게 YouTube에서 랩 노래를 수집하고 처리하여 고품질의 랩 가사 데이터를 제공하기 위해 NZqian에서 만들었습니다....
10개월 전
023.1K