AI 오픈 소스 프로젝트

총 1020개 문서
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: 무음 동영상에 생생한 동기화 사운드 추가하기

일반 소개 FoleyCrafter는 무음 동영상에 생생하고 동기화된 음향 효과를 생성하기 위해 OpenMMLab에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 고급 인공 지능 기술을 사용하여 비디오 콘텐츠를 분석하여 의미적으로 관련성이 높고 시간에 동기화된 음향 효과를 생성합니다....
8개월 전
02.9K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT 에이전트: 복잡한 표 형식의 데이터를 분석하도록 설계된 지능형 도구

종합 소개 TableGPT 에이전트는 표 형식의 데이터를 처리하고 분석하기 위해 설계된 GitHub 오픈 소스 프로젝트에 기반한 지능형 도구입니다. TableGPT2 빅 언어 모델에 의존하며 자연어 상호 작용을 사용하여 사용자가 쉽게 쿼리하고 조작할 수 있도록 합니다.
6개월 전
02.9K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: 텍스트와 이미지에서 SVG 벡터 그래픽 오픈 소스 프로젝트를 생성합니다.

일반 소개 OmniSVG는 멀티모달 모델을 통해 고품질 벡터 그래픽(SVG)을 생성하는 데 중점을 둔 오픈 소스 프로젝트입니다. 사전 학습된 시각 언어 모델을 사용하여 텍스트 설명이나 이미지 입력에서 SVG 생성을 지원하며, 간단한 아이콘부터 복잡한 애니메이션 캐릭터까지 다양한 시나리오를 다룹니다. 항목 ...
4개월 전
02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.
7개월 전
02.9K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

라이트 카드: HTML5 카드 생성기 도구, 간단한 도구로 아름다운 콘텐츠 카드 만들기

일반 설명 라이트카드는 사용자가 멋진 콘텐츠 카드를 쉽게 만들 수 있도록 설계된 간단하고 우아한 카드 생성 도구입니다. 이 도구는 사용자 지정 텍스트 콘텐츠, 여러 테마 스타일 및 QR 코드를 지원하여 더 쉽고 재미있게 만들 수 있습니다. 사용자는 제목, 본문, 작성자를 편집할 수 있습니다.
8개월 전
02.9K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: 명령줄 터미널에서 실행되는 지능형 프로그래밍 도우미, ChatGPT 코드 인터프리터의 현지화된 대안

종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...
8개월 전
02.9K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

비디오챗: 사용자 지정 이미지 및 톤 복제가 가능한 실시간 음성 대화형 디지털 사람, 엔드투엔드 음성 솔루션 및 캐스케이딩 솔루션 지원

일반 소개 비디오챗은 오픈 소스 기술을 기반으로 하는 실시간 음성 상호작용 디지털 사람 프로젝트로, 엔드투엔드 음성 체계(GLM-4-Voice - THG)와 캐스케이드 체계(ASR-LLM-TTS-THG)를 모두 지원합니다. 이 프로젝트를 통해 사용자는 디지털 ...
9개월 전
02.9K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: 오픈 소스 무제한 캔버스 화이트보드 SDK, 미니멀한 와이어프레임과 UML 다이어그램을 생성하는 AI

일반 설명 tldraw는 사용자가 그래픽을 빠르게 그리고, 텍스트를 작성하고, 즉시 협업할 수 있는 무제한 캔버스를 제공하는 무료 즉각적인 협업 그리기 도구입니다. 직관적인 인터페이스와 뛰어난 성능을 갖추고 있어 팀 협업과 원격 작업에 적합합니다. 오픈 소스 커뮤니티를 통해 지원되는 tldr...
9개월 전
02.8K
Gemini Teacher:英语口语发音纠正助手

쌍둥이자리 선생님: 영어 말하기 발음 교정 도우미

일반 소개 제미니 선생님은 구글 제미니 AI를 기반으로 한 영어 말하기 연습 도우미입니다. 사용자의 영어 발음을 실시간으로 인식하고 즉각적인 피드백과 교정 제안을 제공합니다. 이 도구는 사용자가 다음을 통해 영어 말하기 능력을 향상시킬 수 있도록 설계되었습니다.
6개월 전
02.8K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: 지능형 기관을 위한 가볍고 유연한 프레임워크로, 역할과 도구를 간단하게 구성하여 여러 작업을 처리할 수 있습니다.

일반 소개 Bambo는 새로운 유형의 프록시 프레임워크로, 주류 프레임워크보다 가볍고 유연하며 다양한 로드 작업을 처리할 수 있으며, 도구 카탈로그의 모든 도구를 정의하고 비동기 사용자 정의 함수를 사용하여 효율적인 프록시 기능을 구현합니다. 사용자는 llm_c...
8개월 전
02.8K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案

팟캐스트파이: 멀티소스 콘텐츠를 다국어 오디오 대화로 변환하는 도구, NotebookLM의 팟캐스팅 기능을 대체하는 오픈 소스 대안

일반 소개 Podcastfy는 생성 인공 지능(GenAI) 기술을 사용하여 웹 콘텐츠, PDF 파일, 텍스트, 이미지, 유튜브 동영상 및 기타 여러 소스를 매력적인 다국어 소스로 변환하는 오픈 소스 Python 패키지입니다.
10개월 전
02.8K
Baichuan-Audio:支持实时语音交互的端到端音频模型

바이촨 오디오: 실시간 음성 상호작용을 지원하는 엔드투엔드 오디오 모델

포괄적인 소개 Baichuan-Audio는 Baichuan Intelligence(baichuan-inc)에서 개발한 오픈 소스 프로젝트로, 엔드투엔드 음성 상호작용 기술에 중점을 두고 GitHub에서 호스팅됩니다. 이 프로젝트는 음성을 지원하는 완벽한 오디오 처리 프레임워크를 제공합니다.
5개월 전
02.8K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: 문서/멀티미디어에서 비정형 데이터를 추출하여 정형 데이터로 구문 분석합니다.

일반 소개 OmniParse는 모든 비정형 데이터를 GenAI(생성 인공 지능) 프레임워크에 최적화된 정형화된 실행 가능한 데이터로 변환하도록 설계된 강력한 데이터 구문 분석 및 최적화 플랫폼입니다. 문서, 표, 이미지, 동영상, 오디오 파일 등 어떤 종류의 데이터를 작업하든 상관없습니다.
9개월 전
02.8K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: 마이크로서비스 관리를 간소화하고 보안을 강화하는 효율적인 AI 게이트웨이 솔루션 제공

포괄적인 소개 Higress는 효율적인 트래픽 스케줄링, 서비스 거버넌스 및 보안 솔루션을 제공하도록 설계된 Istio 및 Envoy를 기반으로 Alibaba에서 개발한 클라우드 네이티브 API 게이트웨이입니다. AI 비즈니스를 위한 여러 프로그래밍 언어용 Wasm 플러그인 확장을 지원합니다.
9개월 전
02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-프리뷰: 실시간 상호작용을 위한 엔드투엔드 의인화된 음성 대화 매크로 모델

SpeechGPT 2.0-프리뷰는 수백만 시간의 음성 데이터를 기반으로 학습된 OpenMOSS의 첫 번째 의인화 실시간 대화 시스템입니다. 이 시스템은 의인화된 음성 표현과 100ms의 짧은 지연 응답으로 자연스럽고 부드러운 실시간 인터랙션을 지원합니다.
6개월 전
02.8K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: 이미지 및 동영상 생성 품질을 개선하는 오픈 소스 도구

종합 소개 CFG-Zero-star는 웨이첸 팬과 난양공과대학교의 S-Lab 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 안내 전략과 제로 이니셜을 최적화하여 스트림 매칭 모델에서 분류기 무료 안내(CFG) 기술을 개선하는 데 중점을 둡니다.
5개월 전
02.8K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx: 단일 이미지에서 탐색 가능한 360° 3D 월드 생성(코드 점진적 오픈 소스화)

일반 소개 GenEx는 단일 이미지에서 완전히 탐색 가능한 360° 3D 세계를 생성할 수 있는 고급 AI 모델입니다. 사용자는 생성된 세계를 인터랙티브하게 탐색할 수 있으며, GenEx는 상상의 공간에서 비추적 AI의 한계를 뛰어넘어 다음과 같은 잠재력을 가지고 있습니다.
8개월 전
02.8K
Kilo Code:具有简洁使用体验的Roo Code分支

킬로 코드: 깔끔한 사용자 경험을 제공하는 루 코드 브랜치

일반 소개 킬로 코드는 비주얼 스튜디오 코드(줄여서 VS 코드)를 위한 오픈 소스 확장 플러그인입니다. 인공 지능 기술을 사용하여 사용자가 보다 효율적으로 코드를 작성할 수 있도록 도와줍니다. 이 프로젝트는 Kilo-Org 팀에 의해 개발되었으며, 대부분 ...
5개월 전
02.8K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.
7개월 전
02.8K
Pyramid Flow:快手推出的开源版

Pyramid Flow: Racer에서 출시한 오픈 소스 버전의 "Kringle", SD3 기반이며 8GB 미만의 GPU에서 실행되는 버전(원클릭 배포 버전).

종합 소개 피라미드 플로우는 플로우 매칭 기법을 기반으로 하는 효율적인 자동 회귀 동영상 생성 방법입니다. 이 방법은 다양한 해상도와 노이즈 레벨 사이에서 보간하여 비디오 콘텐츠를 생성하고 압축 해제할 때 더 높은 계산 효율성을 달성합니다...
9개월 전
02.8K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: 멀티모달 AI 모델을 쉽게 배포할 수 있는 오픈 소스 도구

일반 소개 Aana SDK는 말라얄람어 ആന(코끼리)의 이름을 딴 Mobius Labs에서 개발한 오픈 소스 프레임워크입니다. 개발자가 텍스트, 이미지, 오디오 및 비디오, 기타 데이터의 처리를 지원하여 멀티모달 AI 모델을 신속하게 배포하고 관리할 수 있도록 도와줍니다.
5개월 전
02.8K
OmAgent:构建多模态智能设备的智能体框架

OmAgent: 멀티모달 스마트 디바이스 구축을 위한 인텔리전트 바디 프레임워크

종합 소개 OmAgent는 Om AI Lab에서 개발한 멀티모달 지능형 바디 프레임워크로, 스마트 디바이스를 위한 강력한 AI 기반 기능을 제공하는 것을 목표로 합니다. 이 프로젝트는 최첨단 멀티모달 기본 모델과 지능형 바디 알고리즘을 통합하여 개발자가 다양한 스마트 디바이스에서 효율적인 스마트 디바이스를 만들 수 있도록 지원합니다.
7개월 전
02.8K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: 자연어로 데이터 쿼리 및 차트 생성을 위한 데이터 분석 대화 플랫폼

일반 소개 PandasAI는 자연어 처리 기술을 통해 데이터 분석 프로세스를 간소화하도록 설계된 Python 기반 오픈 소스 플랫폼입니다. 사용자가 데이터베이스(예: SQL, CSV, 판다, 폴라, 몽고DB, ...)와의 대화를 통해 작업할 수 있도록 지원합니다.
9개월 전
02.8K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.

일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.
7개월 전
02.8K
MoneyPrinterTurbo:输入视频主题一键生成视频文案和高清短视频

머니프린터터터보: 동영상 테마를 입력하여 한 번의 클릭으로 동영상 사본과 짧은 HD 동영상을 생성합니다.

종합 소개 머니프린터터터보는 고급 AI 빅 모델 기술을 사용하여 한 번의 클릭으로 짧은 HD 동영상을 생성하는 기능을 달성하는 오픈 소스 프로젝트입니다. 사용자는 비디오 테마 또는 키워드만 제공하면 시스템이 자동으로 비디오 카피, 비디오 클립, 비디오 자막 등을 생성합니다.
5개월 전
02.8K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: 동영상 저작권을 보호하는 고급 오픈 소스 동영상 히든 워터마크 삽입 및 추출 도구

일반 소개 VideoSeal은 Facebook Research에서 개발한 오픈 소스 동영상 워터마킹 도구로, 효율적인 동영상 워터마크 삽입 및 추출을 제공하기 위해 설계되었습니다. 이 도구는 최신 오픈 소스 모델을 지원하며 사전 학습된 모델, 학습 코드, 추론 코드 및 평가 도구가 포함되어 있습니다.
8개월 전
02.8K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: 사용자가 쿼리 데이터를 위해 SQLite 데이터베이스 및 CSV/JSON 파일을 쿼리할 수 있습니다.

일반 소개 SQLite-Utils-Ask는 사용자가 LLM(대규모 언어 모델)을 사용하여 SQLite 데이터베이스 및 CSV/JSON 파일에 대한 질문과 답변 데이터 쿼리를 수행할 수 있도록 설계된 강력한 도구입니다. 이 도구는 다음을 기반으로 사용자 질문을 자동으로 생성할 수 있습니다.
9개월 전
02.8K
Data Formulator:AI驱动的数据可视化工具

데이터 포뮬레이터: AI 기반 데이터 시각화 도구

일반 소개 데이터 포뮬레이터는 Microsoft Research에서 개발한 오픈 소스 AI 기반 데이터 시각화 도구입니다. 이 도구는 그래픽 사용자 인터페이스(GUI)와 자연어 입력(NL)을 결합하여 사용자가 간단한 상호 작용과 명령을 통해 빠르게 만들고 반복할 수 있게 해 줍니다.
6개월 전
02.8K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

소셜 미디어 에이전트: 소셜 미디어 콘텐츠를 자동으로 생성하고 관리하는 소셜 미디어용 지능형 어시스턴트

일반 소개 소셜 미디어 에이전트는 사용자가 소셜 미디어 콘텐츠의 생성 및 관리를 자동화할 수 있도록 설계된 새로운 에이전트 인박스로 상호 작용 정보를 관리하는 오픈 소스 프로젝트입니다. 이 프로젝트는 LangChain 팀에 의해 개발되었습니다...
7개월 전
02.8K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

JoyGen: 오디오 기반 3D 깊이 인식 인물 토킹 비디오 편집 도구

종합 소개 JoyGen은 말하는 얼굴을 위한 혁신적인 2단계 비디오 생성 프레임워크로, 오디오 기반 표정 생성 문제를 해결하는 데 중점을 두고 있습니다. 징동 테크놀로지 팀이 개발한 이 프레임워크는 고급 3D 재구성 기술과 오디오 특징 추출 방법을 사용하여 화자의 신원 특성과 표정을 정확하게 포착합니다.
7개월 전
02.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: 다른 웹사이트에 통합할 수 있는 대화형 GraphRAG 기반 대화형 지식창고/심층 웹 검색 도구

일반 소개 AutoFlow는 TiDB 서버리스 벡터 스토리지로 그래프 기반 지식 베이스를 구축하기 위해 PingCAP에서 개발한 오픈 소스 도구입니다. 복잡한 대화 검색과 지식 그래프를 지원하기 위해 LlamaIndex와 DSPy 프레임워크를 통합합니다.
7개월 전
02.8K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: 멀티 모델 관리와 지능형 데이터 처리를 통합하는 AI 네이티브 데이터 애플리케이션 개발 프레임워크 구축

종합 소개 DB-GPT는 AWEL(에이전트 워크플로우 표현 언어)과 스마트 바디 기술을 사용하여 구축된 오픈소스 AI 네이티브 데이터 애플리케이션 개발 프레임워크입니다. 이 프로젝트는 대규모 모델 분야의 인프라 구축을 목표로 합니다.
5개월 전
02.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: 위즈덤 스펙트럼의 오픈 소스 캐스케이드 확산 텍스트 생성 이미지 모델

종합 소개 CogView3는 칭화대학교와 싱크탱크 팀(Chi Spectrum Qingyan)이 개발한 고급 텍스트 생성 이미지 시스템입니다. 계단식 확산 모델을 기반으로 하며 여러 단계를 거쳐 고해상도 이미지를 생성하며, 다단계 생성, 혁신적인 아키텍처 및 효율적인 성능을 포함한 CogView3의 주요 기능은 다음과 같습니다.
10개월 전
02.8K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: 복잡한 사회 현상을 연구하기 위해 수백만 사용자의 소셜 미디어 상호 작용을 다중 지능으로 시뮬레이션합니다.

일반 소개 OASIS(오픈 에이전트 소셜 상호작용 시뮬레이션)는 최대 100만 명의 사용자의 행동을 시뮬레이션할 수 있는 오픈 소스 소셜 미디어 시뮬레이터입니다. 이 플랫폼은 대규모 언어 모델과 규칙 기반...
5개월 전
02.8K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 입력 텍스트에서 화자별 텍스트 음성 변환 모델 생성

일반 소개 Parler-TTS는 고품질의 자연스러운 음성을 생성하도록 설계된 Hugging Face에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델 라이브러리입니다. 이 모델은 특정 화자 스타일(예: 성별, 음조, 말하기 스타일 등)을 가진 입력 텍스트를 기반으로 음성을 생성할 수 있습니다.
6개월 전
02.8K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: 미시의 사진을 춤추게 만드는 스틸 인물 레퍼런스 비디오 포즈 생성 비디오

일반 소개 X-Dyna는 제로 샘플 확산 기법을 사용하여 역동적인 인물 애니메이션을 생성하기 위해 ByteDance에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 드라이브 비디오의 얼굴 표정과 신체 움직임을 사용하여 개별 인물 이미지에 애니메이션을 적용하여 사실적이고 상황에 맞는 모션 효과를 생성합니다.X-D...
7개월 전
02.8K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank: AI 기반 일일 예산 관리로 일일 예산을 쉽게 추적할 수 있습니다.

일반 설명 Porkybank는 사용자가 일일 예산을 쉽게 추적할 수 있도록 설계된 오픈 소스 개인 재무 관리 애플리케이션입니다. (수입 - 지출) / 일수 = 현금이라는 간단한 공식으로 사용자는 자신의 재정 상황을 시각화할 수 있습니다. 이 프로젝트는 깃허브에서 호스팅됩니다...
7개월 전
02.8K
GaiaNet node:安装和运行自己的本地模型在线代理服务

GaiaNet 노드: 자체 로컬 모델 온라인 프록시 서비스 설치 및 실행

일반 소개 GaiaNet-AI/gaianet-node는 사용자가 단일 명령으로 Mac, Linux 또는 Windows WSL에 기본 노드 소프트웨어 스택을 빠르게 설치할 수 있는 오픈 소스 프로젝트입니다. 사용자는 노드를 초기화하고, 구성을 사용자 지정하고, 다운로드할 수 있습니다.
11개월 전
02.8K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

에이전트 실험실: 연구자를 위한 자동화된 코드 및 연구 작성 도우미

종합 소개 에이전트 실험실은 연구자가 연구 아이디어를 실현할 수 있도록 설계된 엔드투엔드 자율 연구 워크플로우입니다. 이 시스템은 문헌 검토 및 계획 개발부터 실행까지 전체 연구 워크플로우를 지원하는 대규모 언어 모델에 기반한 전용 에이전트로 구성되어 있습니다.
4개월 전
02.8K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDF를 오픈 소스 도구의 팟캐스트로 변환하기

일반 소개 Open NotebookLM은 모든 PDF 문서를 팟캐스트로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 오픈 소스 LLM(대규모 언어 모델) 및 TTS(텍스트 음성 변환) 모델을 사용하여 PDF 콘텐츠를 처리하여 오디오 팟캐스트에 적합한 자연스러운 대화를 생성합니다....
6개월 전
02.8K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

잘못된 JSON 문자열을 수정하고 LLM에서 생성된 JSON 데이터에서 발생할 수 있는 서식 지정 오류를 해결합니다.

일반 설명 잘못된 JSON 파일을 수정하는 모듈로, 특히 LLM(대규모 언어 모델)에서 출력되는 잘못된 JSON 데이터를 구문 분석하기 위한 모듈입니다. 이 모듈은 따옴표 누락, 잘못된 쉼표, 이스케이프되지 않은 문자 및 불완전한 키-값과 같은 일반적인 JSON 구문 오류를 수정합니다.
10개월 전
02.8K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: 음성 대화 기본 모델을 위한 여러 언어와 악센트를 지원하는 실시간 음성 대화 프레임워크

일반 소개 모시 챗은 프랑스의 비영리 AI 연구소인 큐타이의 엔드투엔드 실시간 AI 음성 비서입니다. 실시간으로 들을 뿐만 아니라 자연스러운 대화에 참여하고 보고, 듣고, 말하는 기능을 포함한 다중 모드 상호 작용을 지원합니다.모시 챗 ...
11개월 전
02.8K
NodeRAG:基于异构图的精准信息检索与生成工具

NodeRAG: 정확한 정보 검색 및 생성을 위한 이기종 그래프 기반 도구

포괄적인 소개 NodeRAG는 GitHub에서 호스팅되고 Terry-Xu-666이 개발한 오픈 소스 검색 증강 생성(RAG) 시스템입니다. 이기종 그래프 구조를 통해 정보 검색 및 생성을 최적화하여 검색 정확도와 문맥 관련성을 크게 개선합니다.고개 끄덕임...
4개월 전
02.8K
Deep Research Web UI:支持多语言深度研究的AI助手

딥 리서치 웹 UI: 다국어 딥 리서치를 지원하는 AI 비서

종합 소개 심층 연구 웹 UI는 사용자가 모든 주제에 대해 심층적인 반복 연구를 수행할 수 있도록 설계된 AI 기술 기반의 오픈 소스 연구 보조 도구입니다. 직관적인 웹 인터페이스를 통해 검색 엔진, 웹 크롤링 및 대규모 언어 모델링의 힘을 결합합니다...
4개월 전
02.8K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilot 백엔드 프록시 서비스: 다른 모델로 GitHub Copilot 플러그인 서버 인수하기

일반 소개 Copilot 백엔드 에이전트 서비스는 여러 사람이 공식 계정을 공유하는 것을 지원하면서 DeepSeek와 같은 다른 FIM 모델을 활용하여 GitHub Copilot 플러그인 서버를 관리하도록 설계된 오픈 소스 프로젝트입니다. 이 서비스는 V를 포함한 다양한 IDE를 지원합니다.
8개월 전
02.8K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

Report mAIstro: 비즈니스 분석, 연말 보고 등 모든 사용자 지정 주제에 대한 상세 보고서를 생성합니다.

일반 설명 보고서 mAIstro는 자연어 처리 기술을 통해 사용자가 사용자 정의 보고서를 쉽게 만들 수 있도록 설계된 강력한 도구입니다. 이 도구는 랭체인 기술을 활용하여 사용자가 제공한 주제와 구조를 세부적인 보고서로 변환합니다.
4개월 전
02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: 나만의 퍼플렉서티 검색 엔진을 배포할 수 있는 오픈 소스 AI 검색 엔진 프레임워크!

종합 소개 MindSearch는 상하이 인공 지능 연구소(SAL)에서 출시한 오픈 소스 AI 검색 엔진 프레임워크로, 복잡한 정보 수집 및 통합을 위한 인간의 사고 과정을 시뮬레이션하는 것을 목표로 합니다. 이 도구는 다중 지능을 통해 대규모 언어 모델링(LLM)과 검색 엔진의 고급 기술을 결합합니다....
8개월 전
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

지식 테이블: 구조화된 데이터의 효율적인 추출과 탐색을 위한 오픈 소스 도구

종합 소개 지식 테이블(Knowledge Table)은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 추출 사용자 지정을 지원합니다 ...
10개월 전
02.8K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: MCP 인텔리전스를 사용하여 복잡한 작업을 수행하는 AI 대화 클라이언트

일반 소개 HyperChat은 BigSweetPotatoStudio에서 개발하고 GitHub에서 호스팅하는 오픈 소스 채팅 클라이언트로, OpenAI, Cla... 등 여러 대형 언어 모델(LLM)의 API를 통합하여 BigSweetPotatoStudio 언어 모델에 대한 포괄적인 개요를 제공하도록 설계되었습니다.
5개월 전
02.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: 로컬에서 실행되는 지식 그래프 및 개인용 검색 엔진 구축하기

일반 소개 Unigraph는 사용자에게 개인 생활의 다양한 데이터를 관리하고 검색할 수 있는 통합 작업 공간을 제공하도록 설계된 국내 최초의 범용 지식 그래프 및 개인용 검색 엔진입니다. Unigraph를 통해 사용자는 다양한 소스의 데이터를 통합하여 ...
7개월 전
02.8K
Vector Vein(向量脉络):无代码AI工作流构建平台

벡터 베인: 코드 없는 AI 워크플로 구축 플랫폼

포괄적인 소개 벡터 베인은 사용자가 지능적이고 자동화된 워크플로우를 쉽게 만들 수 있도록 설계된 코드 없는 AI 워크플로우 구축 플랫폼입니다. 프로그래밍 기반이 필요하지 않으므로 사용자는 드래그 앤 드롭 작업을 통해 다양한 기능 모듈을 간단히 연결하여 복잡한 AI 작업을 구축할 수 있습니다.
8개월 전
02.8K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

미니 LLM 흐름: 100줄의 코드로 '지시형 그래프 구조'로 LLM 미니 인텔리전트 구축하기

일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.
7개월 전
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: 초안 이메일(Gmail) 응답의 신속한 생성을 위한 현지화된 AI 이메일 자동화 시스템

일반 소개 LAMBDA(로컬 자동 받은 편지함 초안 작성 도우미)는 사용자의 이메일 스타일을 학습하여 Gmail 받은 편지함의 읽지 않은 모든 이메일에 대해 초안을 생성하도록 설계된 현지화된 AI 이메일 자동화 시스템입니다....
8개월 전
02.8K
Flock:低代码工作流编排快速构建聊天机器人

Flock: 신속한 챗봇 구축을 위한 로우코드 워크플로 오케스트레이션

일반 소개 플록은 워크플로우를 위한 오픈 소스 로우코드 플랫폼으로, GitHub에서 호스팅되고 Onelevenvy 팀이 개발했습니다. LangChain과 LangGraph 기술을 기반으로 하며, 사용자가 채팅 머신을 빠르게 구축할 수 있도록 돕는 데 중점을 두고 있습니다.
6개월 전
02.7K
Gemini Playground:无服务器部署Gemini多模态对话网站

쌍둥이자리 놀이터: 쌍둥이자리 멀티모달 대화 사이트의 서버리스 배포

일반 소개 제미니 플레이그라운드는 사용자가 멀티모달 대화 사이트를 빠르게 배포할 수 있도록 설계된 오픈소스 프로젝트입니다. 이 프로젝트는 기술 크롤링 새우에 의해 개발되었으며 10 초 만에 Gemini API 키 사용을 지원하여 배포를 완료합니다. 사용자가 ...
6개월 전
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: 문서를 구조화된 데이터로 추출하고 분류하여 문서 처리 프로세스를 최적화합니다.

포괄적인 소개 ExtractThinker는 LLM(대규모 언어 모델)을 사용하여 문서에서 구조화된 데이터를 추출하고 분류하는 유연한 문서 인텔리전스 도구로, 원활한 ORM과 같은 문서 처리 워크플로우를 제공합니다. Tess를 비롯한 다양한 문서 로더를 지원합니다.
7개월 전
02.7K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

위챗 비디오 번호 다운로더: 위챗 비디오 번호 비디오를 빠르게 다운로드하고, 여러 형식과 플랫폼을 지원합니다.

종합 소개 WeChat 비디오 번호 다운로더는 사용자가 WeChat 비디오 번호에서 비디오 콘텐츠를 빠르게 다운로드할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 다양한 동영상 형식과 플랫폼을 지원하며, 사용자는 Windows 및 macOS 시스템에서 쉽게 사용할 수 있습니다. 이 프로젝트는 ltaoo에 의해 개발되었으며 다음에서 호스팅됩니다.
7개월 전
02.7K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 오디오 및 비디오 콘텐츠를 빠르게 추출하고 구조화된 노트를 생성하세요.

종합 소개 AudioNotes는 FunASR과 Qwen2를 기반으로 구축된 오디오/비디오-구조화된 노트 시스템입니다. 오디오/비디오 콘텐츠를 빠르게 추출하고 빅 모델을 호출하여 구조화된 마크다운 노트를 생성할 수 있어 다음과 같은 경우에 편리합니다.
6개월 전
02.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

랩뱅크: 가사와 백킹 트랙에서 랩(Rap) 보컬을 직접 생성하는 모델(현재 오픈 데이터 세트)

일반 소개 랩뱅크는 랩 가사 생성을 위해 설계된 데이터 세트 및 도구 세트입니다. 이 프로젝트는 연구자와 개발자에게 YouTube에서 랩 노래를 수집하고 처리하여 고품질의 랩 가사 데이터를 제공하기 위해 NZqian에서 만들었습니다....
8개월 전
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: 대규모 언어 모델 힌트의 효과를 테스트하고 평가하기 위한 오픈 소스 시각적 프로그래밍 환경

일반 소개 ChainForge는 대규모 언어 모델(LLM) 단서의 효과를 테스트하고 평가하기 위해 설계된 오픈 소스 시각적 프로그래밍 환경입니다. 사용자가 LLM 응답에 대한 다양한 단서의 품질을 빠르게 탐색하고 분석할 수 있는 데이터 흐름 단서 엔지니어링 환경을 제공합니다.
8개월 전
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: 시각적 임베딩 기반 문서 저장 및 검색 서비스

콜비바라는 시각적 임베딩 기술을 기반으로 한 문서 저장 및 검색 서비스입니다. 광학 문자 인식(OCR)이나 텍스트 추출이 필요 없고, 양식이 깨지거나 이미지가 손실되는 문제를 방지하며, PDF를 포함한 100개 이상의 파일 형식을 지원합니다....
6개월 전
02.7K
Atomic Agents:构建轻量级模块化AI智能体框架

원자 에이전트: 경량 모듈식 AI 인텔리전스를 구축하기 위한 프레임워크

일반 소개 원자 에이전트는 에이전트 AI 파이프라인 및 애플리케이션 구축을 위해 원자 개념을 중심으로 설계된 매우 가벼운 모듈식 프레임워크입니다. 이 프레임워크는 강력한 애플리케이션을 만들기 위해 결합할 수 있는 일련의 도구와 에이전트를 제공합니다. 이 프레임워크는 Instruc ...
8개월 전
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

롱라이터: 위즈덤 스펙트럼은 매우 긴 텍스트를 생성하는 강력한 모델을 출시하여 단일 대화에서 10,000개 이상의 단어를 생성할 수 있도록 지원합니다.

종합 소개 LongWriter는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 강력한 긴 텍스트 생성 도구입니다. 이 도구는 고급 장문 언어 모델(LLM)을 기반으로 하며 10,000단어 이상의 긴 텍스트를 생성할 수 있습니다.LongWriter...
8개월 전
02.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: 책 속 인물 관계를 분석하고 그래프를 생성하는 AI 도구

일반 소개 Austen은 Angular 프레임워크와 Analogjs 초기화를 사용하는 오픈 소스 AI 도구로, Mermaidjs 기술과 결합하여 사용자가 책 속 인물 관계를 분석하는 데 도움이 되는 차트를 생성합니다. 사용자는 열기...를 입력할 수 있습니다.
4개월 전
02.7K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: HTML URL에서 본문 데이터 추출, 일반 텍스트/마크다운 출력

일반 소개 magic-html은 HTML에서 본문 영역 콘텐츠를 추출하는 프로세스를 간소화하도록 설계된 Python 라이브러리입니다. 복잡한 HTML 구조를 다루든 간단한 웹 페이지를 다루든 이 라이브러리는 사용자에게 편리하고 효율적인 인터페이스를 제공하는 것을 목표로 합니다. 멀티모달 추출을 지원합니다...
11개월 전
02.7K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS 생성기: AI를 통해 웹 콘텐츠를 RSS 피드로 변환하는 도구

일반 소개 AI RSS는 AI 기술을 통해 웹 콘텐츠를 RSS 피드로 변환하는 혁신적인 도구입니다. 브라우저 플러그인과 서버 측의 두 가지 주요 부분으로 구성됩니다. 브라우저 플러그인을 통해 사용자는 웹 페이지에서 목록을 선택하고 구조화된 데이터 설명(SDD) 파일을 생성할 수 있습니다.
7개월 전
02.7K