최신 AI 리소스

共 3103 篇文章
文心快码(Baidu Comate):你的AI编程助手,结合百度编程大数据,为你生成优质编程代码。

웬신 퀵 코드(Baidu Comate): AI 프로그래밍 도우미로, Baidu 프로그래밍 빅데이터와 결합하여 양질의 프로그래밍 코드를 생성합니다.

종합 소개 Baidu Comate는 Baidu에서 개발한 고급 AI 프로그래밍 도우미로, Baidu의 ERNIE 빅 모델을 기반으로 독점 데이터와 오픈 소스 데이터를 통합하여 차세대 프로그래밍 지원을 제공합니다. 코드 완성, 해석 및 디버깅 기능을 통해 개발자가 생각하고, 작성하고, 최적화하는 데 도움을 줍니다.
1 년 전
099K
freebeat.ai:一键将音乐转为舞蹈视频和音乐视频

freebeat.ai: 클릭 한 번으로 음악을 댄스 비디오와 뮤직비디오로 바꿔보세요!

일반 소개 freebeat.ai는 클릭 한 번으로 음악을 댄스 비디오, 뮤직 비디오 또는 가사 비디오로 변환하는 데 중점을 둔 무료 AI 도구 웹사이트입니다. 사용자는 Spotify, YouTube 및 기타 플랫폼에서 음악 링크를 업로드할 수 있으며, AI가 자동으로 비트를 생성합니다.
1 년 전
098.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: 멀티모달 콘텐츠 구문 분석 및 지식 그래프와 하이브리드 검색의 결합을 위한 고급 AI 검색(RAG) 시스템

종합 소개 R2R(RAG to Riches)은 프로덕션에 바로 사용할 수 있는 기능을 갖춘 검색 증강 생성(RAG) 기능을 지원하는 고급 AI 검색 시스템입니다. 컨테이너화된 RESTful API를 기반으로 구축된 이 시스템은 멀티모달 콘텐츠 구문 분석, 하이브리드 검색 기능 등을 제공합니다.
2 년 전
098.9K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: 새로운 대화형 경험을 위해 빅 언어 모델과 시각 모델을 결합한 디지털 사용자를 위한 지능형 대화 시스템

일반 소개 린리토커는 대규모 언어 모델(LLM)과 시각 모델을 결합하여 인간과 컴퓨터의 상호작용에 대한 새로운 접근 방식을 만들어내는 혁신적인 디지털 인간 대화 시스템입니다. 이 시스템은 위스퍼, 린리, 마이크로와 같은 다양한 기술을 통합합니다.
1 년 전
098.8K
Blooper:智能生成脚本与分镜画面的创作工具

Blooper: 스크립트 및 분할 화면을 지능적으로 생성하는 저작 도구

일반 소개 Blooper는 사용자가 동영상 스크립트와 분할 화면을 생성하는 데 중점을 둔 AI 기반 저작 플랫폼입니다. 스위스 추크주 바르에 본사를 둔 Blooper AI가 개발했으며 광고, 영화 및 TV 산업의 사전 제작을 지원하도록 설계되었습니다. 그물...
1 년 전
098.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: 메모리, 지식 및 도구로 멀티모달 인텔리전스를 구축하기 위한 프레임워크

일반 소개 Agno는 개발자가 메모리, 지식 및 도구를 사용하여 AI 인텔리전스를 쉽게 구축할 수 있도록 지원하기 위해 agno-agi 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 Python 라이브러리입니다. 멀티모달 텍스트, 이미지, 오디오, 비디오를 지원합니다.
1 년 전
098.6K
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具

GizAI: 올인원 AI 비서, 주류 생성 AI 도구를 통합하고 모든 사람이 무료로 사용할 수 있는 상용 AI 도구 제공

일반 소개 GizAI는 AI 생성, 노트 필기, 클라우드 저장 기능이 통합된 원스톱 플랫폼입니다. 사용자는 GizAI로 이미지, 비디오, 오디오, 텍스트, 캐릭터, 스토리, 게임을 생성하고 플랫폼에서 협업 메모와 클라우드 스토리지를 만들 수 있습니다.GizAI는 멀티 ...
1 년 전
098.6K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台

BISHENG: 엔터프라이즈 AI 애플리케이션 구축을 위한 오픈 소스 LLM DevOps 플랫폼

종합 소개 BISHENG은 차세대 엔터프라이즈 AI 애플리케이션을 위해 설계된 오픈 소스 LLM(대규모 언어 모델) DevOps 플랫폼입니다. 이 플랫폼은 생성형 AI 워크플로, RAG(검색 증강 생성), 지능형 에이전트, 통합 모델 관리 등 강력하고 포괄적인 기능을 제공합니다....
2 년 전
098.3K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: ChatGPT 인터페이스 상호작용 모방 AI 대화 오픈 소스 프로젝트

일반 소개 LibreChat은 다양한 사용자 지정 옵션과 여러 AI 제공업체, 서비스 및 통합을 지원하는 무료 오픈 소스 AI 채팅 플랫폼입니다. 친숙한 인터페이스와 혁신적인 기능으로 모든 AI 대화를 한곳에 모아 여러 AI 모델, 플러그인 및 여러 언어를 지원합니다. 작성자...
2 년 전
098.2K
AiPPT:全智能AI一键生成PPT|在线PPT制作|智能PPT工具(付费)

AiPPT: 풀 인텔리전스 AI 원클릭 PPT 생성 | 온라인 PPT 메이커 | 지능형 PPT 도구 (유료)

포괄적 인 소개 AiPPT는 인공 지능 기술을 기반으로 한 온라인 PPT 생성 도구입니다. 사용자는 콘텐츠 테마를 입력하기 만하면 AI가 자동으로 고품질 PPT 문서를 생성 할 수 있습니다.AiPPT는 풍부한 템플릿 리소스를 제공하고 가져올 다양한 문서 형식을 지원하며 필요에 따라 전문가를 신속하게 생성 할 수 있습니다....
1 년 전
098K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
1 년 전
098K
MemeGen AI:智能搞笑图片生成器,将照片转化为动态表情包,轻松创建搞笑图片

MemeGen AI : 지능형 재미있는 사진 생성기, 사진을 동적 이모티콘으로 바꾸고 재미있는 사진을 쉽게 만들 수 있습니다!

일반 소개 MemeGen AI는 사용자가 간단한 조작으로 다양한 재미있는 그림을 만들 수 있는 인공지능 기반의 재미있는 그림 생성기입니다. 이 사이트는 고급 GPT-4 비전 모델을 사용하여 사용자가 기술적 인 지식이 없어도 재미있는 그림과 텍스트를 자동으로 생성합니다.
2 년 전
097.9K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 장기기억을 기반으로 하는 멀티홉 지식 검색 프레임워크

일반 소개 HippoRAG는 인간의 장기기억 메커니즘에서 영감을 받아 오하이오 주립대학의 OSU-NLP 그룹에서 개발한 오픈 소스 프레임워크입니다. 검색 증강 생성(RAG), 지식 그래프, 개인화된 페이지랭크 기술을 결합하여 대규모 언어 모델에 도움이 되는...
1 년 전
097.8K
E2B:安全云沙箱中的AI代码运行平台

E2B: 안전한 클라우드 샌드박스에서 AI 코드를 실행하는 플랫폼

일반 소개 E2B는 안전한 클라우드 샌드박스에서 AI 생성 코드를 실행하도록 설계된 오픈 소스 플랫폼입니다. 다양한 프로그래밍 언어와 프레임워크를 지원하고 격리된 가상 환경을 제공하여 코드 실행의 보안과 안정성을 보장하며, E2B는 데이터 파티셔닝을 비롯한 다양한 AI 애플리케이션 시나리오에 적합합니다.
1 년 전
097.7K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...
1 년 전
097.7K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.
1 년 전
097.6K
番茄创作工具:将授权小说和短剧文稿转视频,生成短视频用于推广引流

토마토 저작 도구: 라이선스 소설과 단편 연극 대본을 동영상으로 변환하고, 홍보 및 트래픽 생성을 위한 짧은 동영상을 생성합니다.

종합 소개 토마토달링센터의 카피 투 비디오 제작 도구는 콘텐츠 제작자가 서면 카피를 비디오로 빠르게 변환할 수 있도록 설계된 강력한 AIGC(인공 지능 생성 콘텐츠) 도구입니다. 이 도구는 의미 분석, 일러스트레이션 생성 및 비디오 내보내기 등의 기능을 통해 카피에서 비디오로 제작을 간소화합니다...
2 년 전
097.6K
蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)

시카다 미러: 수백 개의 디지털 휴먼 템플릿과 독점 디지털 휴먼 이미지 복제가 가능한 디지털 휴먼 동영상 제작 플랫폼(유료)

일반 소개 Cicada는 디지털 휴먼 동영상 제작에 중점을 둔 플랫폼으로, AI 기술을 사용하여 동영상 제작 과정을 간소화합니다. 사용자는 다양한 디지털 휴먼 이미지를 선택하고, 카피를 입력하고, 다국어 더빙이 포함된 동영상을 생성할 수 있습니다. 이 플랫폼은 광고 및 마케팅, 교육 및 훈련과 같은 다양한 분야에 적합한 풍부한 템플릿 및 자료 라이브러리를 제공합니다....
2 년 전
097.4K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.
2 년 전
097.4K
Smart Composer:引用本地笔记智能写作和语义搜索的Obsidian插件

스마트 작곡가: 로컬 노트를 참조하기 위한 스마트 글쓰기 및 시맨틱 검색을 위한 옵시디언 플러그인

일반 소개 스마트 작곡기는 흑요석 노트 필기 소프트웨어용으로 설계된 스마트 글쓰기 보조 플러그인입니다. 이 플러그는 인공 지능 기술을 사용해 상황 인식 채팅 도우미, 스마트 글쓰기 지원, 원클릭 편집 기능을 제공합니다. 이 플러그인은 사용자에 따라 메모를 작성할 수 있습니다.
2 년 전
097.3K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
1 년 전
097.2K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

종합 소개 PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하며 데이터 주석 및 합성 도구를 제공하여 현업에서 사용할 수 있도록 지원합니다.
2 년 전
097K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
1 년 전
096.6K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: 동적 지식 그래프 구성 및 쿼리 도구(시간 인식 장기 기억 프로그램)

일반 소개 Graphiti는 동적인 시간 인식 지식 그래프를 구축하고 쿼리하기 위해 getzep에서 개발한 도구입니다. 시간, 전체 텍스트, 의미 및 그래프 알고리즘과 같은 다양한 방법을 통해 개체 간의 복잡하고 진화하는 관계를 표현하고 쿼리할 수 있습니다.그래프...
1 년 전
096.5K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
1 년 전
096.4K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: 오디오와 비디오를 텍스트로 빠르게 변환하는 온라인 도구

일반 설명 TurboScribe는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 98개 이상의 언어를 지원하며 정확도가 99.8%에 달해 음성 콘텐츠를 효율적으로 처리해야 하는 사용자에게 적합합니다. 사용자는 파일을 업로드하고, 텍스트 노트를 생성하고...
1 년 전
096.2K
SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像

SkyReels: 자연스러운 움직임으로 파노라마 인물 사진을 생성하는 데 특화된 AI 동영상 촌극 제작 플랫폼입니다.

일반 소개 스카이릴스는 AI 동영상 제작에 중점을 둔 온라인 플랫폼으로, 사용자가 텍스트 스크립트나 창의적인 아이디어를 고품질의 짧은 동영상으로 빠르게 전환할 수 있도록 설계되었습니다. 콘텐츠 제작자, 마케터, 일반 사용자 모두 텍스트를 입력하기만 하면 플랫폼에서 자동으로 동영상을 생성해 줍니다.
1 년 전
096.2K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n 자체 호스팅 AI 스타터 키트: 로컬 AI 환경을 빠르게 구축하기 위한 오픈 소스 템플릿

포괄적인 소개 n8n 셀프 호스팅 AI 스타터 키트는 포괄적인 로컬 AI 및 로우코드 개발 환경을 빠르게 초기화하도록 설계된 오픈 소스 Docker Compose 템플릿입니다. n8n 팀에서 제작한 이 제품군은 자체 호스팅 n8n 플랫폼과 다양한 호환 가능한 AI를 결합합니다.
1 년 전
096.1K
Local-NotebookLM:本地PDF生成语音播客的开源工具

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.
1 년 전
096.1K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI 헤지 펀드: 여러 지능을 사용하여 복잡한 헤지 펀드 거래 결정을 내리는 오픈 소스 자동 거래 시스템입니다.

일반 소개 AI 헤지 펀드는 멀티 에이전트 시스템을 활용하여 매매 결정을 내리는 인공지능 헤지 펀드입니다. 이 시스템은 시장 데이터 에이전트, 퀀트 에이전트, 리스크 관리 에이전트, 포트폴리오 관리 에이전트 등 여러 전문 에이전트와 함께 작동하여 복잡한 트레이딩을 수행합니다....
1 년 전
096K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: 완벽한 디지털 휴먼 비디오 생성 프레임워크 | 포트레이트에서 비디오로 | 포즈에서 비디오로 | 립싱크

일반 소개 MuseV는 길이에 제한이 없는 고화질의 아바타 동영상 생성을 목표로 하는 깃허브의 공개 프로젝트입니다. 디퓨전 기술을 기반으로 하며 이미지2비디오, 텍스트2이미지2비디오, 비디오2비디오...
2 년 전
095.9K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

실시간 음성 채팅: AI를 통한 지연 시간이 짧은 자연스러운 음성 대화

일반 소개 리얼타임보이스챗은 음성을 통한 인공 지능과의 실시간 자연스러운 대화에 초점을 맞춘 오픈 소스 프로젝트입니다. 사용자가 마이크를 사용하여 음성을 입력하면 시스템이 브라우저를 통해 오디오를 캡처하여 텍스트로 빠르게 변환하고 대규모 언어 모델(LLM)을 생성하여 다시 ...
1 년 전
095.9K
GPT4All:支持CPU运行的大型语言模型客户端,重视本地化与数据安全

GPT4All: CPU 런타임을 지원하는 대규모 언어 모델 클라이언트로, 현지화 및 데이터 보안에 중점을 둡니다.

GPT4All 일반 소개 GPT-4All은 사용자가 로컬 장치에서 LLM(대규모 언어 모델)을 실행할 수 있도록 하기 위해 Nomic에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 개인 정보 보호를 강조하며 인터넷 연결 없이도 사용할 수 있으며 개인 및 비즈니스 사용자 모두에게 적합합니다....
1 년 전
095.4K
Sigma AI Browser:免费使用主流大模型的AI浏览器

시그마 AI 브라우저: 주요 대형 모델을 사용하기 위한 무료 AI 브라우저

일반 설명 시그마 AI 브라우저는 인공 지능 기술을 활용하여 사용자에게 더 빠르고 스마트한 브라우징 경험을 제공하는 시그마브라우저 OÜ에서 개발한 고급 브라우저입니다. 이 브라우저는 속도와 효율성에 초점을 맞출 뿐만 아니라 향상된 보안과 개인 정보 보호 기능도 제공합니다.
1 년 전
095.3K
小红书AI运营助手:自动生成和发布小红书文章

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.
1 년 전
095.2K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: RAG 리콜 QA 정확도 및 답변 상관관계 평가하기

종합 소개 Ragas는 검색 증강 생성(RAG) 시스템을 평가하고 최적화하기 위해 특별히 고안된 도구입니다. 쿼리, 검색 컨텍스트, 생성된 답변 간의 관계를 분석하여 종합적인 평가 메트릭 세트를 제공합니다. 이러한 메트릭에는 충실도, 답변 관련성, 문맥 관련성 등이 포함됩니다.
1 년 전
095.1K
AgentEvolver - 阿里通义实验室开源的智能体进化系统

에이전트 에볼버 - 진화하는 지능을 위한 알리 통이 연구소의 오픈 소스 시스템

에이전트이볼버는 알리바바 통이 연구소의 오픈소스 지능형 신체 진화 시스템입니다. 자체 질문, 자체 탐색 및 자체 귀속의 세 가지 메커니즘을 통해 지능의 자율 학습 및 진화를 달성하며, 에이전트 에볼버는 환경 샌드박스, LLM 및 sc를 결합한 서비스 지향 아키텍처를 채택합니다.
7개월 전
094.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

컴피유 디스티 플로우: 워크플로우를 간소화하는 컴피유 사용자 친화적 인터페이스

일반 소개 ComfyUI-disty-Flow는 ComfyUI에 사용자 친화적인 인터페이스를 제공하는 사용자 정의 노드입니다. 이 노드는 워크플로우 생성을 위한 대체 사용자 인터페이스를 제공하여 워크플로우 실행을 단순화하기 위한 것입니다.ComfyUI-disty...
1 년 전
094.6K
智谱清言:GLM模型驱动的智能对话工具,支持创建智能体、长文档解读、AI数据分析

스마트 스펙트럼 클리어 스피치: 지능 생성, 긴 문서 해석 및 AI 데이터 분석을 지원하는 GLM 모델 기반 지능형 대화 도구입니다.

종합 소개 智谱清言(chatglm.cn) 웹사이트는 GLM(생성 언어 모델) 기술에 기반한 지능형 커뮤니케이션 플랫폼을 제공합니다. 이 플랫폼은 여러 차례의 대화, 콘텐츠 작성 및 메시지 요약 기능을 지원하여 고급화를 목표로 합니다.
1 년 전
094.5K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
1 년 전
094.5K
LocalAI:开源的本地AI部署方案,支持多种模型架构,WebUI统一管理模型和API

LocalAI: 오픈 소스 로컬 AI 배포 솔루션, 여러 모델 아키텍처 지원, 모델 및 API의 WebUI 통합 관리

일반 소개 LocalAI는 OpenAI, Claude 등과 호환되는 API 인터페이스를 제공하도록 설계된 오픈 소스 로컬 AI 대안입니다. 소비자급 하드웨어에서 실행을 지원하며 GPU가 필요하지 않고 텍스트, 오디오, 비디오, 이미지 생성 및 음성 복제를 여러...에 대해 수행할 수 있습니다.
2 년 전
094.4K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: 이미지 및 동영상 배경 일괄 제거를 위한 오픈 소스 프로그램으로, RMBG 2.0에 최적화되어 있습니다.

일반 소개 RMBG-2-Studio는 BRIA-RMBG-2.0 모델을 기반으로 개발된 향상된 배경 제거 및 교체 애플리케이션입니다. 이 애플리케이션은 사용자에게 전자상거래, 게임 등 다양한 이미지 유형에 대한 효율적이고 정확한 이미지 배경 처리 기능을 제공하도록 설계되었습니다.
2 년 전
094.3K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: 소비자 GPU에서 고품질 비디오 생성하기

종합 소개 Wan2.1은 Wan-Video 팀이 개발하고 GitHub에서 오픈소스로 제공하는 동영상 생성 도구 모음으로, 인공지능 기술을 통해 동영상 제작의 경계를 넓히는 데 중점을 두고 있습니다. 이 도구는 시간에 따라 변하는 고유한 자기 변환을 통합하는 고급 확산 트랜스포머 아키텍처를 기반으로 합니다.
1 년 전
094.1K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: 지식 그래프 기반 RAG 구성, 핵심 프롬프트 학습을 위한 오픈 소스 프레임워크

일반 소개 Cognee는 AI 애플리케이션과 AI 에이전트를 위해 설계된 신뢰할 수 있는 데이터 레이어 솔루션입니다. LLM(대규모 언어 모델) 컨텍스트를 로드하고 구축하여 지식 그래프와 벡터 스토어를 통해 정확하고 해석 가능한 AI 솔루션을 생성하도록 설계되었습니다. 이 프레임워크는 비용 절감, 해석 가능한 ...
1 년 전
094.1K
Manga Image Translator - 开源的漫画图片文字翻译工具,无缝嵌入原图保持原始风格

만화 이미지 번역기 - 만화 이미지용 오픈 소스 텍스트 번역 도구로, 원본 이미지를 매끄럽게 삽입하여 원본 스타일을 유지합니다!

만화 이미지 번역기는 만화 또는 이미지의 텍스트를 대상 언어로 원 클릭 번역을 지원하는 오픈 소스 만화 이미지 텍스트 번역 도구로, 만화 이미지 번역기는 원본 이미지를 매끄럽게 삽입하여 만화와 천의 원래 스타일을 유지하면서 ...
1 년 전
094K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

라이트아바타: 오디오 기반의 실시간 인터랙티브 디지털 인물 2D 초상화, CPU에서 30fps로 실행됨

일반 소개 LiteAvatar는 HumanAIGC 팀(Ali의 일부)이 개발한 오픈 소스 도구로, 오디오로 구동되는 2D 아바타에서 실시간으로 얼굴 애니메이션을 생성하는 데 중점을 두고 있습니다. CPU에만 의존하여 초당 30프레임(fps)으로 실행되며, 특히 다음과 같은 경우에 적합합니다.
1 년 전
093.9K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

딥 라이브 캠: 오픈 소스 실시간 AI 얼굴 스와핑 도구, 실시간 라이브 얼굴 스와핑을 위한 사진 제공

일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.
2 년 전
093.9K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

워터마크 제거: 오픈 소스 이미지 워터마크 제거 도구, 사진 워터마크 복구 원본 이미지

일반 소개 워터마크 제거는 이미지 복원을 위해 머신러닝과 딥러닝 기술을 사용하는 오픈 소스 프로젝트로, 특히 이미지에서 워터마크를 제거하는 데 사용됩니다. 이 프로젝트는 침즈루크 오카포가 개발했으며, Con ...
1 년 전
093.9K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

Genspark: Genspark 인텔리전스를 기반으로 한 심층 검색 및 연구 보고서 작성

일반 소개 Genspark는 인공 지능 기반 검색 도구입니다. 2023년 전직 바이두 임원이 설립했으며 캘리포니아주 팔로알토에 본사를 두고 있습니다. 젠스파크는 여러 인공지능을 사용하여 실시간으로 맞춤형 검색을 생성한다는 점에서 기존 검색 엔진과 다릅니다.
1 년 전
093.9K
Akash Network:去中心化GPU算力交易平台

아카시 네트워크: 탈중앙 GPU 산술 거래 플랫폼

일반 소개 아카시 네트워크는 블록체인 기술을 기반으로 하는 탈중앙화 클라우드 컴퓨팅 플랫폼으로, 기존 클라우드 컴퓨팅 대기업의 독점을 깨고 보다 효율적이고 비용 효율적이며 유연한 컴퓨팅 리소스 거래 시장을 제공하는 것을 목표로 합니다. 이는 컴퓨팅 리소스가 필요한 사용자와 유휴 컴퓨팅 리소스를 보유한 사용자를 연결하여 이를 수행합니다.
1 년 전
093.8K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice: 다중 음성 및 감정적 큐잉 제어 기능을 갖춘 텍스트 음성 변환 엔진

종합 소개 EmotiVoice는 넷이즈유다오에서 개발한 다중 음성 및 감정 단서 제어 기능을 갖춘 텍스트 음성 변환(TTS) 엔진입니다. 이 오픈 소스 TTS 엔진은 영어와 중국어를 지원하고, 2000개 이상의 다양한 음성을 제공하며, 감정 합성 기능을 통해 행복한 음성을 생성할 수 있습니다.
1 년 전
093.8K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: AI 어시스턴트 및 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다.

일반 소개 Mem0("mem-zero"로 발음)는 AI 어시스턴트와 에이전트를 위한 지능형 메모리 계층을 제공하는 오픈 소스 프로젝트입니다. 사용자 선호도를 기억하고, 개인의 필요에 맞게 조정하며, 시간이 지남에 따라 개선되므로 고객 지원 챗봇, AI 비서 및 자율 시스템에 이상적입니다.
2 년 전
093.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

루플로우: 루 코드 확장에 기반한 메모리 향상 시스템

포괄적인 소개 RooFlow는 프로젝트 로깅을 통해 개발 중 코드, 의사 결정 및 작업 진행 상황을 보존하는 핵심 기능을 갖춘 오픈 소스 AI 지원 프로그래밍 도구입니다. Roo Code 확장을 기반으로 하며 아키텍처, 코딩, 테스트, 디버깅, Q&A의 다섯 가지 모드를 통합합니다. 이러한 모드는 상호 ...
1 년 전
093.6K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

제미니 밸런스: 제미니 모델 API는 OpenAI 형식과 호환되며, 지역 제한을 해제하고 다중 API 키 폴링을 지원합니다.

종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...
1 년 전
093.6K
Fish Speech:快速且高精度使用少样本克隆中英文语音

물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.

일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...
1 년 전
093.6K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: 비디오를 추출하여 대상 인물 사진을 지정하고, 대상 인물 사진을 생성하는 오픈 소스 도구입니다.

일반 소개 MatAnyone은 싱가포르 난양공과대학교 S-Lab 연구팀이 개발하여 GitHub에 공개한 비디오 키잉에 중점을 둔 오픈 소스 프로젝트입니다. 특히 일관된 메모리 전파 기술을 통해 사용자에게 안정적이고 효율적인 비디오 처리 기능을 제공합니다.
1 년 전
093.5K
Undetectable AI:绕过AI检测的文本人性化工具,免费AI查重检测器

감지할 수 없는 AI: AI 탐지를 우회하는 텍스트 인간화 도구, 무료 AI 검사기 탐지기

일반 설명 감지할 수 없는 AI는 AI 콘텐츠 감지기를 우회하도록 설계된 도구입니다. 고급 알고리즘과 재작성 기술을 사용하여 출력 텍스트가 사람이 쓴 글과 비슷하고 충분히 수정할 수 있는 수준임을 보장합니다. AI가 감지할 수 없는 콘텐츠를 제작해야 하는 작가, 블로거, 연구원을 위해...
1 년 전
093.4K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: 단 3초 만에 무료 온라인 음성 복제가 가능합니다!

일반 소개 AnyVoice는 초현실적인 음성 생성 및 음성 복제 서비스를 제공하는 고급 AI 음성 생성 플랫폼입니다. 이 플랫폼을 통해 사용자는 텍스트를 자연스러운 음성으로 변환하고 수백 개의 사전 설정된 음성 중에서 선택할 수 있습니다. 적합한 음성을 찾을 수 없다면...
1 년 전
093.3K
Outlier:参与AI模型训练的任务发布平台

이상값: AI 모델 학습에 참여할 수 있는 작업 게시 플랫폼

일반 소개 아웃라이어는 전 세계의 전문가를 연결하여 사용자가 AI 모델의 학습과 최적화에 참여할 수 있도록 지원하는 온라인 플랫폼입니다. 사용자는 자신의 전문 지식을 활용하고 유연한 수입을 얻으면서 작업을 완료하여 AI 개발에 기여할 수 있습니다. 이 플랫폼은 다양한 영역의 작업을 지원합니다...
1 년 전
093.3K
FindPicLocation:使用AI技术定位照片拍摄地点,快速获取片GPS定位

사진 위치 찾기: AI 기술을 사용해 사진을 촬영한 위치를 찾고 필름의 GPS 위치를 빠르게 파악할 수 있습니다.

종합 소개 FindPicLocation은 인공 지능 기술을 사용하여 사용자가 사진을 촬영한 위치를 찾을 수 있도록 도와주는 웹사이트입니다. 사용자는 사진을 업로드하기만 하면 시스템이 자동으로 사진의 EXIF 데이터를 분석하고 GPS 좌표를 추출하여 정확한 위치를 지도에 표시합니다. 이 사이트의 목표는...
2 년 전
093.2K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: 커스텀 LLM 애플리케이션을 위한 노드 드래그 앤 드롭 인터페이스 구축

일반 소개 FlowiseAI는 개발자가 맞춤형 LLM(대규모 언어 모델) 애플리케이션과 AI 에이전트를 구축할 수 있도록 설계된 오픈 소스 로우코드 툴입니다. 간단한 드래그 앤 드롭 인터페이스를 통해 사용자는 LLM 애플리케이션을 빠르게 생성하고 반복할 수 있어 테스트부터 생산에 이르는 프로세스를 더욱 효율적으로 진행할 수 있습니다.
1 년 전
093.2K
JanitorAI:角色扮演与互动故事AI

JanitorAI: 롤플레잉 및 인터랙티브 스토리텔링 AI

일반 소개 JanitorAI는 고급 챗봇 기술을 사용하여 사용자가 자신만의 이야기를 만들고 공유할 수 있는 혁신적인 온라인 대화형 스토리 창작 플랫폼을 전문적으로 제공합니다. 간단하고 직관적인 인터페이스로 전문 작가뿐만 아니라 창작과 스토리텔링을 좋아하는 일반 사용자들에게도 적합합니다.
1 년 전
093.1K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: 네이티브 AI 모델 대화 및 문서 검색을 위한 웹 어시스턴트 플러그인

일반 소개 페이지 어시스트는 사용자가 로컬 AI 모델과 쉽게 상호작용할 수 있도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. 이 확장 프로그램을 사용하면 모든 웹 페이지에서 사이드바를 열어 로컬에서 실행 중인 AI 모델과 상호 작용할 수 있습니다.Page Assi...
1 년 전
093.1K
MiniMind:2小时从零训练26M参数GPT的开源工具

미니마인드: 처음부터 2시간 동안 2600만 개의 매개변수를 교육하는 GPT 오픈 소스 도구

일반 소개 미니마인드는 개발자 징야오공이 만든 오픈 소스 프로젝트입니다. 미니마인드의 핵심 목표는 일반인들도 자신의 AI 모델을 빠르게 훈련할 수 있도록 하는 것입니다. 미니마인드의 주요 기능은 단일 NVIDIA에서 2시간을 사용하는 것입니다.
1 년 전
093.1K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: 사진 한 장, 여러 무료 동영상 생성 도구로 디지털 사람의 음성 동영상을 생성하세요.

일반 설명 Vidnoz는 1분 이내에 AI 동영상을 빠르게 제작할 수 있는 무료 AI 동영상 생성 플랫폼입니다. 비용, 다운로드 또는 경험이 필요하지 않습니다. 이 플랫폼은 500개 이상의 AI 아바타, 470개 이상의 사실적인 AI 보이스오버, 500개 이상의 템플릿을 제공합니다. Vidnoz AI 동영상으로...
2 년 전
092.9K
Vizard:长视频自动剪辑为适合社交媒体推广的爆款短视频

Vizard: 긴 동영상이 소셜 미디어 홍보에 적합한 짧고 폭발적인 동영상으로 자동 편집됩니다.

일반 소개 블루펄스의 Vizard는 인공 지능 기술을 사용하여 사용자가 긴 동영상을 짧은 소셜 미디어 클립으로 빠르게 변환할 수 있도록 도와주는 온라인 도구입니다. 콘텐츠 제작자, 마케터, 교육자를 위해 설계된 이 도구는 동영상에서 가장 좋은 순간을 자동으로 식별하여 다음에 적합한 짧은 클립을 생성합니다.
1 년 전
092.8K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: 전체 프로세스 프로그래밍 작업을 자동화하는 확장 가능한 오픈 소스 프로그래밍 인텔리전스

일반 소개 Goose는 개발자가 일상적인 개발 작업을 자동화할 수 있도록 설계된 블록에서 개발한 오픈 소스 AI 에이전트 도구입니다. 광범위한 LLM(대규모 언어 모델)을 지원하며 명령줄 또는 데스크톱 애플리케이션 인터페이스를 통해 사용자와 상호 작용하며, 에이전트에서 다양한 작업을 수행할 수 있습니다.
1 년 전
092.8K
flowith:画布编排式AI内容创作平台,自动化写作与配图

플로우이스: 글쓰기와 일러스트레이션을 자동화하는 캔버스 오케스트레이션 AI 콘텐츠 제작 플랫폼

일반 소개 Flowith는 GPT-4 기반의 AI 생산성 도구입니다. 기존의 채팅 기반 AI 도구와 달리, 멀티 스레드 분산 방식으로 AI와 상호 작용하고 쉽게 작업할 수 있는 최초의 노드 기반 AI 저작 방식을 제공합니다.
1 년 전
092.8K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: OpenAI 형식과 호환되는 Edge TTS를 사용하는 무료 텍스트 음성 변환 API

일반 소개 OpenAI Edge TTS는 OpenAI와 호환되는 네이티브 TTS(텍스트 음성 변환) API를 제공하는 오픈 소스 프로젝트로, 이 프로젝트는 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용하여 사용자가 고품질의 음성 변환을 생성할 수 있도록 합니다.
1 년 전
092.7K
Repo Prompt:依赖本地文件夹上下文进行写作、对话与优化代码

저장소 프롬프트: 쓰기, 대화 및 최적화된 코드를 위해 로컬 폴더 컨텍스트에 의존합니다.

일반 소개 리포지토리 프롬프트는 고급 AI 언어 모델을 사용하여 네이티브 코드로 작업하는 개발자의 프로세스를 간소화하기 위해 macOS 플랫폼용으로 제작된 네이티브 애플리케이션입니다. 이 도구를 사용하면 개발자가 지능적인 방식으로 코드 파일을 관리하고 수정하여 개발 효율성을 크게 향상시킬 수 있습니다....
1 년 전
092.7K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

브라우저 사용 웹 UI: 웹 탐색을 위해 AI 인텔리전스를 실행하기 위한 오픈 소스 프레임워크로, AI가 웹 페이지를 자동으로 조작할 수 있습니다.

일반 소개 브라우저 사용 웹 UI는 AI 에이전트에 그래픽 인터페이스 도구로서 브라우저 상호 작용 기능을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저 사용 핵심 프레임워크 위에 구축된 Gradio를 기반으로 합니다.
1 년 전
092.6K
PopAI:文档生成AI助手|PPT|流程图|文章|文档对话|解释图片

PopAI: 문서 생성 AI 도우미|PT|흐름도|문서|문서 대화|그림 설명하기

종합 소개 PopAI는 혁신적인 AI 기술을 통해 교육 시나리오의 적용을 개선하고 개인화된 학습 경험을 제공하는 데 전념하고 있으며, 다양한 AI 도구를 통합하여 문서 상호 작용, 이미지 생성 및 PPT 작성을 향상시키는 스마트 워크스페이스 플랫폼입니다. PopAI는 국내의 제로...
2 년 전
092.6K