최신 AI 리소스

共 3094 篇文章
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: AI가 컴퓨터를 직접 제어할 수 있도록 하는 클라우드의 제어 컴퓨터를 오픈 소스로 구현한 기능입니다.

일반 설명 Agent.exe는 사용자가 AI를 통해 로컬 컴퓨터를 직접 제어할 수 있도록 Anthropic의 클로드 3.5 소네트 API를 활용하는 오픈 소스 일렉트론 애플리케이션입니다. 이 프로젝트는 K...에 의해 개발되었습니다.
1 년 전
094.5K
MemeGen AI:智能搞笑图片生成器,将照片转化为动态表情包,轻松创建搞笑图片

MemeGen AI : 지능형 재미있는 사진 생성기, 사진을 동적 이모티콘으로 바꾸고 재미있는 사진을 쉽게 만들 수 있습니다!

일반 소개 MemeGen AI는 사용자가 간단한 조작으로 다양한 재미있는 그림을 만들 수 있는 인공지능 기반의 재미있는 그림 생성기입니다. 이 사이트는 고급 GPT-4 비전 모델을 사용하여 사용자가 기술적 인 지식이 없어도 재미있는 그림과 텍스트를 자동으로 생성합니다.
2 년 전
094.5K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台

BISHENG: 엔터프라이즈 AI 애플리케이션 구축을 위한 오픈 소스 LLM DevOps 플랫폼

종합 소개 BISHENG은 차세대 엔터프라이즈 AI 애플리케이션을 위해 설계된 오픈 소스 LLM(대규모 언어 모델) DevOps 플랫폼입니다. 이 플랫폼은 생성형 AI 워크플로, RAG(검색 증강 생성), 지능형 에이전트, 통합 모델 관리 등 강력하고 포괄적인 기능을 제공합니다....
1 년 전
094.4K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

코발트: 범용 동영상 다운로더, 유튜브, 비메오, 트위터, 레딧, 사운드클라우드 등!

일반 소개 유튜브와 트위터 동영상을 다운로드해야 할 때가 종종 있어서 광고 없는 무료 동영상 다운로더를 찾았습니다.Cobalt는 사용자 친화적인 다운로드 환경을 제공하도록 설계된 오픈 소스 미디어 다운로더입니다. 다음을 포함한 여러 플랫폼에서 비디오 및 오디오 콘텐츠 다운로드를 지원합니다.
1 년 전
094.3K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...
1 년 전
094.2K
Honeybot.AI:免费对话的AI虚拟女友

Honeybot.AI: 자유로운 대화가 가능한 AI 가상 여자 친구

일반 소개 Honeybot.ai는 무료 AI 가상 동반자를 제공하는 웹사이트입니다. 사용자는 AI 캐릭터와 실시간으로 대화를 나누며 실제 대화와 유사한 경험을 할 수 있습니다. 이 사이트는 정서적 연결에 중점을 두고 있으며, AI는 사용자의 이름, 대화 내용 및 관심사 선호도를 기억하여 개인화된 경험을 제공합니다...
1 년 전
094.1K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI: LLM 없이 구조화된 데이터를 추출하는 오픈 소스 비동기 웹 크롤러 도구

종합 소개 Crawl4AI는 대규모 언어 모델(LLM) 및 인공 지능(AI) 애플리케이션을 위해 설계된 오픈 소스 비동기 웹 크롤러 도구입니다. 웹 크롤링 및 데이터 추출 프로세스를 간소화하고, 효율적인 웹 크롤링을 지원하며, LLM 친화적인 출력 형식을 제공합니다.
1 년 전
094.1K
Local-NotebookLM:本地PDF生成语音播客的开源工具

로컬-NotebookLM: 오픈 소스 도구의 음성 팟캐스트를 생성하는 로컬 PDF

종합 소개 로컬에서 실행되는 지능형 문서 처리 및 콘텐츠 생성 도구를 제공하는 것을 목표로 하는 오픈 소스 프로젝트인 Local-NotebookLM입니다. 이 프로젝트는 사용자가 PDF 및 기타 문서를 다양한 형태로 변환할 수 있도록 돕는 데 중점을 두고 있는 Google NotebookLM에서 영감을 받았습니다.
1 년 전
094K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
1 년 전
093.9K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

린리 더빙: 지능형 비디오 다국어 AI 더빙/번역 도구

종합 소개 Linly-Dubbing은 고급 AI 기술을 통합하여 사용자에게 고품질의 다국어 동영상 더빙 및 자막 번역 서비스를 제공하도록 설계된 지능형 다국어 AI 더빙 및 번역 도구입니다. 이 도구는 특히 국제 교육, 글로벌 콘텐츠 로컬라이제이션 및 기타 시나리오에 적합하며 다음을 지원합니다.
1 년 전
093.8K
OpenSPG:开源知识图谱引擎

OpenSPG: 오픈 소스 지식 그래프 엔진

종합 소개 OpenSPG는 SPG(Semantic Augmented Programmable Graph) 프레임워크에 기반하여 Ant Group이 OpenKG와 협력하여 개발한 오픈 소스 지식 그래프 엔진입니다. 이 엔진은 도메인 지식 그래프의 구축 및 관리를 지원하기 위해 명시적 의미 표현, 논리적 규칙 정의 및 운영 프레임워크와 같은 기능을 제공하도록 설계되었습니다....
2 년 전
093.7K
Doc2X:文档图片公式识别与转换工具,支持多格式转换与高精度翻译

Doc2X: 문서 이미지 수식 인식 및 변환 도구, 다중 형식 변환 및 고정밀 번역 지원

종합 소개 Doc2X는 강력한 문서 이미지 수식 인식 및 변환 도구로, 효율적이고 지능적인 문서 처리 솔루션을 제공하기 위해 최선을 다하고 있습니다. 학술 연구 논문, 교과서, 기업 문서, 재무 보고서 등 어떤 문서든 Doc2X는 PDF 표를 정확하게 식별할 수 있으며...
1 년 전
093.5K
Smart Composer:引用本地笔记智能写作和语义搜索的Obsidian插件

스마트 작곡가: 로컬 노트를 참조하기 위한 스마트 글쓰기 및 시맨틱 검색을 위한 옵시디언 플러그인

일반 소개 스마트 작곡기는 흑요석 노트 필기 소프트웨어용으로 설계된 스마트 글쓰기 보조 플러그인입니다. 이 플러그는 인공 지능 기술을 사용해 상황 인식 채팅 도우미, 스마트 글쓰기 지원, 원클릭 편집 기능을 제공합니다. 이 플러그인은 사용자에 따라 메모를 작성할 수 있습니다.
1 년 전
093.4K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: 동적 지식 그래프 구성 및 쿼리 도구(시간 인식 장기 기억 프로그램)

일반 소개 Graphiti는 동적인 시간 인식 지식 그래프를 구축하고 쿼리하기 위해 getzep에서 개발한 도구입니다. 시간, 전체 텍스트, 의미 및 그래프 알고리즘과 같은 다양한 방법을 통해 개체 간의 복잡하고 진화하는 관계를 표현하고 쿼리할 수 있습니다.그래프...
1 년 전
093.3K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.
1 년 전
093.1K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee: 지식 그래프 기반 RAG 구성, 핵심 프롬프트 학습을 위한 오픈 소스 프레임워크

일반 소개 Cognee는 AI 애플리케이션과 AI 에이전트를 위해 설계된 신뢰할 수 있는 데이터 레이어 솔루션입니다. LLM(대규모 언어 모델) 컨텍스트를 로드하고 구축하여 지식 그래프와 벡터 스토어를 통해 정확하고 해석 가능한 AI 솔루션을 생성하도록 설계되었습니다. 이 프레임워크는 비용 절감, 해석 가능한 ...
1 년 전
092.9K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: 80개 이상의 언어 인식을 지원하는 플라잉 패들 기반의 다국어 OCR 툴 라이브러리입니다.

종합 소개 PaddleOCR은 실용적이고 초경량 OCR 시스템을 제공하도록 설계된 PaddlePaddle 기반의 다국어 OCR 툴킷입니다. 80개 이상의 언어 인식을 지원하며 데이터 주석 및 합성 도구를 제공하여 현업에서 사용할 수 있도록 지원합니다.
1 년 전
092.8K
Blooper:智能生成脚本与分镜画面的创作工具

Blooper: 스크립트 및 분할 화면을 지능적으로 생성하는 저작 도구

일반 소개 Blooper는 사용자가 동영상 스크립트와 분할 화면을 생성하는 데 중점을 둔 AI 기반 저작 플랫폼입니다. 스위스 추크주 바르에 본사를 둔 Blooper AI가 개발했으며 광고, 영화 및 TV 산업의 사전 제작을 지원하도록 설계되었습니다. 그물...
1 년 전
092.8K
AiPPT:全智能AI一键生成PPT|在线PPT制作|智能PPT工具(付费)

AiPPT: 풀 인텔리전스 AI 원클릭 PPT 생성 | 온라인 PPT 메이커 | 지능형 PPT 도구 (유료)

포괄적 인 소개 AiPPT는 인공 지능 기술을 기반으로 한 온라인 PPT 생성 도구입니다. 사용자는 콘텐츠 테마를 입력하기 만하면 AI가 자동으로 고품질 PPT 문서를 생성 할 수 있습니다.AiPPT는 풍부한 템플릿 리소스를 제공하고 가져올 다양한 문서 형식을 지원하며 필요에 따라 전문가를 신속하게 생성 할 수 있습니다....
1 년 전
092.6K
蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)

시카다 미러: 수백 개의 디지털 휴먼 템플릿과 독점 디지털 휴먼 이미지 복제가 가능한 디지털 휴먼 동영상 제작 플랫폼(유료)

일반 소개 Cicada는 디지털 휴먼 동영상 제작에 중점을 둔 플랫폼으로, AI 기술을 사용하여 동영상 제작 과정을 간소화합니다. 사용자는 다양한 디지털 휴먼 이미지를 선택하고, 카피를 입력하고, 다국어 더빙이 포함된 동영상을 생성할 수 있습니다. 이 플랫폼은 광고 및 마케팅, 교육 및 훈련과 같은 다양한 분야에 적합한 풍부한 템플릿 및 자료 라이브러리를 제공합니다....
1 년 전
092.6K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice: 다중 음성 및 감정적 큐잉 제어 기능을 갖춘 텍스트 음성 변환 엔진

종합 소개 EmotiVoice는 넷이즈유다오에서 개발한 다중 음성 및 감정 단서 제어 기능을 갖춘 텍스트 음성 변환(TTS) 엔진입니다. 이 오픈 소스 TTS 엔진은 영어와 중국어를 지원하고, 2000개 이상의 다양한 음성을 제공하며, 감정 합성 기능을 통해 행복한 음성을 생성할 수 있습니다.
1 년 전
092.5K
文心快码(Baidu Comate):你的AI编程助手,结合百度编程大数据,为你生成优质编程代码。

웬신 퀵 코드(Baidu Comate): AI 프로그래밍 도우미로, Baidu 프로그래밍 빅데이터와 결합하여 양질의 프로그래밍 코드를 생성합니다.

종합 소개 Baidu Comate는 Baidu에서 개발한 고급 AI 프로그래밍 도우미로, Baidu의 ERNIE 빅 모델을 기반으로 독점 데이터와 오픈 소스 데이터를 통합하여 차세대 프로그래밍 지원을 제공합니다. 코드 완성, 해석 및 디버깅 기능을 통해 개발자가 생각하고, 작성하고, 최적화하는 데 도움을 줍니다.
1 년 전
092.4K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: 소비자 GPU에서 고품질 비디오 생성하기

종합 소개 Wan2.1은 Wan-Video 팀이 개발하고 GitHub에서 오픈소스로 제공하는 동영상 생성 도구 모음으로, 인공지능 기술을 통해 동영상 제작의 경계를 넓히는 데 중점을 두고 있습니다. 이 도구는 시간에 따라 변하는 고유한 자기 변환을 통합하는 고급 확산 트랜스포머 아키텍처를 기반으로 합니다.
1 년 전
092.3K
E2B:安全云沙箱中的AI代码运行平台

E2B: 안전한 클라우드 샌드박스에서 AI 코드를 실행하는 플랫폼

일반 소개 E2B는 안전한 클라우드 샌드박스에서 AI 생성 코드를 실행하도록 설계된 오픈 소스 플랫폼입니다. 다양한 프로그래밍 언어와 프레임워크를 지원하고 격리된 가상 환경을 제공하여 코드 실행의 보안과 안정성을 보장하며, E2B는 데이터 파티셔닝을 비롯한 다양한 AI 애플리케이션 시나리오에 적합합니다.
1 년 전
092.3K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: 스마트한 고객 서비스 및 사내 지식창고를 위한 즉시 사용 가능한 AI 지식창고 Q&A 시스템

종합 소개 MaxKB(Max Knowledge Base)는 대규모 언어 모델과 RAG(검색 증강 생성)를 기반으로 하는 오픈 소스 지식 기반 Q&A 시스템입니다. 이 시스템은 지능형 고객 서비스, 기업 내부 지식 기반, 학술 연구 및 교육 및 기타 시나리오에서 널리 사용됩니다.MaxKB...
1 년 전
092.3K
AgentEvolver - 阿里通义实验室开源的智能体进化系统

에이전트 에볼버 - 진화하는 지능을 위한 알리 통이 연구소의 오픈 소스 시스템

에이전트이볼버는 알리바바 통이 연구소의 오픈소스 지능형 신체 진화 시스템입니다. 자체 질문, 자체 탐색 및 자체 귀속의 세 가지 메커니즘을 통해 지능의 자율 학습 및 진화를 달성하며, 에이전트 에볼버는 환경 샌드박스, LLM 및 sc를 결합한 서비스 지향 아키텍처를 채택합니다.
5개월 전
092.3K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk: 완벽한 디지털 휴먼 비디오 생성 프레임워크 | 포트레이트에서 비디오로 | 포즈에서 비디오로 | 립싱크

일반 소개 MuseV는 길이에 제한이 없는 고화질의 아바타 동영상 생성을 목표로 하는 깃허브의 공개 프로젝트입니다. 디퓨전 기술을 기반으로 하며 이미지2비디오, 텍스트2이미지2비디오, 비디오2비디오...
1 년 전
091.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AI 헤지 펀드: 여러 지능을 사용하여 복잡한 헤지 펀드 거래 결정을 내리는 오픈 소스 자동 거래 시스템입니다.

일반 소개 AI 헤지 펀드는 멀티 에이전트 시스템을 활용하여 매매 결정을 내리는 인공지능 헤지 펀드입니다. 이 시스템은 시장 데이터 에이전트, 퀀트 에이전트, 리스크 관리 에이전트, 포트폴리오 관리 에이전트 등 여러 전문 에이전트와 함께 작동하여 복잡한 트레이딩을 수행합니다....
1 년 전
091.9K
GPT4All:支持CPU运行的大型语言模型客户端,重视本地化与数据安全

GPT4All: CPU 런타임을 지원하는 대규모 언어 모델 클라이언트로, 현지화 및 데이터 보안에 중점을 둡니다.

GPT4All 일반 소개 GPT-4All은 사용자가 로컬 장치에서 LLM(대규모 언어 모델)을 실행할 수 있도록 하기 위해 Nomic에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 개인 정보 보호를 강조하며 인터넷 연결 없이도 사용할 수 있으며 개인 및 비즈니스 사용자 모두에게 적합합니다....
1 년 전
091.9K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 장기기억을 기반으로 하는 멀티홉 지식 검색 프레임워크

일반 소개 HippoRAG는 인간의 장기기억 메커니즘에서 영감을 받아 오하이오 주립대학의 OSU-NLP 그룹에서 개발한 오픈 소스 프레임워크입니다. 검색 증강 생성(RAG), 지식 그래프, 개인화된 페이지랭크 기술을 결합하여 대규모 언어 모델에 도움이 되는...
1 년 전
091.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: 슬라이드/PPT 및 설명 메모에서 프레젠테이션 동영상을 빠르게 생성하기

일반 소개 TRV는 사용자가 슬라이드와 프레젠테이션 노트를 내레이션이 있는 동영상으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구로, GitHub에서 호스팅됩니다. 간단한 명령줄 작업을 통해 입력된 프레젠테이션 파일에서 오디오 및 비디오 콘텐츠를 자동으로 생성하며, 프레젠테이션을 빠르게 만들어야 하는 사용자에게 적합합니다.
1 년 전
091.6K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...
1 년 전
091.5K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

컴피유 디스티 플로우: 워크플로우를 간소화하는 컴피유 사용자 친화적 인터페이스

일반 소개 ComfyUI-disty-Flow는 ComfyUI에 사용자 친화적인 인터페이스를 제공하는 사용자 정의 노드입니다. 이 노드는 워크플로우 생성을 위한 대체 사용자 인터페이스를 제공하여 워크플로우 실행을 단순화하기 위한 것입니다.ComfyUI-disty...
1 년 전
091.5K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS: 혁신적인 음성 생성 및 음성 복제 도구

종합적인 소개 GPT-SoVITS는 오픈 소스 음성 변환 및 합성 도구로, GPT 모델과 SoVITS 보이스 체인저 기술을 결합한 것입니다. 이 도구는 샘플이 전혀 없거나 적은 상태에서 즉석에서 텍스트를 음성으로 변환하고 5초의 오디오 샘플만으로 음성 스타일 마이그레이션을 지원합니다. 그 기능에는 교차 언어가 포함됩니다 ...
2 년 전
091.2K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: 오디오와 비디오를 텍스트로 빠르게 변환하는 온라인 도구

일반 설명 TurboScribe는 오디오와 비디오를 텍스트로 빠르게 변환하는 데 중점을 둔 AI 기반 전사 도구입니다. 98개 이상의 언어를 지원하며 정확도가 99.8%에 달해 음성 콘텐츠를 효율적으로 처리해야 하는 사용자에게 적합합니다. 사용자는 파일을 업로드하고, 텍스트 노트를 생성하고...
1 년 전
091.2K
Sigma AI Browser:免费使用主流大模型的AI浏览器

시그마 AI 브라우저: 주요 대형 모델을 사용하기 위한 무료 AI 브라우저

일반 설명 시그마 AI 브라우저는 인공 지능 기술을 활용하여 사용자에게 더 빠르고 스마트한 브라우징 경험을 제공하는 시그마브라우저 OÜ에서 개발한 고급 브라우저입니다. 이 브라우저는 속도와 효율성에 초점을 맞출 뿐만 아니라 향상된 보안과 개인 정보 보호 기능도 제공합니다.
1 년 전
091.2K
HackChat稳定且无审查的GPT4聊天机器人

안정적이고 검열되지 않은 HackChat의 GPT4 챗봇

일반 설명 무수정 AI 채팅 및 생성 서비스를 제공하는 웹사이트입니다. 사용자는 이 플랫폼을 사용하여 다양한 스타일의 소설 창작, 코드 생성, 롤플레잉 등을 할 수 있습니다. 텍스트에서 이미지 생성도 지원되므로 사용자는 무수정 이미지를 만들 수 있습니다. 이 플랫폼은 개인 정보 보호에 중점을 두고 있으며 사용자는 ...
1 년 전
091.1K
Undetectable AI:绕过AI检测的文本人性化工具,免费AI查重检测器

감지할 수 없는 AI: AI 탐지를 우회하는 텍스트 인간화 도구, 무료 AI 검사기 탐지기

일반 설명 감지할 수 없는 AI는 AI 콘텐츠 감지기를 우회하도록 설계된 도구입니다. 고급 알고리즘과 재작성 기술을 사용하여 출력 텍스트가 사람이 쓴 글과 비슷하고 충분히 수정할 수 있는 수준임을 보장합니다. AI가 감지할 수 없는 콘텐츠를 제작해야 하는 작가, 블로거, 연구원을 위해...
1 년 전
091K
Manga Image Translator - 开源的漫画图片文字翻译工具,无缝嵌入原图保持原始风格

만화 이미지 번역기 - 만화 이미지용 오픈 소스 텍스트 번역 도구로, 원본 이미지를 매끄럽게 삽입하여 원본 스타일을 유지합니다!

만화 이미지 번역기는 만화 또는 이미지의 텍스트를 대상 언어로 원 클릭 번역을 지원하는 오픈 소스 만화 이미지 텍스트 번역 도구로, 만화 이미지 번역기는 원본 이미지를 매끄럽게 삽입하여 만화와 천의 원래 스타일을 유지하면서 ...
11개월 전
090.9K
Fish Speech:快速且高精度使用少样本克隆中英文语音

물고기 음성: 몇 개의 샘플을 사용하여 영어와 중국어 음성을 빠르고 정확하게 복제합니다.

일반 소개 피쉬 스피치는 피쉬 오디오에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 합성 도구입니다. 이 도구는 VQ-GAN, Llama 및 VITS와 같은 최첨단 AI 기술을 기반으로 하며 텍스트를 사실적인 음성으로 변환할 수 있습니다.Fish S...
1 년 전
090.8K
小红书AI运营助手:自动生成和发布小红书文章

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.
1 년 전
090.8K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
1 년 전
090.8K
Ragas:评估RAG召回QA准确率与答案相关性

Ragas: RAG 리콜 QA 정확도 및 답변 상관관계 평가하기

종합 소개 Ragas는 검색 증강 생성(RAG) 시스템을 평가하고 최적화하기 위해 특별히 고안된 도구입니다. 쿼리, 검색 컨텍스트, 생성된 답변 간의 관계를 분석하여 종합적인 평가 메트릭 세트를 제공합니다. 이러한 메트릭에는 충실도, 답변 관련성, 문맥 관련성 등이 포함됩니다.
1 년 전
090.8K
智谱清言:GLM模型驱动的智能对话工具,支持创建智能体、长文档解读、AI数据分析

스마트 스펙트럼 클리어 스피치: 지능 생성, 긴 문서 해석 및 AI 데이터 분석을 지원하는 GLM 모델 기반 지능형 대화 도구입니다.

종합 소개 智谱清言(chatglm.cn) 웹사이트는 GLM(생성 언어 모델) 기술에 기반한 지능형 커뮤니케이션 플랫폼을 제공합니다. 이 플랫폼은 여러 차례의 대화, 콘텐츠 작성 및 메시지 요약 기능을 지원하여 고급화를 목표로 합니다.
1 년 전
090.7K
SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像

SkyReels: 자연스러운 움직임으로 파노라마 인물 사진을 생성하는 데 특화된 AI 동영상 촌극 제작 플랫폼입니다.

일반 소개 스카이릴스는 AI 동영상 제작에 중점을 둔 온라인 플랫폼으로, 사용자가 텍스트 스크립트나 창의적인 아이디어를 고품질의 짧은 동영상으로 빠르게 전환할 수 있도록 설계되었습니다. 콘텐츠 제작자, 마케터, 일반 사용자 모두 텍스트를 입력하기만 하면 플랫폼에서 자동으로 동영상을 생성해 줍니다.
1 년 전
090.7K
FindPicLocation:使用AI技术定位照片拍摄地点,快速获取片GPS定位

사진 위치 찾기: AI 기술을 사용해 사진을 촬영한 위치를 찾고 필름의 GPS 위치를 빠르게 파악할 수 있습니다.

종합 소개 FindPicLocation은 인공 지능 기술을 사용하여 사용자가 사진을 촬영한 위치를 찾을 수 있도록 도와주는 웹사이트입니다. 사용자는 사진을 업로드하기만 하면 시스템이 자동으로 사진의 EXIF 데이터를 분석하고 GPS 좌표를 추출하여 정확한 위치를 지도에 표시합니다. 이 사이트의 목표는...
1 년 전
090.7K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: 전체 프로세스 프로그래밍 작업을 자동화하는 확장 가능한 오픈 소스 프로그래밍 인텔리전스

일반 소개 Goose는 개발자가 일상적인 개발 작업을 자동화할 수 있도록 설계된 블록에서 개발한 오픈 소스 AI 에이전트 도구입니다. 광범위한 LLM(대규모 언어 모델)을 지원하며 명령줄 또는 데스크톱 애플리케이션 인터페이스를 통해 사용자와 상호 작용하며, 에이전트에서 다양한 작업을 수행할 수 있습니다.
1 년 전
090.6K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: 대형 모델에 구축된 지능형 대화 로봇으로, WeChat 및 기타 다중 대화 플랫폼 액세스를 지원합니다.

종합 소개 ChatGPT-on-WeChat 프로젝트는 대형 모델 기반의 지능형 대화 로봇으로, 개인 WeChat, WeChat 공개 번호, 기업 WeChat 애플리케이션, 플라이북, 네일 등에 대한 다중 플랫폼 액세스를 지원합니다. 사용자는 GPT3.5, GPT-4, Claude, Man ...
1 년 전
090.6K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

Genspark: Genspark 인텔리전스를 기반으로 한 심층 검색 및 연구 보고서 작성

일반 소개 Genspark는 인공 지능 기반 검색 도구입니다. 2023년 전직 바이두 임원이 설립했으며 캘리포니아주 팔로알토에 본사를 두고 있습니다. 젠스파크는 여러 인공지능을 사용하여 실시간으로 맞춤형 검색을 생성한다는 점에서 기존 검색 엔진과 다릅니다.
11개월 전
090.5K
Akash Network:去中心化GPU算力交易平台

아카시 네트워크: 탈중앙 GPU 산술 거래 플랫폼

일반 소개 아카시 네트워크는 블록체인 기술을 기반으로 하는 탈중앙화 클라우드 컴퓨팅 플랫폼으로, 기존 클라우드 컴퓨팅 대기업의 독점을 깨고 보다 효율적이고 비용 효율적이며 유연한 컴퓨팅 리소스 거래 시장을 제공하는 것을 목표로 합니다. 이는 컴퓨팅 리소스가 필요한 사용자와 유휴 컴퓨팅 리소스를 보유한 사용자를 연결하여 이를 수행합니다.
1 년 전
090.5K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

제미니 밸런스: 제미니 모델 API는 OpenAI 형식과 호환되며, 지역 제한을 해제하고 다중 API 키 폴링을 지원합니다.

종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...
1 년 전
090.5K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: 이미지 및 동영상 배경 일괄 제거를 위한 오픈 소스 프로그램으로, RMBG 2.0에 최적화되어 있습니다.

일반 소개 RMBG-2-Studio는 BRIA-RMBG-2.0 모델을 기반으로 개발된 향상된 배경 제거 및 교체 애플리케이션입니다. 이 애플리케이션은 사용자에게 전자상거래, 게임 등 다양한 이미지 유형에 대한 효율적이고 정확한 이미지 배경 처리 기능을 제공하도록 설계되었습니다.
1 년 전
090.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

딥 라이브 캠: 오픈 소스 실시간 AI 얼굴 스와핑 도구, 실시간 라이브 얼굴 스와핑을 위한 사진 제공

일반 소개 딥 라이브 캠은 한 장의 사진으로 실시간 얼굴 교체 및 딥 페이크 비디오 생성을 가능하게 하는 오픈 소스 인공 지능 도구입니다. 이 도구는 고급 딥러닝 알고리즘을 사용하여 라이브 스트리밍 또는 영상 통화 중에 실시간으로 얼굴을 교체하여 사용자의 개인 정보를 보호하고 재미를 더할 수 있습니다.
1 년 전
090.3K
flowith:画布编排式AI内容创作平台,自动化写作与配图

플로우이스: 글쓰기와 일러스트레이션을 자동화하는 캔버스 오케스트레이션 AI 콘텐츠 제작 플랫폼

일반 소개 Flowith는 GPT-4 기반의 AI 생산성 도구입니다. 기존의 채팅 기반 AI 도구와 달리, 멀티 스레드 분산 방식으로 AI와 상호 작용하고 쉽게 작업할 수 있는 최초의 노드 기반 AI 저작 방식을 제공합니다.
1 년 전
090.2K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: OpenAI 형식과 호환되는 Edge TTS를 사용하는 무료 텍스트 음성 변환 API

일반 소개 OpenAI Edge TTS는 OpenAI와 호환되는 네이티브 TTS(텍스트 음성 변환) API를 제공하는 오픈 소스 프로젝트로, 이 프로젝트는 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용하여 사용자가 고품질의 음성 변환을 생성할 수 있도록 합니다.
1 년 전
090.2K
Mubert:免版税的AI配乐生成器|生成符合视频场景的背景音乐

Mubert: 로열티 없는 AI 사운드트랙 생성기|동영상 장면에 어울리는 사운드트랙을 생성하세요.

일반 소개 Mubert는 인간의 창의성과 인공지능 기술을 결합하여 동영상 콘텐츠, 팟캐스트 및 앱에 맞춤형 사운드트랙을 제공하는 플랫폼입니다. 사용자는 Mubert를 사용하여 YouTube, TikTok 및 기타 플랫폼과 같은 콘텐츠의 분위기와 길이에 맞는 사운드트랙을 즉시 생성할 수 있습니다....
2 년 전
090.1K
Outlier:参与AI模型训练的任务发布平台

이상값: AI 모델 학습에 참여할 수 있는 작업 게시 플랫폼

일반 소개 아웃라이어는 전 세계의 전문가를 연결하여 사용자가 AI 모델의 학습과 최적화에 참여할 수 있도록 지원하는 온라인 플랫폼입니다. 사용자는 자신의 전문 지식을 활용하고 유연한 수입을 얻으면서 작업을 완료하여 AI 개발에 기여할 수 있습니다. 이 플랫폼은 다양한 영역의 작업을 지원합니다...
1 년 전
089.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: 비디오를 추출하여 대상 인물 사진을 지정하고, 대상 인물 사진을 생성하는 오픈 소스 도구입니다.

일반 소개 MatAnyone은 싱가포르 난양공과대학교 S-Lab 연구팀이 개발하여 GitHub에 공개한 비디오 키잉에 중점을 둔 오픈 소스 프로젝트입니다. 특히 일관된 메모리 전파 기술을 통해 사용자에게 안정적이고 효율적인 비디오 처리 기능을 제공합니다.
1 년 전
089.8K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

실시간 음성 채팅: AI를 통한 지연 시간이 짧은 자연스러운 음성 대화

일반 소개 리얼타임보이스챗은 음성을 통한 인공 지능과의 실시간 자연스러운 대화에 초점을 맞춘 오픈 소스 프로젝트입니다. 사용자가 마이크를 사용하여 음성을 입력하면 시스템이 브라우저를 통해 오디오를 캡처하여 텍스트로 빠르게 변환하고 대규모 언어 모델(LLM)을 생성하여 다시 ...
12개월 전
089.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

브라우저 사용 웹 UI: 웹 탐색을 위해 AI 인텔리전스를 실행하기 위한 오픈 소스 프레임워크로, AI가 웹 페이지를 자동으로 조작할 수 있습니다.

일반 소개 브라우저 사용 웹 UI는 AI 에이전트에 그래픽 인터페이스 도구로서 브라우저 상호 작용 기능을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 브라우저 사용 핵심 프레임워크 위에 구축된 Gradio를 기반으로 합니다.
11개월 전
089.5K
JanitorAI:角色扮演与互动故事AI

JanitorAI: 롤플레잉 및 인터랙티브 스토리텔링 AI

일반 소개 JanitorAI는 고급 챗봇 기술을 사용하여 사용자가 자신만의 이야기를 만들고 공유할 수 있는 혁신적인 온라인 대화형 스토리 창작 플랫폼을 전문적으로 제공합니다. 간단하고 직관적인 인터페이스로 전문 작가뿐만 아니라 창작과 스토리텔링을 좋아하는 일반 사용자들에게도 적합합니다.
11개월 전
089.5K
LocalAI:开源的本地AI部署方案,支持多种模型架构,WebUI统一管理模型和API

LocalAI: 오픈 소스 로컬 AI 배포 솔루션, 여러 모델 아키텍처 지원, 모델 및 API의 WebUI 통합 관리

일반 소개 LocalAI는 OpenAI, Claude 등과 호환되는 API 인터페이스를 제공하도록 설계된 오픈 소스 로컬 AI 대안입니다. 소비자급 하드웨어에서 실행을 지원하며 GPU가 필요하지 않고 텍스트, 오디오, 비디오, 이미지 생성 및 음성 복제를 여러...에 대해 수행할 수 있습니다.
1 년 전
089.4K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

라이트아바타: 오디오 기반의 실시간 인터랙티브 디지털 인물 2D 초상화, CPU에서 30fps로 실행됨

일반 소개 LiteAvatar는 HumanAIGC 팀(Ali의 일부)이 개발한 오픈 소스 도구로, 오디오로 구동되는 2D 아바타에서 실시간으로 얼굴 애니메이션을 생성하는 데 중점을 두고 있습니다. CPU에만 의존하여 초당 30프레임(fps)으로 실행되며, 특히 다음과 같은 경우에 적합합니다.
1 년 전
089.4K
PopAI:文档生成AI助手|PPT|流程图|文章|文档对话|解释图片

PopAI: 문서 생성 AI 도우미|PT|흐름도|문서|문서 대화|그림 설명하기

종합 소개 PopAI는 혁신적인 AI 기술을 통해 교육 시나리오의 적용을 개선하고 개인화된 학습 경험을 제공하는 데 전념하고 있으며, 다양한 AI 도구를 통합하여 문서 상호 작용, 이미지 생성 및 PPT 작성을 향상시키는 스마트 워크스페이스 플랫폼입니다. PopAI는 국내의 제로...
2 년 전
089.2K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: 네이티브 AI 모델 대화 및 문서 검색을 위한 웹 어시스턴트 플러그인

일반 소개 페이지 어시스트는 사용자가 로컬 AI 모델과 쉽게 상호작용할 수 있도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. 이 확장 프로그램을 사용하면 모든 웹 페이지에서 사이드바를 열어 로컬에서 실행 중인 AI 모델과 상호 작용할 수 있습니다.Page Assi...
1 년 전
089.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

워터마크 제거: 오픈 소스 이미지 워터마크 제거 도구, 사진 워터마크 복구 원본 이미지

일반 소개 워터마크 제거는 이미지 복원을 위해 머신러닝과 딥러닝 기술을 사용하는 오픈 소스 프로젝트로, 특히 이미지에서 워터마크를 제거하는 데 사용됩니다. 이 프로젝트는 침즈루크 오카포가 개발했으며, Con ...
1 년 전
089.2K
Deta Surf:自动整理和总结网页信息的AI浏览器(alpha)

Deta Surf: 웹 페이지의 정보를 자동으로 수집하고 요약하는 AI 브라우저(알파)

일반 설명 Deta Surf는 브라우저, 파일 관리자, AI 어시스턴트를 결합하여 사용자의 디지털 생활을 간소화하는 혁신적인 도구입니다. Deta GmbH에서 개발한 이 도구는 로컬 데이터 저장 우선 전략을 통해 사용자 개인 정보 보호와 데이터 보안을 보장합니다. AI 기술을 통해...
1 년 전
089.1K
Vizard:长视频自动剪辑为适合社交媒体推广的爆款短视频

Vizard: 긴 동영상이 소셜 미디어 홍보에 적합한 짧고 폭발적인 동영상으로 자동 편집됩니다.

일반 소개 블루펄스의 Vizard는 인공 지능 기술을 사용하여 사용자가 긴 동영상을 짧은 소셜 미디어 클립으로 빠르게 변환할 수 있도록 도와주는 온라인 도구입니다. 콘텐츠 제작자, 마케터, 교육자를 위해 설계된 이 도구는 동영상에서 가장 좋은 순간을 자동으로 식별하여 다음에 적합한 짧은 클립을 생성합니다.
1 년 전
089K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: 전문 4 패널 만화 일러스트레이션 제작 도구, 이미지 생성, 만화 페이지 편집

일반 소개 SP-MangaEditer는 만화 창작자를 위해 설계된 독립적인 만화 편집 플랫폼입니다. 이 플랫폼은 이미지 생성, 레이어 편집, 이미지 조정, 필터 적용 및 기타 여러 기능을 지원하여 사용자가 고품질의 만화 일러스트를 쉽게 만들 수 있도록 도와줍니다. 사용자는 간단하게 조작할 수 있습니다.
1 년 전
088.9K
AnyVoice:在线免费克隆声音,只要3秒实现语音克隆

AnyVoice: 단 3초 만에 무료 온라인 음성 복제가 가능합니다!

일반 소개 AnyVoice는 초현실적인 음성 생성 및 음성 복제 서비스를 제공하는 고급 AI 음성 생성 플랫폼입니다. 이 플랫폼을 통해 사용자는 텍스트를 자연스러운 음성으로 변환하고 수백 개의 사전 설정된 음성 중에서 선택할 수 있습니다. 적합한 음성을 찾을 수 없다면...
1 년 전
088.8K
MiniMind:2小时从零训练26M参数GPT的开源工具

미니마인드: 처음부터 2시간 동안 2600만 개의 매개변수를 교육하는 GPT 오픈 소스 도구

일반 소개 미니마인드는 개발자 징야오공이 만든 오픈 소스 프로젝트입니다. 미니마인드의 핵심 목표는 일반인들도 자신의 AI 모델을 빠르게 훈련할 수 있도록 하는 것입니다. 미니마인드의 주요 기능은 단일 NVIDIA에서 2시간을 사용하는 것입니다.
1 년 전
088.5K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI: 커스텀 LLM 애플리케이션을 위한 노드 드래그 앤 드롭 인터페이스 구축

일반 소개 FlowiseAI는 개발자가 맞춤형 LLM(대규모 언어 모델) 애플리케이션과 AI 에이전트를 구축할 수 있도록 설계된 오픈 소스 로우코드 툴입니다. 간단한 드래그 앤 드롭 인터페이스를 통해 사용자는 LLM 애플리케이션을 빠르게 생성하고 반복할 수 있어 테스트부터 생산에 이르는 프로세스를 더욱 효율적으로 진행할 수 있습니다.
1 년 전
088.5K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: 사진 한 장, 여러 무료 동영상 생성 도구로 디지털 사람의 음성 동영상을 생성하세요.

일반 설명 Vidnoz는 1분 이내에 AI 동영상을 빠르게 제작할 수 있는 무료 AI 동영상 생성 플랫폼입니다. 비용, 다운로드 또는 경험이 필요하지 않습니다. 이 플랫폼은 500개 이상의 AI 아바타, 470개 이상의 사실적인 AI 보이스오버, 500개 이상의 템플릿을 제공합니다. Vidnoz AI 동영상으로...
2 년 전
088.4K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: 이미지 및 비디오 얼굴 복원, 오래된 사진 복원, 원클릭 배포 버전 제공

코드포머 일반 소개 코드포머는 난양공과대학교 S-Lab 연구팀이 개발한 강력한 시각장애인 얼굴 복구를 위한 코드베이스로, NeurIPS 2022에서 발표되었습니다. 이 프로젝트는 코드북 룩업 트랜스포머(C ...
2 년 전
088.4K