AI 공유 서클

왕을 위해 전당포와 나눔을 실천하는 날!
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)

1-2-1-MNVTON: 효율적인 이미지, 동영상 속 사람이 가상으로 옷을 입어보는 기능(오픈 예정)

일반 소개 1-2-1-MNVTON은 "가상 트라이온을 위한 모달리티별 정규화"(MNVTON) 기술을 제공하는 것을 목표로 하는 GitHub 기반 오픈 소스 프로젝트입니다....
1 년 전
048.9K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: 다국어 및 다중 음성을 지원하는 효율적인 텍스트 음성 변환 도구

종합 소개 Kokoro-ONNX는 ONNX 런타임을 기반으로 하는 오픈 소스 텍스트 음성 변환(TTS) 도구입니다. 이 프로젝트는 효율적이고 빠른 음성 합성 솔루션을 제공하는 것을 목표로 하며, Kokoro-ONNX는 ...
1 년 전
0103K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, 마크다운으로 이미지 변환, 시각적 모델 고정밀 OCR

일반 소개 Zerox는 시각적 모델을 통해 PDF, DOCX, 이미지 및 기타 문서를 마크다운 형식으로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 getomni-ai 팀에 의해 개발되었으며 간단하고 효율적인 OCR(광학 문자 인식) 솔루션을 제공합니다.Ze ...
1 년 전
074.6K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: 동영상 하이라이트를 자동으로 편집하고 전문적인 브이로그를 손쉽게 제작하세요.

종합 소개 AIVLOG는 브이로그 제작자를 위해 설계된 AI 동영상 편집 도구입니다. 동영상 콘텐츠를 자동으로 분석하고 하이라이트를 지능적으로 편집하여 사용자의 편집 시간을 95% 절약할 수 있습니다. 일상 생활, 여행 기록, 대화 등 어떤 영상이든 AIVLOG는 쉽게...
1 년 전
063.6K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

일반 설명 Charla는 모국어 모델과 대화할 수 있도록 설계된 엔드포인트 기반 채팅 애플리케이션입니다. 이 애플리케이션은 Ollama 백엔드와 통합되어 문맥 인식 대화를 지원하며 채팅 세션을 마크다운 파일로 저장합니다. 사용자는 간단히...
1 년 전
059.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

Windsurf Wave 2 주요 업데이트: 엔터프라이즈 하이브리드 배포 버전으로 웹 검색 및 자동화된 메모리 도입

코듐은 최근 웹 검색, 자동화된 메모리, 코드 실행 최적화 등 개발자를 위한 몇 가지 중요한 기능 업그레이드를 제공하는 윈드서프 웨이브 2 업데이트를 출시했습니다. 상위 2위의 AI 코딩 도구인 이 업데이트는 20가지 기능을 제공하도록 설계되었습니다.
1 년 전
050.1K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

Google, 안정적인 검색 강화 제너레이티브 애플리케이션 구축을 위한 원스톱 상점인 Vertex AI RAG 엔진 출시

생성형 AI와 대규모 언어 모델링(LLM)은 산업을 혁신하고 있지만, 두 가지 주요 과제, 즉 환멸(부정확하거나 의미 없는 정보 생성)과 학습 데이터 이상의 제한된 지식이 기업 도입을 방해할 수 있습니다. 검색 증강 생성(RAG) 및 접지 ...
1 년 전
050.7K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

포괄적인 소개 MiniRAG는 이기종 그래프 인덱싱과 경량 토폴로지 강화 검색을 통해 작은 모델에서도 우수한 RAG 성능을 구현하는 것을 목표로 하는 매우 간단한 검색 증강 생성(RAG) 프레임워크입니다. 홍콩대학교 데이터 과학 연구소(HKUDS)에서 개발한 이 프레임워크는 ...
1 년 전
061.4K
Perplexity AI 提出与美国 TikTok 合并(收购)的竞标方案

퍼플렉시티 AI, 미국 기반 틱톡과 합병(인수) 입찰 제안

요점: 퍼플렉시티 AI는 토요일에 퍼플렉시티가 틱톡의 미국 사업부와 합병할 것을 제안하는 입찰서를 틱톡의 모회사인 바이트댄스에 제출했다고 CNBC가 보도했습니다. 상황에 익숙한 소식통은 다음과 같이 밝혔습니다.
1 년 전
040.8K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델

종합 소개 Omni-RGPT는 이미지와 동영상에 대한 영역 수준의 이해를 가능하게 하도록 설계된 멀티모달 대규모 언어 모델입니다. 토큰 마크 기술을 도입함으로써 Omni-RGPT는 시각적 특징 공간에서 영역 단서(예: 상자 또는...)로 대상 영역을 강조 표시할 수 있습니다.
1 년 전
061.9K