AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

Ollama OCR: Ollama의 시각적 모델을 사용하여 이미지에서 텍스트 추출

종합 소개 Ollama OCR은 Ollama 플랫폼에서 제공하는 최첨단 시각 언어 모델을 사용하여 이미지에서 텍스트를 추출하는 강력한 광학 문자 인식(OCR) 툴킷입니다. 이 프로젝트는 Python 패키지로 제공되며 사용자 친화적인 Strea...

1 년 전

0104.4K

FitDiT: 의류 디테일의 사실감을 높여주는 고충실도 AI 가상 피팅 도구

종합 소개 FitDiT는 확산 변압기(확산 트랜스포머)를 기반으로 한 고충실도 가상 피팅 시스템입니다. 텐센트 AI 랩에서 개발한 이 프로젝트는 의류 디테일을 보여주는 기존 가상 피팅 시스템의 한계를 해결하는 것을 목표로 합니다.FitD...

1 년 전

060.4K

Thin-Plate-Spline-Motion-Model：静态人像图参考视频人像动作生成视频

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

일반 소개 박판 스플라인 모션 모델은 CVPR 2022에서 발표된 획기적인 이미지 애니메이션 생성 프로젝트입니다. 이 프로젝트는 박판 스플라인 변환 이론을 기반으로 하며, 주행 영상을 기반으로 정지 이미지에서 고품질의 모션을 구현할 수 있습니다.

1 년 전

056.7K

DUIX: 실시간 상호 작용을 위한 지능형 디지털 인력, 멀티 플랫폼 원클릭 배포 지원

일반 소개 DUIX(대화 사용자 인터페이스 시스템)는 실리콘 인텔리전스에서 만든 AI 기반 디지털 인간 상호작용 플랫폼입니다. 오픈 소스 디지털 인간 상호 작용 기능을 통해 개발자는 대규모 모델, 자동 음성 인식(ASR)을 쉽게 통합할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

071.2K

페이 디지털 휴먼 프레임워크: 언어 모델과 3D 디지털 캐릭터를 통합하여 다양한 애플리케이션 시나리오 지원

종합 소개 페이는 가상 쇼핑 가이드, 가상 앵커, 비서, 웨이터, 교사, 음성 또는 텍스트 기반 모바일 비서 등 다양한 애플리케이션 시나리오를 위해 언어 모델과 디지털 캐릭터를 통합하는 오픈 소스 3D 가상 디지털 휴먼 프레임워크입니다.페이 프레임워크는 완전한 오프라인 사용을 지원하여 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

066.9K

MOFA 비디오: 정지 이미지를 비디오로 변환하는 모션 필드 적응 기술

일반 소개 MOFA-Video는 제너레이티브 모션 필드 적응 기술을 활용하여 정적인 이미지를 동적인 동영상으로 변환하는 최첨단 이미지 애니메이션 생성 툴입니다. 이 도구는 도쿄대학교 및 텐센트 AI 연구소와 공동으로 개발되었으며, 2024년 유럽 컴퓨터 비전 컨퍼런스에서 발표될 예정입니다(E...

1 년 전

051.2K

Amurex: 오픈 소스 AI 회의 녹음 도우미, 회의 내용을 자동으로 녹음하여 요약을 생성합니다.

일반 소개 Amurex는 지능형 기능을 통해 회의 효율성을 개선하도록 설계된 The Personal AI Company에서 개발한 오픈 소스 AI 회의 도우미로, 실시간 조언 제공, 지능형 요약 생성, 회의 내용 기록, 자동 팔로우 전송이 가능합니다.

1 년 전

064.1K

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.

1 년 전

066.2K

에이전트 실험실: 연구자를 위한 자동화된 코드 및 연구 작성 도우미

종합 소개 에이전트 실험실은 연구자가 연구 아이디어를 실현할 수 있도록 설계된 엔드투엔드 자율 연구 워크플로우입니다. 이 시스템은 문헌 검토 및 계획 개발부터 실행까지 전체 연구 워크플로우를 지원하는 대규모 언어 모델에 기반한 전용 에이전트로 구성되어 있습니다.

1 년 전

056.6K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Kokoro TTS API: 빠른 텍스트 음성 변환을 위한 도커화된 FastAPI 래퍼(Kokoro-82M 모델)

일반 소개 Kokoro-FastAPI는 Kokoro-82M 텍스트 음성 변환 모델을 지원하도록 설계된 Docker 기반 FastAPI 래퍼입니다. 이 프로젝트는 NVIDIA GPU 가속을 지원하며 큐 처리 및 자동 접합 기능을 제공합니다.

1 년 전

0128K

CoolCline：又一个增强版Cline智能编码助手，结合ClineRoo Cline和Bao Cline的优点

쿨클라인: 클라인루 클라인과 바오 클라인의 장점을 결합한 클라인의 지능형 코딩 어시스턴트의 또 다른 향상된 버전입니다.

일반 설명 쿨클라인은 클라인, 루클라인, 바오클라인의 최고의 기능을 결합한 강력한 코딩 어시스턴트입니다. 명령줄 인터페이스(CLI) 및 편집기와 원활하게 작동하여 가장 강력한 기능을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

063K

J.A.R.V.I.S.：具有上下文感知的智能代码助手，生成和修改代码，多IDE支持

J.A.R.V.I.S.: 상황 인식 지능형 코드 어시스턴트, 코드 생성 및 수정, 다중 ID 지원

일반 소개 J.A.R.V.I.S.(Just A Rather Very Intelligent System)는 개발자가 여러 최신 언어 모델을 사용하여 코드를 생성, 수정 및 기술 토론을 할 수 있도록 설계된 지능형 코드 도우미입니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

083.7K

AI 투자 시스템: 시장 데이터 분석을 위해 다중 지능 시스템을 사용하는 자동화된 A주 투자 의사결정 시스템

종합 소개 A_Share_investment_Agent는 다중 지능 시스템에 기반한 A주 투자 의사 결정 보조 시스템입니다. 이 시스템은 여러 협업 지능을 통해 시장 데이터를 분석하고, 주식의 내재 가치를 계산하고, 시장 심리 및 펀더멘털 데이터를 분석하여 다음과 같은 작업을 수행하도록 설계되었습니다.

1 년 전

072.7K

Company Researcher：公司研究工具，输入公司网址以获取详细研究信息

회사 리서치: 회사 리서치 도구로, 회사의 웹 주소를 입력하면 자세한 리서치 정보를 확인할 수 있습니다.

일반 설명 회사 리서처(Company Researcher)는 사용자가 모든 회사에 대한 빠르고 포괄적인 개요를 얻을 수 있도록 설계된 무료 오픈 소스 도구입니다. 회사의 URL을 입력하기만 하면 이 도구가 웹에서 포괄적인 정보를 수집하여 조직, 제품 등에 대한 정보를 표시합니다.

1 년 전

048.8K

GitPodcast: GitHub 리포지토리를 팟캐스트로 전환하고 언제 어디서나 코드 업데이트를 들을 수 있습니다!

일반 소개 GitPodcast는 개발자가 언제 어디서나 코드 업데이트를 들을 수 있도록 GitHub 리포지토리를 팟캐스트로 전환하도록 설계된 혁신적인 도구입니다. OpenAI 및 Azure Speech SDK를 사용하여 GitPodca...

1 년 전

050.4K

Paperless-AI：使用AI自动分析和标记文档，适用 paperless-ngx 文档管理系统

Paperless-AI: 종이 없는 문서 관리 시스템을 위해 AI를 사용하여 문서를 자동으로 분석하고 태그를 지정합니다.

일반 소개 Paperless-AI는 Paperless-ngx 문서 관리 시스템을 위해 특별히 설계된 혁신적인 문서 자동화 분석 도구입니다. 이 도구는 OpenAI API를 다음과 같은 다양한 고급 AI 모델과 스마트하게 결합합니다.

1 년 전

0125.3K

코스모스: 세계 기본 모델, 물리적 세계의 AI 기본 모델을 구축하기 위한 플랫폼

포괄적인 소개 NVIDIA Cosmos는 개발자를 위한 월드 기반 모델링 플랫폼으로, 물리 AI 개발자가 물리 AI 시스템을 더 빠르고 효율적으로 구축할 수 있도록 특별히 설계되었습니다. 이 플랫폼은 확산 및 자동 회귀 월드 기반 등 다양한 사전 훈련된 모델을 제공합니다.

1 년 전

060.5K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

미니 LLM 흐름: 100줄의 코드로 '지시형 그래프 구조'로 LLM 미니 인텔리전트 구축하기

일반 소개 miniLLMFlow는 100줄의 핵심 코드만 포함된 미니멀한 대규모 언어 모델(LLM) 개발 프레임워크로, '단순함 유지'라는 디자인 철학을 보여줍니다. 이 프레임워크는 AI 어시스턴트(예: ChatGPT, Claude 등)가 다음을 수행할 수 있도록 특별히 설계되었습니다.

1 년 전

057.9K

Xiaozhi AI 챗봇: AI 채팅 동반자, 간편한 음성 대화 및 지능적인 상호 작용을 구축하세요.

종합 소개 샤오지 AI 챗봇은 ESP32 개발 보드를 기반으로 하는 오픈 소스 프로젝트로, 사용자가 자신만의 AI 채팅 동반자를 구축할 수 있도록 설계되었습니다. 이 프로젝트는 Shrimp에서 개발했으며 주로 더 많은 사람들이 AI 하드웨어 개발을 시작하고 대규모 언어 모델을 실제에 적용하는 방법을 이해할 수 있도록 돕기 위한 교육 목적으로 사용됩니다.

1 년 전

0218.2K

OpenAI Realtime API Next.js：构建实时语音对话AI应用的Next.js模板

OpenAI 실시간 API Next.js: 실시간 음성 대화 AI 애플리케이션을 구축하기 위한 Next.js 템플릿

포괄적인 소개 OpenAI 실시간 API Next.js는 개발자가 실시간 음성 AI 애플리케이션을 빠르게 구축할 수 있도록 설계된 Next.js 프레임워크 기반의 오픈 소스 프로젝트입니다. 이 프로젝트는 OpenAI의 실시간 API와 WebRTC 기술을 통합하여 ...

1 년 전

049.7K

Auto-Coder.Chat：基于终端命令行的AI辅助编程助手，提供VSCode插件

Auto-Coder.Chat: 터미널 명령줄 기반 AI 지원 프로그래밍 도우미(VSCode 플러그인 포함)

일반 소개 Auto-Coder.Chat은 지능형 수단을 통해 개발자의 프로그래밍 효율성을 향상시키기 위해 설계된 터미널 기반 AI 지원 프로그래밍 도구입니다. 이 도구는 모든 IDE와 함께 사용하여 개발 도구에서 AI 지원 프로그래밍을 활성화할 수 있습니다.Auto...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

12개월 전

053.8K

Kokoro: 자연스럽고 부드러운 음성을 생성하는 효율적인 음성 합성 모델

일반 소개 Kokoro 82M은 더 적은 매개변수와 데이터로 고품질의 음성을 생성하도록 설계된 Hugging Face에서 제공하는 효율적인 음성 합성 모델입니다. 이 모델에는 8,200만 개의 파라미터가 있으며 Apache 2.0에 따라 라이센스가 부여되어 있습니다.

1 년 전

070.4K

WrenAI: 답변, SQL 쿼리 및 분석 보고서에 직접 액세스할 수 있는 대화형 데이터 분석 AI 도우미

일반 소개 WrenAI는 데이터 팀, 제품 팀, 비즈니스 팀이 자연어 대화를 통해 데이터 인사이트를 얻을 수 있도록 특별히 설계된 오픈 소스 SQL AI 어시스턴트입니다. 자연어를 SQL 쿼리로 변환하고, 차트, 스프레드시트 및 보고서를 생성하고, 다국어를 지원할 수 있습니다.

1 년 전

086.5K

Activepieces：AI工作流程自动化，适合非技术用户的任务编排工具，开源Zapier替代品

액티브피스: AI 워크플로 자동화, 비기술 사용자를 위한 작업 스케줄링 도구, 오픈 소스 Zapier 대체 도구

일반 소개 Activepieces는 기업과 개인 사용자에게 직관적이고 강력한 자동화 솔루션을 제공하는 데 중점을 둔 오픈 소스 올인원 자동화 워크플로 플랫폼입니다. TypeScript로 개발된 이 플랫폼은 확장성이 뛰어나며 200개 이상의 통합 서비스를 지원합니다.

1 년 전

070.4K

k8m: Kubernetes 클러스터 관리를 간소화하는 경량 AI 콘솔 도구

일반 소개 k8m은 클러스터 관리를 간소화하도록 설계된 경량의 크로스 플랫폼 미니 Kubernetes AI 대시보드입니다. AMIS를 기반으로 구축되었으며 kom을 통해 Kubernetes API 게스트로 사용할 수 있습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

063.4K

SHMT: 자체 감독 계층적 메이크업 전송 모델, 가상 메이크업, 새로운 인물 사진으로의 메이크업 마이그레이션

종합 소개 SHMT(자기 지도 계층적 메이크업 전송)는 잠재 확산 모델을 기반으로 한 자기 지도 계층적 메이크업 마이그레이션 프로젝트로, 비지도 학습 방법을 통해 고품질의 메이크업 효과를 달성하는 것을 목표로 합니다....

1 년 전

053.8K

VITA: 실시간 시각 및 음성 상호 작용을 위한 오픈 소스 멀티모달 대규모 언어 모델

일반 소개 VITA는 선도적인 오픈 소스 대화형 대규모 언어 모델링 프로젝트로, 진정한 완전한 멀티모달 상호 작용을 구현하는 기능을 개척하고 있습니다. 이 프로젝트는 2024년 8월에 VITA-1.0을 출시하여 최초의 오픈 소스 대화형 완전 모달 대규모 언어 모델을 개척했습니다.2024...

1 년 전

090.2K

Trend Finder：实时追踪社交媒体趋势、热门话话题和新原文，助力营销决策

트렌드 파인더: 마케팅 의사 결정을 위해 소셜 미디어 트렌드, 인기 주제 및 새 게시물을 실시간으로 추적합니다.

일반 소개 트렌드 파인더는 사용자가 소셜 미디어에서 인기 있는 주제와 트렌드를 실시간으로 추적할 수 있도록 설계된 강력한 도구입니다. 트렌드 파인더는 주요 인플루언서들의 게시물을 수집하고 분석하여 새로운 트렌드나 제품 출시를 적시에 감지할 수 있습니다.

1 년 전

092K

AI 지마쿠 구미: AI의 도움으로 동영상에 대한 다국어 자막 자동 생성 및 번역

일반 소개 AI 자막 그룹은 자동화된 동영상 자막 추출, 전사 및 번역 기능을 지원하는 데 중점을 둔 강력한 명령줄 동영상 자막 처리 도구입니다. 이 도구는 위스퍼 스피치를 포함한 고급 AI 기술을 통합합니다...

1 년 전

062.3K

TransRouter: Gemini 멀티모달 모델을 기반으로 중국어에서 영어로 번역하는 실시간 오디오 변환 도구

TransRouter는 영어와 중국어 간의 실시간 음성 번역을 위해 특별히 설계된 Google의 Gemini 모델을 기반으로 하는 실시간 음성 번역 도구입니다. 이 도구는 Zoom과 같은 화상 회의 소프트웨어에 원활하게 통합되어 언어 간 번역을 위한 강력한 도구를 제공합니다.

1 년 전

058.3K

opensource_notebooklm：基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3 및 PlayHT TTS를 기반으로 하는 NotebookLM의 오픈 소스 구현

일반 소개 오픈 소스 노트북LM은 딥시크-V3의 언어 이해 기능과 PlayHT의 음성 합성 기술을 결합한 혁신적인 인공지능 프로젝트로, 지능형 노트 필기 대화 시스템을 만드는 것을 목표로 합니다. 이 프로젝트는 Build Fast w에서 개발했습니다.

1 년 전

062.6K

오픈 딥 리서치: 웹 검색 콘텐츠에 기반한 AI 연구 생성

일반 소개 오픈 딥 리서치는 구글 제미니의 딥 리서치 기능을 대체하는 오픈 소스 AI 기반 리서치 보고서 생성 도구입니다. 이 프로젝트는 타입스크립트로 개발되었으며 Next.js 1...

1 년 전

062K

Vision is All You Need：使用视觉语言模型构建智能文档检索系统（Vision RAG）

비전만 있으면 충분합니다: 시각 언어 모델을 사용한 지능형 문서 검색 시스템 구축(Vision RAG)

종합 소개 Vision-is-all-you-need는 시각 언어 모델링(VLM)을 문서 처리 영역에 적용하는 새로운 지평을 여는 혁신적인 시각적 RAG(검색 증강 생성) 시스템 데모 프로젝트입니다. 기존의 텍스트 청킹 방식과 달리 이 시스템은 직접적으로 ...

1 년 전

048.3K

Scira（MiniPerplx）：模仿Perplexity的开源项目，集成AI对话、网页搜索、天气查询等功能

Scira(미니퍼플엑스): 퍼플렉시티를 모방한 오픈 소스 프로젝트로, AI 대화, 웹 검색, 날씨 쿼리 등을 통합합니다.

일반 소개 미니퍼플엑스(Scira로 명칭 변경)는 미니멀하게 디자인된 AI 기반 검색 엔진으로, 다양한 유용한 기능을 통합하여 사용자에게 모든 범위의 정보 검색 서비스를 제공합니다. 이 프로젝트는 Next.js, Tailwi...를 포함한 최신 기술 스택을 사용합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

1 년 전

071.6K

Diffbot GraphRAG LLM：依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: 외부 실시간 지식 그래프 데이터에 기반한 LLM 추론 서비스

종합 소개 Diffbot LLM Reasoning Server는 LLama 모델 아키텍처를 기반으로 특별한 최적화와 개선이 이루어진 혁신적인 대규모 언어 모델링 시스템입니다. 이 프로젝트의 가장 중요한 특징은 실시간 지식 그래프와 검색 기능이 강화된 생성 기능을 통합한 것입니다.

1 년 전

057.8K

JupyterLab Magic Wand：在JupyterLab中使用AI助手提升工作效率

JupyterLab 매직완드: 생산성 향상을 위한 JupyterLab의 AI 어시스턴트 사용

일반 소개 JupyterLab Magic Wand는 JupyterLab 노트북에 내장된 AI 비서 기능을 제공하기 위해 고안된 실험적인 JupyterLab 확장 프로그램입니다. 이 확장 프로그램은 데이터 과학자를 향상시키기 위해 Zsailer가 개발했습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

048.7K

LuminaBrush: 스마트 페인트 도구로 이미지에 조명 추가하기

일반 소개 LuminaBrush는 인공 지능 기술로 구동되는 조명 효과를 위한 혁신적인 대화형 이미지 편집 도구입니다. 이 프로젝트는 2단계 프레임워크를 사용하여 이미지를 처리합니다. 첫 번째 단계에서는 입력 이미지를 "균일한 조명" 모양으로 변환하고 두 번째 단계에서는...

1 년 전

053.7K

MetaGPT: 자연어 프로그래밍을 위한 AI 소프트웨어 개발 팀을 구축하기 위한 다중 지능체 협업 프레임워크

종합 소개 MetaGPT는 완전한 AI 소프트웨어 회사의 운영을 시뮬레이션하도록 설계된 혁신적인 다중 지능 바디 프레임워크입니다. 이 프로젝트의 목표는 서로 다른 역할을 하는 GPT 모델을 협업 엔티티로 결합하는 것입니다....

1 년 전

077.9K

Groq AppGen：使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: Groq API를 사용하여 Llama 3.3 70B HTML 코드 생성 기능을 시연하는 실험 프로젝트

일반 소개 Groq AppGen은 혁신적인 대화형 웹 애플리케이션 생성기로, Groq에서 개발하여 오픈소스로 제공하고 있습니다. 이 프로젝트는 HTML 코드 생성을 위한 Llama 3.3 70B 모델의 강력한 성능을 보여줍니다. Groq을 통합함으로써 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

054K

llms.txt Generator：快速抓取网站内容并，生成LLM训练文本数据集

llms.txt 생성기: 웹사이트 콘텐츠를 빠르게 캡처하고 LLM 교육 텍스트 데이터 세트를 생성합니다.

종합 소개 llmstxt-generator는 대규모 언어 모델링(LLM)의 학습 및 추론을 위한 고품질 텍스트 데이터 세트 준비에 특화된 전문 웹 콘텐츠 추출 및 통합 도구입니다. 이 도구는 Mendable AI에서 @firec...

1 년 전

054.7K

Roo Code（Roo Cline）：基于Cline的增强版自主编程助手，智能化IDE编程助手

Roo Code(Roo Cline): 지능형 IDE 프로그래밍 어시스턴트인 Cline 기반의 향상된 자율 프로그래밍 어시스턴트

일반 소개 Roo Code (구 Roo Cline)Roo Code (Roo Cline)는 강력한 VS Code 확장 플러그인인 Cline을 기반으로 하는 향상된 자율 프로그래밍 도우미입니다. 이 도구는 세트에서 사용할 수 있습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

0127.4K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

레이캐스트-G4F: 레이캐스트를 통해 GPT-4, 라마-3 및 기타 여러 AI 모델에 무료로 액세스하세요!

일반 소개 레이캐스트-G4F(GPT4Free)는 사용자가 GPT-4, 라마-3을 포함한 다양한 고급 AI 모델에 무료로 액세스할 수 있는 강력한 레이캐스트 확장 프로그램입니다. 이 확장 프로그램은 실시간 대화 스트리밍을 제공할 뿐만 아니라...

1 년 전

062.3K

Gemini Search：Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini 검색: Gemini 2.0 Flash에 내장된 퍼플렉서티 스타일의 AI 검색 엔진

포괄적 인 소개 Gemini-Search는 Google Gemini 2.0 기술을 기반으로하는 오픈 소스 지능형 검색 엔진 프로젝트입니다. 이 프로젝트는 타입스크립트 개발을 사용하며, 퍼플렉시티 검색 엔진을 복제하는 데 전념하고 있습니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

1 년 전

060.1K

Devin.cursorrules：增强Cursor IDE开发体验，将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: 커서 IDE 개발 환경 개선, 커서/윈드서핑을 Devin과 같은 지능형 프로그래밍 도우미로 만들기

일반 소개 Devin.cursorrules는 저렴한 커서 또는 윈드서프 IDE(~$20)를 Devin과 같은 강력한 AI 프로그래밍 도우미로 변환하도록 설계된 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 일련의 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

059.3K

하나의 허브: 여러 모델 및 통계 기능을 지원하는 OpenAI 인터페이스 관리 및 배포

일반 소개 원 허브는 원 API의 2차 개발을 기반으로 한 오픈AI 인터페이스 관리 및 배포 시스템입니다. 더 광범위한 모델 지원과 향상된 통계 기능을 제공하기 위해 MartialBE에서 개발했습니다.One Hub에는 다음과 같은 기능이 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

063.5K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

Fish Agent: 엔드투엔드 AI 음성 복제 어시스턴트, 실시간 음성 대화 어시스턴트, Fish Speech 스핀오프 프로젝트

종합 소개 물고기 음성 파생 프로젝트 물고기 에이전트는 V0.1 3B 모델 아키텍처를 기반으로 개발된 혁신적인 엔드투엔드 AI 음성 복제 시스템입니다. 완전한 엔드투엔드 음성 복제 처리 시스템으로서, 가장 중요한 특징은 혁신적인 말없는 ...

1 년 전

070.8K

FunClip: 비디오 콘텐츠를 단편 영화로 지능적으로 편집하고 정확한 비디오 클립 추출/자르기를 쉽게 수행할 수 있습니다.

종합 소개 펀클립은 알리바바 달마 연구소의 통이 스피치 랩에서 개발한 완전 오픈 소스 현지화 자동 동영상 편집 도구입니다. 이 도구는 비디오의 음성을 정확하게 식별할 수 있는 산업 등급의 Paraformer-Large 음성 인식 모델을 통합합니다.

1 년 전

0110.1K

Dify-WebUI：基于Dify API的桌面智能对话客户端，提供企业级AI对话能力

Dify-WebUI: Dify API 기반의 데스크톱 지능형 대화 클라이언트로, 엔터프라이즈급 AI 대화 기능을 제공합니다.

종합 소개 Dify-WebUI는 기업에 강력한 AI 대화 기능을 제공하도록 설계된 Dify API 기반의 최신 데스크톱 지능형 대화 애플리케이션입니다. 이 애플리케이션은 기업의 개별 요구 사항을 충족하기 위해 다양한 사전 설정 테마 색상을 지원하며 지식 기반 관리 기능을 통해 다음을 지원합니다.

1 년 전

079.4K

샤오홍슈 AI 운영 도우미: 샤오홍슈 기사 자동 생성 및 게시

종합 소개 샤오홍슈 AI 운영 도우미(xhsaipublisher)는 샤오홍슈 플랫폼에 기사를 게시하기 위해 설계된 자동화 도구입니다. 이 프로젝트는 그래픽 사용자 인터페이스와 자동화 스크립트를 결합하여 빅 모델 기술을 사용하여 콘텐츠를 생성하고 브라우저를 통해 자동으로 로그인하고 게시할 수 있습니다.

1 년 전

083.9K

微信Markdown编辑器：简洁高效的微信图文排版工具，一键粘贴文章到微信公众号

위챗 마크다운 에디터: 간단하고 효율적인 위챗 그래픽 레이아웃 도구, 위챗 공개 번호에 기사를 붙여넣는 열쇠입니다.

종합 소개 WeChat 마크다운 편집기(WeChat 마크다운 편집기)는 사용자가 아름다운 WeChat 게시물을 쉽게 작성할 수 있도록 설계된 매우 간결한 WeChat 그래픽 레이아웃 도구입니다. 이 에디터는 모든 기본 마크다운을 지원합니다.

1 년 전

073.3K

오케스트라: 더 쉽고 효율적인 협업 다중 지능 개발을 위한 스마트 AI 팀 구축

오케스트라는 대규모 언어 모델(LLM)을 기반으로 다중 지능 협업 시스템을 구축하는 데 중점을 둔 혁신적인 경량 Python 프레임워크입니다. 여러 AI 지능이 교향악단처럼 조화롭게 작동할 수 있도록 지능을 배열하는 고유한 방법을 사용합니다. 모델링으로 ...

1 년 전

059.6K

GraphAgent: 작업 계획 및 실행 자동화를 위한 지식 그래프 구축

종합 소개 그래프에이전트는 그래프 생성, 작업 계획, 작업 실행을 통합한 자동화된 지능형 바디 시스템입니다. 정형 및 비정형 데이터 처리, 복잡한 시맨틱 의존성 그래프 구축, 자체 계획 및 도구 매칭을 통해 사용자 작업을 효율적으로 실행할 수 있습니다.그래프...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

1 년 전

051.5K

Harbor: 클릭 한 번으로 로컬 LLM 개발 환경을 배포하고 AI 서비스를 쉽게 관리 및 실행할 수 있는 컨테이너화된 도구 세트입니다.

개요 Harbor는 로컬 AI 개발 환경의 배포와 관리를 간소화하는 데 중점을 둔 혁신적인 컨테이너형 LLM 도구 세트입니다. 깔끔한 명령줄 인터페이스(CLI)와 컴패니언 애플리케이션을 통해 개발자는 클릭 한 번으로 LLM 백엔드, API 인터페이스, 프런트엔드 등을 시작하고 관리할 수 있습니다.

1 년 전

059.6K

탱고플럭스: 30초 분량의 긴 오디오를 3초 만에 생성하는 빠른 텍스트-더빙 변환 도구!

일반 소개 탱고플럭스는 디클레어 랩에서 개발한 효율적인 텍스트-오디오(TTA) 생성 모델입니다. 이 모델은 단 3.7초 만에 최대 30초 분량의 44.1kHz 스테레오 오디오를 생성할 수 있습니다.TangoFlu...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

1 년 전

063.3K

ExtractThinker: 문서를 구조화된 데이터로 추출하고 분류하여 문서 처리 프로세스를 최적화합니다.

포괄적인 소개 ExtractThinker는 LLM(대규모 언어 모델)을 사용하여 문서에서 구조화된 데이터를 추출하고 분류하는 유연한 문서 인텔리전스 도구로, 원활한 ORM과 같은 문서 처리 워크플로우를 제공합니다. Tess를 비롯한 다양한 문서 로더를 지원합니다.

1 년 전

060.1K

NeoAI: AI가 컴퓨터의 원격 작동을 대신하고 자연어를 사용하여 컴퓨터를 제어할 수 있는 오픈 소스 프로젝트

일반 소개 NeoAI는 사용자가 자연어 대화를 통해 컴퓨터를 쉽게 제어하고 관리할 수 있는 혁신적인 오픈 소스 AI 비서 도구입니다. 사용자는 코드를 작성하지 않고도 일상적인 대화만으로 파일 찾기, 작업 자동화, 장치 관리 등을 수행할 수 있습니다.NeoAI...

1 년 전

086K

TryOffAnyone: 사람에서 의류를 타일형 의류 디스플레이 이미지로 추출하는 AI 도구

종합 소개 TryOffAnyone은 이커머스 분야의 의류 디스플레이 문제를 해결하기 위해 특별히 설계된 획기적인 AI 이미지 처리 툴입니다. 실제 사람이 옷을 입은 사진을 평평한 디스플레이 효과 이미지로 지능적으로 변환할 수 있으며, 이 기술은 최신 잠재 차이 기술을 기반으로 합니다.

1 년 전

057.2K

에이전타리움: 여러 AI 인텔리전스 간의 상호작용 관리 및 조정

일반 소개 에이전타리움은 AI 지능형 에이전트(에이전트)를 관리하고 오케스트레이션하는 데 특화된 강력한 Python 프레임워크입니다. 이 프레임워크는 여러 AI 에이전트 간의 상호 작용을 생성, 관리 및 오케스트레이션하는 유연하고 직관적인 방법을 제공합니다. 이 프레임워크는 A...

1 년 전

050.2K

LTX 비디오(LTXV): 고품질 비디오를 생성하기 위한 실시간 비디오 생성의 오픈 소스 모델입니다.

일반 소개 LTX-Video는 라이트릭스에서 개발한 최초의 DiT(확산 변압기) 기반 실시간 동영상 생성 모델입니다. 이 모델은 초당 24프레임의 768x512 해상도로 고품질을 생성할 수 있습니다....

1 년 전

098K

ScrapeGraphAI：一个提示词搞定网页抓取，无需编写规则智能网页内容提取工具

스크랩그래프AI: 웹 크롤링을 위한 한 마디로, 규칙을 작성할 필요가 없는 지능형 웹 콘텐츠 추출 도구

포괄적인 소개 ScrapeGraphAI는 대규모 언어 모델링(LLM)과 직접 그래프 로직을 영리하게 결합하여 웹사이트와 로컬 문서를 위한 스크래핑 파이프라인을 생성하는 혁신적인 Python 웹 스크래핑 라이브러리입니다. 이 도구를 독특하게 만드는 것은 완벽한 수준의 단순성과 강력함입니다...

1 년 전

057.6K

AnkiAIUtils: 메모리 카드를 자동으로 최적화하는 지능형 어시스턴트인 Anki 플래시카드 학습 AI 툴셋

일반 설명 AnkiAIUtils는 Anki 플래시카드 학습 시스템을 위해 설계된 AI 강화 도구 세트입니다. 의대생이 개발한 이 도구는 AI 기술을 통해 사용자가 학습 과정에서 어려움을 겪고 있는 카드를 자동으로 개선하도록 설계되었습니다. 이 도구는 사용자에게 지능적으로 개인화된 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 교육 도구

1 년 전

070.1K

스토리 어댑터: 긴 스토리를 기반으로 연속적이고 일관된 그래픽 일러스트를 생성합니다.

일반 소개 스토리 어댑터는 텍스트 스토리를 일관된 이미지 시퀀스로 변환하는 혁신적인 스토리 시각화 프레임워크입니다. 연구원들이 개발한 이 프로젝트는 고품질 스토리 일러스트를 생성하기 위해 별도의 교육이 필요 없는 반복적인 접근 방식을 채택하고 있습니다. 이 프레임워크는 긴 스토리를 처리할 수 있는 기능이 특징입니다.

1 년 전

061.2K

GitDiagram：可视化GitHub代码库结构，将代码仓库转换为交互式系统架构图

GitDiagram: GitHub 코드 저장소의 구조를 시각화하고 코드 저장소를 대화형 시스템 아키텍처 다이어그램으로 변환합니다.

일반 소개 GitDiagram은 모든 GitHub 리포지토리를 대화형 시스템 아키텍처 다이어그램으로 빠르게 변환하는 혁신적인 GitHub 코드베이스 시각화 도구입니다. 이 도구는 고급 AI 기술(Claude 3.5 Sonnet)을 사용하여 개발자에게 다음과 같은 기능을 제공합니다.

1 년 전

0127.1K

ElizaOS: 자율적으로 실행되는 다중 지능 구축, 완전한 기능을 갖춘 오픈 소스 AI 지능체 개발 프레임워크

포괄적 인 소개 Eliza는 고급 다중 지능형 바디 (다중 에이전트) 개발 프레임 워크이며 자율 지능형 바디 (자율 에이전트) 프로세스의 구성 및 배포를 단순화하기 위해 최선을 다하고 있습니다. 역할 설정이 다른 여러 지능형 바디의 배포를 지원하고 지능적인 ...

1 년 전

079.2K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

전자책2오디오북: 전자책을 오디오북으로 변환, 다국어 지원 및 음성 복제가 가능한 오픈 소스 도구

일반 소개 전자책2오디오북은 강력한 오픈 소스 전자책-오디오북 변환 도구입니다. 여러 형식의 전자책을 전체 챕터 마커와 메타데이터가 포함된 오디오북으로 변환할 수 있습니다. 이 도구는 Calibre를 사용하여 전자책 형식 변환을 위해 Co...

1 년 전

087.4K

Memary: 지식 그래프를 사용하여 에이전트의 장기 기억력을 향상시키는 오픈 소스 프로젝트

일반 소개 Memary는 자율 지능을 위한 장기 메모리 관리 솔루션을 제공하는 데 중점을 둔 혁신적인 오픈 소스 프로젝트입니다. 이 프로젝트는 지식 그래프와 특수 메모리 모듈을 통해 지능이 기존 컨텍스트 윈도우의 한계를 극복하고 더 스마트한 상호 작용 경험을 달성할 수 있도록 지원합니다.Memary는 ...

1 년 전

069.2K

AI reads books：AI逐页阅读PDF书籍，自动提取知识要点并生成总结

AI가 책을 읽습니다: AI가 PDF 책을 한 페이지씩 읽고 지식의 요점을 자동으로 추출하여 요약을 생성합니다.

종합 소개 AI-reads-books-page-by-page는 PDF 책의 페이지별 분석을 자동화하고 핵심 지식 포인트를 추출하며 지정된 페이지 간격 후 단계를 생성하는 Python 기반 지능형 PDF 책 분석 도구입니다....

1 년 전

072.3K

OpenAI WebRTC Python：与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: OpenAI 실시간 API와의 음성 상호작용을 위한 Python 라이브러리

포괄적인 소개 OpenAI 실시간 WebRTC Python은 개발자에게 OpenAI 실시간 API를 사용한 음성 상호작용을 위한 완벽한 솔루션을 제공하는 전문 Python 라이브러리입니다. 이 프로젝트는 지연 시간이 짧은 WebRTC 기술을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

059.7K

Melty: AI 기반 코드 편집기를 경험하고 모든 대화를 Git 커밋으로 만들어 보세요!

일반 소개 Melty는 채팅 대화와 Git 버전 제어를 결합한 혁신적인 AI 코드 편집기입니다. Replicate의 Charlie와 Jackson이 개발한 이 도구는 기존 AI 코딩 도구의 문제점을 해결하는 것을 목표로 합니다. 가장 큰 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

068.3K

Aide: VSCode 개발 환경, 원클릭 주석, 변환 및 코드의 UI 생성을 향상시키는 AI 도우미 확장 프로그램입니다.

일반 소개 AIDE(AI 지원 개발 확장 프로그램)는 독특하고 유용한 AI 프로그래밍 지원을 제공하는 데 중점을 둔 VSCode용 강력한 AI 지원 개발 확장 프로그램입니다. GitHu와는 다릅니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

065.6K

AnyText: 다국어 이미지 텍스트를 생성하고 편집할 수 있으며, 이미지에 여러 줄의 중국어를 생성하도록 고도로 제어할 수 있습니다.

종합 소개 AnyText는 확산 모델을 기반으로 개발된 혁신적인 다국어 시각 텍스트 생성 및 편집 도구입니다. 이미지에서 자연스러운 고품질 다국어 텍스트를 생성하고 유연한 텍스트 편집 기능을 지원합니다. 연구팀이 개발하여 ICLR 2024에서 발표했습니다...

1 년 전

068.2K

AIGCPanel: 디지털 맨 통합 시스템의 오픈 소스 클론, 무료 디지털 맨 클라이언트를 원클릭으로 배포할 수 있습니다.

종합 소개 AigcPanel은 모든 사용자를 위한 원스톱 AI 디지털 휴먼 제작 시스템으로, 전자+뷰3+타입스크립트 기술 스택으로 개발되어 Windows에서 원클릭 배포를 지원합니다. 이 시스템은 핵심인 사용자 친화적으로 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

073.1K

AIEditor: 여러 프런트엔드 프레임워크를 지원하는 AI 기반 서식 있는 텍스트 편집기 만들기

포괄적 인 소개 AIEditor는 웹 구성 요소 개발을 기반으로하는 AI 기반 차세대 리치 텍스트 편집기로, Vue, React, Angular 및 기타 거의 모든 주류 프런트 엔드 프레임 워크를 지원합니다. 그것은 PC 웹과 호환되며 ...

최신 AI 리소스 # AI 쓰기 # AI 자바 오픈 소스 프로젝트

1 년 전

060.4K

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

AI 개발 갤러리: Windows 네이티브 AI 모델 개발 도구 세트, Windows 애플리케이션에 엔드사이드 모델 통합

일반 소개 AI 개발 갤러리는 Windows 개발자를 위해 설계된 Microsoft의 AI 개발 도구 응용 프로그램(현재 공개 미리 보기 중)입니다. 개발자가 AI 기능을 Windo...에 쉽게 통합할 수 있는 포괄적인 플랫폼을 제공합니다.

1 년 전

058.9K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare, OpenAI 호환 형식 및 패키지 웹 인터페이스를 사용하여 Microsoft 음성 합성 API 배포하기

일반 소개 Edge TTS Worker(edge-tts에 의존하는)는 Microsoft Edge TTS 서비스를 OpenAI 호환 형식으로 캡슐화하는 Cloudflare Worker에 배포된 프록시 서비스입니다.

1 년 전

0119.6K

BetterWhisperX: 화자와 분리된 자동 음성 인식으로 매우 정확한 단어 수준의 타임스탬프 제공

일반 소개 BetterWhisperX는 효율적이고 정확한 자동 음성 인식(ASR) 서비스를 제공하는 데 초점을 맞춘 WhisperX 프로젝트의 최적화된 버전입니다. 이 프로젝트는 WhisperX의 개선된 파생물로서 Federico가 개발했습니다.

1 년 전

075K

Copilot后端代理服务：用其他模型接管GitHub Copilot插件服务端

Copilot 백엔드 프록시 서비스: 다른 모델로 GitHub Copilot 플러그인 서버 인수하기

일반 소개 Copilot 백엔드 에이전트 서비스는 여러 사람이 공식 계정을 공유하는 것을 지원하면서 DeepSeek와 같은 다른 FIM 모델을 활용하여 GitHub Copilot 플러그인 서버를 관리하도록 설계된 오픈 소스 프로젝트입니다. 이 서비스는 V를 포함한 다양한 IDE를 지원합니다.

1 년 전

064.5K

Gemini Balance：Gemini模型API兼容OpenAI格式，解锁区域限制并支持多API Key轮询

제미니 밸런스: 제미니 모델 API는 OpenAI 형식과 호환되며, 지역 제한을 해제하고 다중 API 키 폴링을 지원합니다.

종합 소개 Gemini Balance는 효율적인 멀티 API 키 관리 및 최적화 기능을 제공하는 것을 목표로 FastAPI 프레임워크를 기반으로 개발된 OpenAI API 프록시 서비스입니다. 이 프로젝트는 Gemini 모델 호출을 지원하며, 주요 기능으로는 멀티 API...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

12개월 전

083.6K

AIaW: 확장 가능한 플러그인을 갖춘 완전한 기능의 경량 크로스 플랫폼 AI 클라이언트

포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.

1 년 전

059.2K

DeepSeek Engineer：基于DeepSeek API的实验性编码助手,附提示词

딥시크 엔지니어: 딥시크 API를 기반으로 하는 실험적인 코딩 도우미로, 큐워드가 포함되어 있습니다.

일반 설명 DeepSeek Engineer는 직관적인 명령줄 인터페이스를 통해 사용자와 상호 작용하여 다양한 소프트웨어 개발 작업을 지원하는 DeepSeek API 기반의 강력한 프로그래밍 도우미 도구입니다. 이 도구는 대규모 언어 모델링의 강력한 기능과 실제 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

052.8K

OrionChat: 통합된 멀티 플랫폼 AI 모델을 갖춘 간단한 웹 채팅 인터페이스(배포 필요 없음)

일반 소개 오리온챗은 사용자에게 여러 주류 AI 모델과 상호 작용할 수 있는 통합 플랫폼을 제공하는 웹 기반 AI 채팅 인터페이스입니다. 이 프로젝트는 Ollama(로컬에서 실행), OpenAI GPT, Google Gemi... 등 다양한 AI 모델을 지원합니다.

1 년 전

058.9K

X-Kit: X 사용자 데이터 및 트윗을 위한 트위터 데이터 크롤링 및 애널리틱스

일반 소개 X-Kit은 X(이전의 트위터) 사용자 데이터와 트윗을 크롤링하고 분석하기 위해 설계된 오픈 소스 도구입니다. GitHub 사용자 xiaoxiunique가 개발한 이 도구는 사용자가 특정 X 사용자에 대한 기본 정보와 트윗을 얻는 프로세스를 자동화할 수 있도록 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

065.4K

AI2SRT: Gemini 모델을 사용하여 클릭 한 번으로 짧은 내레이션 동영상 또는 긴 동영상의 동영상 요약을 만듭니다.

개요 AI2SRT는 GeminiAI 빅 모델을 사용하여 한 번의 클릭으로 짧은 내레이션 동영상과 긴 동영상의 동영상 요약을 생성하는 동시에 오디오 및 동영상 전사 자막을 지원하는 오픈 소스 프로젝트입니다. 이 프로젝트는 동영상 콘텐츠 제작 과정을 간소화하고 효율적인 자막 생성 및 번역 기능을 제공하는 것을 목표로 합니다. 사용자는 통과할 수 있습니다...

1 년 전

065.2K

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

오픈 노트북: 개인화된 AI 노트 필기 도구, 노트북 LM의 오픈 소스 대안

일반 소개 오픈 노트북은 개인 정보 보호에 중점을 둔 오픈 소스 노트 관리 도구로, 사용자에게 Google 노트북 LM의 대체 솔루션을 제공하기 위해 고안되었습니다. 오픈 노트북을 사용하면 사용자는 스스로 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

1 년 전

0110.9K

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.

1 년 전

065.1K

DisPose: 사람의 자세를 정밀하게 제어하여 춤추는 여성을 만드는 동영상 생성

개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....

1 년 전

054.4K

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...

1 년 전

087.2K

비전 구문 분석: 시각 언어 모델을 사용하여 PDF 문서를 마크다운 형식으로 지능적으로 변환하기

포괄적 인 소개 Vision Parse는 혁신적인 문서 처리 도구로, 최첨단 시각 언어 모델 (비전 언어 모델) 기술, 고품질 마크 다운 형식으로 지능적으로 변환 된 PDF 문서 기능을 영리하게 결합합니다....

1 년 전

056.2K

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.

1 년 전

070.7K

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.

1 년 전

064.1K

GeminiCoder：基于LlamaCoder项目，使用Gemini API快速生成Web应用程序

GeminiCoder: LlamaCoder 프로젝트에 기반한 Gemini API를 사용하여 웹 애플리케이션을 빠르게 생성합니다.

종합 소개 GeminiCoder는 구글 제미니 API를 기반으로 개발된 혁신적인 웹 애플리케이션 생성 도구입니다. 이 프로젝트는 라마코더의 우수한 기능을 계승하고 최신 제미니 1.5 홍보를 통합합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

055.7K

GPTme：在命令行终端中运行的智能编程助手，ChatGPT代码解释器的本地化替代方案

GPTme: 명령줄 터미널에서 실행되는 지능형 프로그래밍 도우미, ChatGPT 코드 인터프리터의 현지화된 대안

종합 소개 GPTMe는 개발자의 업무 효율성을 높이기 위해 설계된 혁신적인 터미널 AI 어시스턴트 도구입니다. 강력한 AI 기능과 터미널 환경을 완벽하게 결합하여 코드 실행, 파일 편집, 웹 브라우징, 시각적 인식 등 다양한 기능을 지원합니다. ChatGPT 코드 풀이...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

057K

ChatGPT 서비스 성능 저하 모니터링 도구: ChatGPT 서비스 성능 저하 감지하기

종합 소개 ChatGPT 서비스 성능 저하 모니터링 도구는 사용자가 고위험 IP로 인해 ChatGPT 서비스가 저하되었는지 여부를 감지할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 작업 증명(PoW) 난이도 값을 분석하여 사용자가 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

060.1K

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.

1 년 전

065.3K

SimGRAG: 유사한 하위 그래프를 사용한 지식 그래프 기반 검색 향상 생성

종합 소개 SimGRAG(SimGRAG: 지식 그래프 기반 검색을 위한 유사 하위 그래프 활용-증강된 G...

1 년 전

056.5K

KAG: 하이브리드 지식 그래프 및 벡터 검색을 위한 전문 지식 베이스 Q&A 프레임워크

종합 소개 KAG(지식 증강 생성)는 OpenSPG 엔진과 LLM(대규모 언어 모델)을 기반으로 하는 논리적 형식 안내 추론 및 검색 프레임워크입니다. 이 프레임워크는 전문 도메인 지식 기반 구축을 위해 특별히 설계되었습니다...

1 년 전

0103.6K

일반 소개 VideoSeal은 Facebook Research에서 개발한 오픈 소스 동영상 워터마킹 도구로, 효율적인 동영상 워터마크 삽입 및 추출을 제공하기 위해 설계되었습니다. 이 도구는 최신 오픈 소스 모델을 지원하며 사전 학습된 모델, 학습 코드, 추론 코드 및 평가 도구가 포함되어 있습니다.

1 년 전

060.2K

Obsidian Copilot：在Obsidian中使用AI助手体验智能化笔记助手

옵시디언 코파일럿: 옵시디언의 AI 어시스턴트로 지능형 노트 필기 도우미 체험하기

일반 소개 옵시디언 코파일럿은 OpenAI의 지능을 옵시디언 노트 워크플로우에 매끄럽게 통합하는 강력한 AI 보조 플러그인입니다. 이 플러그인은 개발자 Logan Yang이 만들었습니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 노트

1 년 전

0103.3K

Languine: 모든 주요 i18n 라이브러리와 호환되는 AI를 사용한 애플리케이션 번역

일반 소개 Languine은 개발자가 앱의 로컬라이제이션 프로세스를 간소화할 수 있도록 Midday에서 개발한 강력한 번역 도구입니다. Languine을 사용하면 개발자는 AI 기술을 활용하여 정확하고 문맥에 맞는 번역을 신속하게 생성할 수 있으며, 다음과 같은 기능을 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 번역

1 년 전

051.4K