AI 오픈 소스 프로젝트

총 1020개 문서

순서대로 정렬

판타지토킹: 사실적으로 말하는 인물 사진을 생성하는 오픈 소스 툴

일반 소개 판타지토킹은 판타지-AMAP 팀이 개발한 오픈 소스 프로젝트로, 오디오 드라이브를 통해 사실적으로 말하는 인물 비디오를 생성하는 데 중점을 두고 있습니다. 이 프로젝트는 오디오 인코더 Wa와 결합된 고급 비디오 확산 모델 Wan2.1을 기반으로 합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

081.4K

Ortlin: 모든 OpenAI 모델 및 API와 상호 작용하기 위한 웹 GUI

일반 소개 Ortlin은 기술 및 비기술 사용자 모두가 OpenAI의 API 및 기본 모델과 쉽게 상호 작용할 수 있도록 설계된 웹 기반 그래픽 사용자 인터페이스입니다. 완전 무료 오픈 소스이므로 사용자가 번거로움 없이 OpenAI를 활용할 수 있습니다...

2 년 전

081.4K

Social Media Agent：社交媒体智能助手，自动生成和管理社交媒体内容

소셜 미디어 에이전트: 소셜 미디어 콘텐츠를 자동으로 생성하고 관리하는 소셜 미디어용 지능형 어시스턴트

일반 소개 소셜 미디어 에이전트는 사용자가 소셜 미디어 콘텐츠의 생성 및 관리를 자동화할 수 있도록 설계된 새로운 에이전트 인박스로 상호 작용 정보를 관리하는 오픈 소스 프로젝트입니다. 이 프로젝트는 LangChain 팀에 의해 개발되었습니다...

2 년 전

081.4K

에이전트 위즈: AI 인텔리전스 워크플로 및 보안 위험 분석

일반 소개 Agent-Wiz는 개발자, 연구원 및 보안 팀을 위해 설계된 오픈 소스 Python 명령줄 도구입니다. LangGraph, CrewAI, AutoGen 등과 같은 주요 AI 인텔리전스 프레임워크에서 복잡한 워크플로를 추출하여 다음을 생성할 수 있습니다.

1 년 전

081.2K

Feeds.Fun: 뉴스에 대한 자동 태그 지정 및 필터링 기능이 있는 RSS 피드

일반 소개 Feeds.Fun은 뉴스에 자동으로 태그를 지정하고 사용자 선호도에 따라 콘텐츠를 필터링하는 등의 핵심 기능을 통해 사용자가 효율적으로 뉴스를 읽을 수 있도록 도와주는 도구입니다. 개발자 알리악세이 얄레츠키(화면명 티엔딜)가 만들었으며 다음에서 호스팅됩니다.

1 년 전

081.2K

Memobase: AI 애플리케이션을 위한 사용자 프로필 기반 장기 메모리 솔루션

일반 소개 메모베이스는 생성형 AI 애플리케이션을 위해 오래 지속되는 사용자 메모리를 지원하도록 설계된 사용자 프로필 기반 메모리 시스템입니다. 가상 동반자, 교육 도구 또는 개인화된 비서를 구축하든, Memobase는 AI가 다음을 사용하여 기억하고 이해하고 성장할 수 있도록 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

081.2K

MemFree: 지역 지식 기반과 검색 정보를 혼합하는 AI 검색 엔진

일반 소개 MemFree는 텍스트, 이미지, 문서 및 웹 페이지를 통해 검색하고 질문할 수 있는 고급 하이브리드 AI 검색 엔진입니다. 텍스트, 마인드맵, 이미지, 동영상에 대한 검색 결과에 한 번의 클릭으로 액세스할 수 있으며, MemFree는 사용자의 지식 기반에서 정보를 추출하고...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

2 년 전

081.2K

AutoGPT: 워크플로 자동화 및 자율적 작업 실행을 위한 지능형 바디 구축 플랫폼

일반 설명 AutoGPT는 사용자가 지속적으로 실행되는 AI 에이전트를 생성, 배포, 관리하고 복잡한 워크플로를 자동화할 수 있도록 설계된 강력한 플랫폼입니다. 시그니피컨트 그라비타스에서 개발한 이 플랫폼은 사용자가 집중할 수 있는 다양한 도구와 기능을 제공합니다.

2 년 전

081.1K

Lumina-mGPT-2.0: 여러 이미지 생성 작업을 처리하기 위한 자동 회귀 이미지 생성 모델

일반 소개 Lumina-mGPT-2.0은 상하이 인공지능 연구소(상하이 인공지능 연구소), 홍콩중문대학교(CUHK) 및 기타 기관이 공동 개발한 오픈 소스 프로젝트로, 알파고에서 GitHub에서 호스팅하고 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

081.1K

MuseGAN: 멀티 트랙 음악/사운드트랙을 생성하고 여러 악기를 위한 음악 클립을 쉽게 제작할 수 있는 오픈 소스 모델입니다.

일반 소개 MuseGAN은 멀티 트랙(다중 악기) 음악을 생성하도록 설계된 생성적 적대 신경망(GAN)을 기반으로 하는 음악 생성 프로젝트입니다. 이 프로젝트는 처음부터 음악을 생성하거나 사용자가 제공한 트랙과 함께 음악을 생성할 수 있습니다.MuseGAN은 Lakh 피아노...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

2 년 전

081.1K

X-Dyna: 미시의 사진을 춤추게 만드는 스틸 인물 레퍼런스 비디오 포즈 생성 비디오

일반 소개 X-Dyna는 제로 샘플 확산 기법을 사용하여 역동적인 인물 애니메이션을 생성하기 위해 ByteDance에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 드라이브 비디오의 얼굴 표정과 신체 움직임을 사용하여 개별 인물 이미지에 애니메이션을 적용하여 사실적이고 상황에 맞는 모션 효과를 생성합니다.X-D...

2 년 전

081.1K

지식 테이블: 구조화된 데이터의 효율적인 추출과 탐색을 위한 오픈 소스 도구

종합 소개 지식 테이블(Knowledge Table)은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 추출 사용자 지정을 지원합니다 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

2 년 전

081.1K

OmniParser: 대형 모델을 쉽게 이해하고 조작할 수 있도록 사용자 인터페이스 스크린샷을 구조화된 요소로 파싱합니다.

일반 소개 OmniParser는 사용자 인터페이스 스크린샷을 구조화되고 이해하기 쉬운 요소로 구문 분석하기 위해 Microsoft에서 개발한 도구입니다. 이 도구는 해당 인터페이스 영역에서 정확한 동작을 생성하는 GPT-4V의 기능을 크게 향상시킵니다.OmniParser는 다음을 지원할 뿐만 아니라...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

081K

AI Hive: 다목적 Java 기반 AI 채팅 통합 플랫폼

종합 소개 AI 벌집(ai-beehive)은 Spring Boot 3 및 JDK 17이 포함된 Java 언어를 기반으로 구축된 다기능 AI 플랫폼입니다. 이 프로젝트는 ChatGPT를 비롯한 여러 AI 기술을 통합합니다.

2 년 전

081K

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.

2 년 전

081K

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

Hoarder: 오픈 소스 AI 북마크 관리 도구, 여러 형식 지원, 지능형 태그 분류, 전체 텍스트 검색

일반 설명 Hoarder는 링크, 노트, PDF, 이미지의 저장을 지원하는 자체 호스팅 북마크 관리 도구입니다. 자동 태그 지정에 AI 기술을 사용하며 전체 텍스트 검색 기능을 제공합니다. 사용자는 크롬 플러그인과 파이어폭스 플러그인을 사용할 수 있습니다...

2 년 전

081K

'올웨이즈온' 딥시크 AI 어시스턴트: 딥시크-V3 기반의 지능형 음성 인터랙션 시스템 구축

개요 올웨이즈온 AI 어시스턴트는 딥시크-V3, 리얼타임STT, 타이퍼와 같은 고급 기술을 통합하여 강력한 영구 온라인 AI 비서 시스템을 구축하는 혁신적인 AI 비서 프로젝트입니다.

2 년 전

080.9K

원자 에이전트: 경량 모듈식 AI 인텔리전스를 구축하기 위한 프레임워크

일반 소개 원자 에이전트는 에이전트 AI 파이프라인 및 애플리케이션 구축을 위해 원자 개념을 중심으로 설계된 매우 가벼운 모듈식 프레임워크입니다. 이 프레임워크는 강력한 애플리케이션을 만들기 위해 결합할 수 있는 일련의 도구와 에이전트를 제공합니다. 이 프레임워크는 Instruc ...

2 년 전

080.8K

ChatGPT 박스: 다른 웹 페이지에서 ChatGPT를 작동시키는 브라우저 플러그인

일반 소개 ChatGPT Box는 ChatGPT를 사용자의 브라우저에 긴밀하게 통합하도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. josStorer에서 개발한 이 도구는 여러 언어를 지원하며 모든 페이지에서 채팅 쌍을 호출하는 등 다양한 기능을 제공합니다.

1 년 전

080.8K

미니마: 로컬 배포 또는 ChatGPT로의 통합을 지원하는 오픈 소스 RAG 컨테이너, Claude

일반 소개 미니마는 로컬 배포 및 ChatGPT와의 통합을 지원하는 오픈 소스 RAG(검색 증강 세대) 솔루션입니다. 이 프로젝트는 dmayboroda에 의해 유지 관리되며 목표는 ...

1 년 전

080.8K

오디오 심층 추론을 지원하는 대규모 언어 모델: 오디오 심층 추론을 지원하는 대규모 언어 모델

종합 소개 Audio-Reasoner는 칭화대학교 팀이 개발하고 GitHub에서 호스팅하는 오픈 소스 프로젝트로, 오디오에서 심층 추론을 지원하는 대규모 언어 모델 구축에 중점을 두고 있습니다. 이 모델은 Qwen2-Audio-Instruct를 기반으로 하며, 다음을 도입하여 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

080.7K

LivePortrait: 정지 이미지와 동영상에서 역동적인 인물 사진을 생성하는 애니메이션 도구

일반 소개 라이브포트트레이트는 레이서 테크놀로지에서 개발한 고급 AI 동적 인물 애니메이션 툴입니다. 혁신적인 AI 기술을 활용하여 정지 이미지를 생생한 비디오 애니메이션으로 변환합니다. 실제 사진, 애니메이션 스타일 또는 예술적 초상화를 사용하든 LivePo...

2 년 전

080.6K

PiT: 이미지 부분(열려 있지 않은)에서 전체 이미지를 조합하는 도구

일반 소개 PiT(Piece it Together)는 GitHub에서 호스팅되는 오픈 소스 도구로, 텔아비브 대학교의 엘라드 리처드슨과 같은 연구자들이 개발했습니다. 사용자가 날개와 같이 조각난 이미지 부분을 입력할 수 있습니다.

1 년 전

080.6K

DB-GPT: 멀티 모델 관리와 지능형 데이터 처리를 통합하는 AI 네이티브 데이터 애플리케이션 개발 프레임워크 구축

종합 소개 DB-GPT는 AWEL(에이전트 워크플로우 표현 언어)과 스마트 바디 기술을 사용하여 구축된 오픈소스 AI 네이티브 데이터 애플리케이션 개발 프레임워크입니다. 이 프로젝트는 대규모 모델 분야의 인프라 구축을 목표로 합니다.

1 년 전

080.5K

Robo Blogger：基于LangGraph将语音内容生成博客文章，自动化写作博客

로보 블로거: 랭그래프 기반의 음성 콘텐츠에서 블로그 게시물 생성, 자동화된 블로그 작성

일반 소개 Robo Blogger는 음성-텍스트 기술을 통해 콘텐츠 생성 과정을 간소화하도록 설계된 혁신적인 블로그 생성 도구입니다. 사용자는 모든 음성-텍스트 애플리케이션을 통해 아이디어를 녹음할 수 있으며, Robo Blogger는 이러한 아이디어를 구조화된 블로그 콘텐츠로 변환합니다....

2 년 전

080.5K

EasyControl: 인물 사진을 지브리 스타일의 이미지로 변환하는 무료 도구

일반 소개 EasyControl은 오픈 소스 프로젝트로, 효율적이고 유연한 이미지 생성 제어를 제공하기 위해 확산 변압기(DiT) 아키텍처를 기반으로 합니다. 그중에서도 지브리 컨트롤 LoRA는 100개의 서브만 사용하여 특별한 기능 중 하나입니다.

1 년 전

080.5K

par_scrape: 웹 데이터의 지능적 추출을 위한 크롤러 도구

일반 소개 파스크랩은 개발자 폴 로벨로가 GitHub에서 출시한 Python 기반 오픈 소스 웹 크롤러 도구로, 사용자가 웹 페이지에서 데이터를 지능적으로 추출할 수 있도록 설계되었습니다. 이 도구는 셀레늄을 통합합니다...

1 년 전

080.5K

GaiaNet 노드: 자체 로컬 모델 온라인 프록시 서비스 설치 및 실행

일반 소개 GaiaNet-AI/gaianet-node는 사용자가 단일 명령으로 Mac, Linux 또는 Windows WSL에 기본 노드 소프트웨어 스택을 빠르게 설치할 수 있는 오픈 소스 프로젝트입니다. 사용자는 노드를 초기화하고, 구성을 사용자 지정하고, 다운로드할 수 있습니다.

2 년 전

080.5K

DragGAN: 대화형 이미지 편집 도구, 포인트 앤 클릭 및 드래그 앤 드롭으로 이미지 위치를 제어할 수 있습니다.

일반 소개 DragGAN은 생성적 적대 신경망(GAN)을 기반으로 하는 대화형 이미지 편집 도구입니다. 시그라프 2023에서 Xingang Pan 등이 발표한 이 도구는 간단한 포인트 앤 클릭과 드래그 앤 드롭 조작을 통해 사용자가 직관적으로 조작할 수 있도록 하는 것을 목표로 합니다.

2 년 전

080.4K

Mahilo: 서로 다른 AI 인텔리전스 프레임워크를 연결하여 실시간으로 협업할 수 있는 통합 플랫폼

일반 소개 Mahilo는 오픈 소스 다중 지능 통합 플랫폼으로, 개발자 Jayesh Sharma가 GitHub에 공개했으며, 사용자가 서로 다른 프레임워크의 AI 지능을 연결하여 실시간 커뮤니케이션, 인간과 컴퓨터의 상호작용, 지능형 협업을 지원할 수 있도록 설계되었습니다. The ...

1 년 전

080.4K

AI 동영상 스타터 키트: 브라우저에서 전체 흐름의 AI 동영상 제작 및 편집

일반 소개 비디오 스타터 키트(비디오 스타터 키트)는 브라우저에서 동영상 제작에 AI 모델을 사용하는 방법을 보여주기 위해 fal-ai-community에서 공개한 오픈 소스 프로젝트입니다. 이미지를 동영상으로 변환하는 도구를 제공합니다...

2 년 전

080.4K

IMS Toucan: 빠르고 제어 가능한 다국어(7000개 이상의 언어 지원) 텍스트 음성 변환 도구

일반 소개 IMS Toucan은 독일 슈투트가르트 대학교의 자연어 처리 연구소(IMS)에서 개발한 최첨단 텍스트 음성 변환(TTS) 툴킷입니다. 이 툴킷은 7000개 이상의 언어를 지원하며 빠르고 제어 가능하며 컴퓨팅 리소스 요구 사항이 낮습니다.IMS...

1 년 전

080.3K

오픈 리서처-제로: 오픈 소스 대규모 추론 강화 학습 교육 플랫폼

일반 소개 Open-Reasoner-Zero는 강화 학습(RL) 연구에 중점을 둔 오픈 소스 프로젝트로, GitHub의 Open-Reasoner-Zero 팀에서 개발했습니다. 효율적이고 확장 가능하며 사용하기 쉬운 교육을 제공하는 것을 목표로 합니다.

1 년 전

080.2K

R1-Onevision: 멀티모달 추론을 지원하는 오픈 소스 시각적 언어 모델

종합 소개 R1-Onevision은 Fancy-MLLM 팀이 개발한 오픈 소스 멀티모달 매크로 언어 모델로, 시각과 언어의 심층적인 결합에 중점을 두고 이미지와 텍스트 등의 멀티모달 입력을 처리할 수 있으며 시각 추론, 이미지 이해, 수학적 해결 등의 분야에서 수행할 수 있습니다.....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

080.2K

Cloudflare 에이전트: 엣지 네트워크에서 실시간 대화형 인텔리전스 구축

일반 소개 Cloudflare 에이전트는 개발자가 글로벌 에지 네트워크에서 지능형 AI 에이전트를 구축할 수 있도록 설계된 Cloudflare의 오픈 소스 개발 프레임워크입니다. 에이전트는 상태를 유지하고, 실시간으로 통신하며, 자율적으로 실행할 수 있는 기능을 제공하며, 현재 항목...

1 년 전

080.2K

반응형 이력서: 다국어 및 다중 템플릿을 지원하는 오픈 소스 무료 이력서 작성기

일반 설명 반응형 이력서는 이력서 작성, 업데이트 및 공유 프로세스를 간소화하도록 설계된 무료 오픈 소스 이력서 작성기입니다. 이 플랫폼은 사용자 추적이나 광고 없이 사용자 개인정보 보호에 중점을 두고 있습니다. 사용자는 30초 이내에 앱을 셀프 호스팅할 수 있으며, 앱을 완전히 제어할 수 있습니다.

2 년 전

080.1K

Gaze-LLE: 비디오 속 인물 시선에 대한 타겟 예측 도구

합성 시선-LLE는 대규모 학습 인코더를 기반으로 하는 시선 대상 예측 툴입니다. 피오나 라이언, 아제이 바티, 이상민, 다니엘 볼야, 주디 호프만, 제이...에 의해 개발되었습니다.

1 년 전

080.1K

스크래퍼: 자체 호스팅 웹 데이터 스크래핑 도구

일반 소개 스크래퍼는 사용자가 XPath 요소를 지정하여 웹 데이터를 스크래핑할 수 있는 자체 호스팅 웹 데이터 스크래핑 도구입니다. 사용자가 URL과 해당 크롤링 요소를 제출하면 결과가 표로 표시되고 Excel 파일로 다운로드할 수 있습니다.Sc...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

080.1K

$XDOllama：适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。$

XDOllama: MacOS에서 Ollama\Dify\Xinference를 빠르게 호출할 수 있는 AI 모델 인터페이스입니다.

일반 설명 XDOllama는 MacOS 사용자가 Ollama, Dify 및 Xinference와 같은 AI 모델을 빠르게 호출할 수 있도록 설계된 데스크톱 애플리케이션입니다. 간소화된 인터페이스와 워크플로우를 통해 사용자는 이 애플리케이션을 통해 다음을 수행할 수 있습니다.

2 년 전

080.1K

JoyGen: 오디오 기반 3D 깊이 인식 인물 토킹 비디오 편집 도구

종합 소개 JoyGen은 말하는 얼굴을 위한 혁신적인 2단계 비디오 생성 프레임워크로, 오디오 기반 표정 생성 문제를 해결하는 데 중점을 두고 있습니다. 징동 테크놀로지 팀이 개발한 이 프레임워크는 고급 3D 재구성 기술과 오디오 특징 추출 방법을 사용하여 화자의 신원 특성과 표정을 정확하게 포착합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

2 년 전

080K

self.so: 클릭 한 번으로 멋진 이력서 페이지를 생성하세요!

일반 소개 self.so는 이력서나 LinkedIn 프로필을 개인 웹사이트로 빠르게 전환하도록 설계된 오픈 소스 도구입니다. 사용자가 PDF 이력서를 업로드하거나 LinkedIn 링크를 입력하기만 하면 시스템이 AI 기술을 사용하여 개인 웹사이트로 변환합니다(Tog...

1 년 전

080K

분재: 에지 디바이스에서 작동하기에 적합한 3값 가중 언어 모델

일반 소개 분재는 삼항 가중치를 사용하여 5억 개의 파라미터 크기로 deepgrove-ai에서 개발한 오픈 소스 언어 모델입니다. 라마 아키텍처와 미스트랄 분류기를 기반으로 합니다...

1 년 전

080K

OmAgent: 멀티모달 스마트 디바이스 구축을 위한 인텔리전트 바디 프레임워크

종합 소개 OmAgent는 Om AI Lab에서 개발한 멀티모달 지능형 바디 프레임워크로, 스마트 디바이스를 위한 강력한 AI 기반 기능을 제공하는 것을 목표로 합니다. 이 프로젝트는 최첨단 멀티모달 기본 모델과 지능형 바디 알고리즘을 통합하여 개발자가 다양한 스마트 디바이스에서 효율적인 스마트 디바이스를 만들 수 있도록 지원합니다.

2 년 전

080K

Rankify: 정보 검색 및 재정렬을 지원하는 Python 툴킷

일반 소개 Rankify는 오스트리아 인스브루크 대학교의 데이터 과학 그룹에서 개발한 오픈 소스 Python 툴킷입니다. 이 툴킷은 정보 검색, 재정렬 및 검색 증강 생성(RAG)에 중점을 두고 통합 프레임워크를 제공합니다. 이 툴킷에는 미리 검색된 40개의 벤치마크가 내장되어 있습니다....

1 년 전

080K

PDF를 팟캐스트로 변환: PDF를 팟캐스트로 변환하는 유틸리티

일반 소개 노트북 LM의 팟캐스트 생성 기능과 최근 오픈 노트북 LM 오픈 소스 구현에서 영감을 얻었습니다. 이 레시피에서는 PDF를 팟캐스트로 변환하는 파이프라인을 구축하는 방법에 대한 자세한 단계별 가이드를 구현해 보겠습니다. PDF가 주어지면...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

079.9K

AI 팟캐스트 생성기: 뉴스를 자동으로 캡처하여 오디오 팟캐스트 생성하기

일반 소개 AI 팟캐스트 생성기는 고급 AI 기술을 사용하여 웹 소스에서 매력적인 오디오 콘텐츠를 자동으로 생성하는 지능형 팟캐스트 생성 도구입니다. 이 시스템은 뉴스 콘텐츠를 캡처하여 오디오 팟캐스트로 변환함으로써 자연스럽게 흐르는 내러티브를 생성합니다. 이 프로젝트는 다음...

2 년 전

079.9K

슈퍼위챗PC: 오픈소스 컴퓨터 소액 신용 기능 향상 도구, 2차 개발 지원

종합 소개 슈퍼위챗PC는 사용자와 개발자에게 편의를 제공하는 것이 핵심인 컴퓨터용 오픈소스 위챗 향상 도구입니다. 처음에는 위챗만 단독으로 열 수 있는 문제를 해결하고, 나중에 개발자가 메시지 전송과 같은 위챗 기능을 호출할 수 있도록 위챗SDK를 추가했습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

079.9K

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

Confident AI: 자동화된 대규모 언어 모델 평가를 위한 프레임워크로, 다양한 대규모 모델 단서 단어의 출력 품질을 비교합니다.

종합 소개 DeepEval은 대규모 언어 모델링 시스템을 평가하고 테스트하기 위한 사용하기 쉬운 오픈 소스 LLM 평가 프레임워크입니다. Pytest와 유사하지만 LLM 출력의 단위 테스트에 중점을 두며, DeepEval은 G-Eval, 팬텀을 통한 최신 연구 결과를 결합합니다.

1 년 전

079.9K

Telegram GPT Worker：部署在Cloudflare Workers上的多模型AI Telegram机器人

텔레그램 GPT 워커: Cloudflare 워커에 배포된 다중 모델 AI 텔레그램 봇

일반 소개 GPT-Telegram-Worker는 OpenAI, Claude, Azure 등과 같은 여러 AP를 지원하는 Cloudflare Workers 기반의 다중 모델 AI 텔레그램 봇입니다....

1 년 전

079.8K

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

OpenAlternative: 일반적으로 사용되는 SaaS 제품에 대한 다양한 오픈 소스 소프트웨어 대안, 최고의 오픈 소스 대안 찾기

일반 소개 OpenAlternative는 오픈 소스 소프트웨어 대안을 제공하는 데 중점을 둔 플랫폼으로, 사용자가 매일 사용하는 상용 SaaS 제품을 대체할 수 있는 적합한 오픈 소스 도구를 찾는 것을 목표로 합니다. 이 사이트는 엄선된 오픈 소스 도구 모음을 통해 사용자가 비용을 절감하고 개선할 수 있도록 도와줍니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

079.7K

LLManager: 지능형 자동 프로세스 승인과 인간 감사를 결합한 관리 도구

일반 소개 LLManager는 랭체인의 랭그래프 프레임워크를 기반으로 개발된 오픈소스 지능형 승인 관리 도구로, 승인 요청 처리를 자동화하는 동시에 사람의 검토와 함께 의사 결정을 최적화하는 데 중점을 둡니다. 시맨틱 검색, 샘플 적은 학습을 통해 이를 수행합니다.

1 년 전

079.7K

CogView3: 위즈덤 스펙트럼의 오픈 소스 캐스케이드 확산 텍스트 생성 이미지 모델

종합 소개 CogView3는 칭화대학교와 싱크탱크 팀(Chi Spectrum Qingyan)이 개발한 고급 텍스트 생성 이미지 시스템입니다. 계단식 확산 모델을 기반으로 하며 여러 단계를 거쳐 고해상도 이미지를 생성하며, 다단계 생성, 혁신적인 아키텍처 및 효율적인 성능을 포함한 CogView3의 주요 기능은 다음과 같습니다.

2 년 전

079.7K

리버소노라: 오디오북 자막 추출 및 다국어 번역, 여러 언어로 오디오북 전사

종합 소개 "자유로운 소리"라는 뜻의 LiberSonora는 강력한 AI 지원 오픈 소스 오디오북 툴셋입니다. 지능형 자막 추출, AI 타이틀 생성, 다국어 번역 등을 지원하며 GPU 가속을 통해 오프라인에서 일괄 처리가 가능합니다.

1 년 전

079.7K

ai-gradio: Gradio를 기반으로 여러 AI 모델을 쉽게 통합하고 멀티모달 애플리케이션을 구축하세요.

일반 소개 ai-gradio는 개발자가 여러 AI 모델을 쉽게 통합하고 사용할 수 있도록 설계된 오픈 소스 Python 툴킷입니다. Gradio를 기반으로 구축된 이 프로젝트는 여러 AI 모델과 서비스를 지원하기 위한 통합 인터페이스를 제공합니다. 텍스트, 음성, 동영상 등 어떤 데이터든...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

079.6K

Dynamiq: AI 애플리케이션 개발을 간소화하는 RAG 및 LLM 에이전트 지원 지능형 바디 오케스트레이션 프레임워크

포괄적인 소개 Dynamiq은 에이전트 AI 및 LLM(대규모 언어 모델링) 애플리케이션을 위해 설계된 오픈 소스 AI 오케스트레이션 프레임워크입니다. 특히 검색 증강 생성(RAG) 및 LLM 에이전트의 오케스트레이션 영역에서 AI 기반 애플리케이션 개발을 간소화하는 것을 목표로 합니다.Dynamiq은 다음과 같이 제안합니다.

2 년 전

079.5K

DSPy 예제: DSPy 기능을 보여주는 실제 예제

일반 소개 DSPy 예제 코드베이스는 Langtrace AI 팀에서 관리하는 GitHub 코드베이스로, DSPy를 사용하여 구축된 다양한 예제 AI 프로그램을 보여줍니다. 이 코드베이스는 개발자의 이해를 돕기 위해 실제 예제를 통해 DSPy의 다양한 기능을 시연하도록 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

079.5K

LangWatch: DSPy 프레임워크에 기반한 LLM 프로세스 모니터링 및 최적화를 위한 시각화 도구

종합 소개 LangWatch는 대규모 언어 모델(LLM) 작업을 위해 설계된 종합 플랫폼으로, 모니터링, 분석, 평가, 데이터 세트 관리 및 큐 최적화를 제공합니다. 이 플랫폼은 스탠포드 대학의 DSPy 프레임워크를 기반으로 하며 사용자가 더 나은 관리와 최적화를 할 수 있도록 설계되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

079.5K

StickerBaker: AI로 맞춤형 스티커 이미지 만들기

일반 설명 스티커베이커는 인공 지능 기술을 사용하여 다양하고 재미있는 스티커를 만드는 오픈 소스 스티커 메이커입니다. 간단한 고양이 스티커를 원하든 다양한 스티커 시리즈를 만들고 싶든 스티커 베이커는 귀하의 요구를 충족시킬 수 있습니다 ...

2 년 전

079.4K

LuminaBrush: 스마트 페인트 도구로 이미지에 조명 추가하기

일반 소개 LuminaBrush는 인공 지능 기술로 구동되는 조명 효과를 위한 혁신적인 대화형 이미지 편집 도구입니다. 이 프로젝트는 2단계 프레임워크를 사용하여 이미지를 처리합니다. 첫 번째 단계에서는 입력 이미지를 "균일한 조명" 모양으로 변환하고 두 번째 단계에서는...

2 년 전

079.4K

LLM API 엔진: 자연어를 통한 신속한 API 생성 및 배포

일반 소개 LLM API 엔진은 개발자가 AI 기반 API를 신속하게 구축하고 배포할 수 있도록 설계된 오픈 소스 프로젝트로, 대규모 언어 모델(LLM)과 지능형 웹 크롤링 기술을 활용하여 사용자가 자연어 설명을 통해 사용자 지정 API를 만들 수 있도록 합니다.주요 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

079.3K

비전 구문 분석: 시각 언어 모델을 사용하여 PDF 문서를 마크다운 형식으로 지능적으로 변환하기

포괄적 인 소개 Vision Parse는 혁신적인 문서 처리 도구로, 최첨단 시각 언어 모델 (비전 언어 모델) 기술, 고품질 마크 다운 형식으로 지능적으로 변환 된 PDF 문서 기능을 영리하게 결합합니다....

2 년 전

079.2K

DocsGPT: 문서 채팅 도우미, 단일 문서, 웹 소스에서 신뢰할 수 있는 답변 얻기, 로컬 배포 지원

일반 소개 DocsGPT는 프로젝트 문서 쿼리 프로세스를 간소화하도록 설계된 오픈 소스 문서 도우미입니다. 강력한 GPT 모델을 통합하여 개발자는 프로젝트에 대해 쉽게 질문하고 정확한 답변을 얻을 수 있으며, DocsGPT는 로컬 배포를 지원하여 데이터 프라이버시를 보장하는 동시에...

2 년 전

079.2K

Goku: 세밀하고 일관된 동영상을 생성하여 캐릭터와 사물이 세밀하게 묘사된 광고 제작에 이상적입니다.

종합 소개 Goku는 업계 최고 수준의 성능을 달성하도록 설계된 스트림 변환 기술을 기반으로 한 연합 이미지 및 동영상 생성 모델입니다. 세분화된 데이터 대조, 모델 디자인, 스트림 변환 공식화 등 고급 고품질 시각적 생성 기술을 통합하고 있으며, Goku의 주요 기능으로는 고품질의 세분화된...

1 년 전

079.1K

OneFileLLM: 여러 데이터 소스를 단일 텍스트 파일로 통합하기

종합 소개 OneFileLLM은 여러 데이터 소스를 하나의 텍스트 파일로 통합하여 대규모 언어 모델(LLM)에 쉽게 입력할 수 있도록 설계된 오픈 소스 명령줄 도구입니다. 이 도구는 GitHub 리포지토리, ArXiv 논문, YouTube 동영상 전사, 웹...

1 년 전

079K

벡터 베인: 코드 없는 AI 워크플로 구축 플랫폼

포괄적인 소개 벡터 베인은 사용자가 지능적이고 자동화된 워크플로우를 쉽게 만들 수 있도록 설계된 코드 없는 AI 워크플로우 구축 플랫폼입니다. 프로그래밍 기반이 필요하지 않으므로 사용자는 드래그 앤 드롭 작업을 통해 다양한 기능 모듈을 간단히 연결하여 복잡한 AI 작업을 구축할 수 있습니다.

2 년 전

079K

HiOllama: 기본 Ollama 모델과 상호 작용할 수 있는 깔끔한 채팅 인터페이스

일반 소개 HiOllama는 Python과 Gradio를 기반으로 구축된 사용자 친화적인 인터페이스로, 올라마 모델과 상호 작용하도록 설계되었습니다. 실시간 텍스트 생성 및 모델 관리 기능을 지원하는 간단하고 직관적인 웹 인터페이스를 제공합니다. 사용자는 온도와 같은 매개변수를 조정할 수 있으며 대부분의 ...

2 년 전

079K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF를 팟캐스트로 변환하는 AI 도구: 안내 문구를 설정하여 PDF를 팟캐스트로 변환하는 AI 도구

일반 소개 NVIDIA AI 청사진: PDF to Podcast는 PDF 문서를 매력적인 오디오 콘텐츠로 변환하기 위해 NVIDIA에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 NVIDIA NIM(NVID ...

AI 뉴스 # AI 자바 오픈 소스 프로젝트 # AI 텍스트 음성 변환

1 년 전

078.9K

XiaoYuanKouSuan_Auto：小猿口算自动答题工具，高效解决口算题目

샤오위안커우쑤안 자동 질문과 답변 도구, 구두 산술 주제를 효율적으로 해결

종합 소개 Ape Mouth 계산기 자동 질문 답변 도구는 OCR 인식 및 자동화 스크립트를 통해 Ape Mouth 계산기 애플리케이션의 문제를 효율적으로 해결하기 위해 설계된 Python 기반 오픈 소스 프로젝트입니다. 이 도구는 OpenCV 및 Tesseract와 같은 기술을 사용하여 화면의 질문을 실시간으로 식별할 수 있습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 교육 도구

2 년 전

078.9K

Cloud Document Converter：飞书文档下载插件，飞书云文档转换为本地Markdown格式文档

클라우드 문서 변환기: 플라잉북 문서 다운로드 플러그인, 플라잉북 클라우드 문서를 로컬 마크다운 형식 문서로 변환합니다.

일반 소개 클라우드 문서 변환기는 플라잉북 클라우드 문서를 마크다운 형식으로 변환하기 위해 설계된 Chrome 확장 프로그램입니다. 사용자는 플라잉북 클라우드 문서를 마크다운으로 쉽게 다운로드하거나 복사할 수 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

078.9K

DeepSeek Engineer：基于DeepSeek API的实验性编码助手,附提示词

딥시크 엔지니어: 딥시크 API를 기반으로 하는 실험적인 코딩 도우미로, 큐워드가 포함되어 있습니다.

일반 설명 DeepSeek Engineer는 직관적인 명령줄 인터페이스를 통해 사용자와 상호 작용하여 다양한 소프트웨어 개발 작업을 지원하는 DeepSeek API 기반의 강력한 프로그래밍 도우미 도구입니다. 이 도구는 대규모 언어 모델링의 강력한 기능과 실제 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

078.8K

Bambo: 지능형 기관을 위한 가볍고 유연한 프레임워크로, 역할과 도구를 간단하게 구성하여 여러 작업을 처리할 수 있습니다.

일반 소개 Bambo는 새로운 유형의 프록시 프레임워크로, 주류 프레임워크보다 가볍고 유연하며 다양한 로드 작업을 처리할 수 있으며, 도구 카탈로그의 모든 도구를 정의하고 비동기 사용자 정의 함수를 사용하여 효율적인 프록시 기능을 구현합니다. 사용자는 llm_c...

2 년 전

078.8K

Azure TTS 임포터: 음성 합성 서비스를 읽기 소프트웨어에 통합하기

포괄적인 소개 TTS 임포터는 다양한 읽기 소프트웨어로 Azure TTS(텍스트 음성 변환) 음성 합성 서비스를 쉽게 가져올 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 Read(레가도)를 비롯한 여러 인기 읽기 소프트웨어를 지원합니다.

1 년 전

078.8K

AigoTools: 웹사이트 자동 포함 및 다국어 오픈 소스 AI 도구 탐색 사이트 지원

일반 소개 AigoTools는 사용자가 탐색 사이트를 빠르게 만들고 관리할 수 있도록 설계된 오픈 소스 AI 웹 사이트 탐색입니다. 내장된 사이트 관리 및 AI 기반 자동 포함 기능, 다국어 지원, 어둡고 밝은 테마 전환, SEO 최적화 기능을 갖추고 있습니다.AigoTools는 ...

2 년 전

078.8K

OneLine: 인기 이벤트의 타임라인을 생성하는 AI 도구

일반 소개 OneLine은 깃허브에서 호스팅되고 사용자 chengtx809가 개발한 오픈소스 핫 이벤트 타임라인 생성 도구입니다. 사용자가 입력한 키워드로 이벤트 타임라인을 빠르게 생성하여 이벤트의 시간, 제목, 설명 및 관련 인물을 보여줍니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 검색 도구

1 년 전

078.7K

OpenPromptStudio：可视化编辑、管理图像提示词，同步自己的Notion提示词表

OpenPromptStudio: 이미지 프롬프트를 시각적으로 편집 및 관리하고, 나만의 Notion 프롬프트 목록을 동기화하세요!

일반 소개 오픈프롬프트스튜디오(OPS)는 Moonvy 팀에서 개발한 AIGC 프롬프트 단어용 오픈 소스 시각적 편집기입니다. 프롬프트 단어를 생성하고 관리하는 프로세스를 간소화하도록 설계되었으며, Midjourney와 같은 AI 모델을 지원합니다.OPS는 No...

2 년 전

078.7K

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

Llama 3.2 추론 웹 GPU: 브라우저에서 Llama 3.2 실행하기

일반 소개 Transformers.js는 서버 지원 없이 브라우저에서 직접 최첨단 머신러닝 모델을 실행하도록 설계된 Hugging Face에서 제공하는 자바스크립트 라이브러리입니다. 이 라이브러리는 허깅 페이스와 함께 작동합니다.

AI 뉴스 # AI 자바 오픈 소스 프로젝트 # 로컬 배포 오픈 소스 대규모 모델 도구

2 년 전

078.7K

Xata 에이전트: PostgreSQL 데이터베이스 모니터링 및 최적화를 위한 AI 어시스턴트

일반 설명 Xata Agent는 PostgreSQL 데이터베이스를 위해 특별히 설계된 오픈 소스 AI 도구입니다. 데이터베이스 운영 상태를 자동으로 모니터링하고, 성능 문제나 장애의 근본 원인을 찾아내고, 이를 해결하기 위한 권장 사항을 제공합니다. 개발팀 xAI는 이 도구를 다음과 같이 포지셔닝합니다.

1 년 전

078.6K

송젠: 자동 노래 생성을 위한 단일 단계 자동 회귀 변압기

종합 소개 송젠은 텍스트-노래 생성 작업을 위해 설계된 오픈 소스 단일 단계 자동 회귀 트랜스포머 모델입니다. 이 모델은 텍스트 입력에서 보컬과 백킹 트랙이 포함된 노래를 생성할 수 있으며, 다양한 음악적 속성을 세밀하게 제어할 수 있습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 음악

1 년 전

078.6K

CleverBee: 인용 연구를 생성하는 오픈 소스 AI 연구 도우미

일반 소개 CleverBee는 GitHub에서 호스팅되고 SureScaleAI에서 개발한 오픈 소스 AI 연구 도우미입니다. 웹 브라우징 기술과 대규모 언어 모델(예: Gemini 및 Claude)을 결합하여 사용자를 돕습니다.

1 년 전

078.5K

MOFA 비디오: 정지 이미지를 비디오로 변환하는 모션 필드 적응 기술

일반 소개 MOFA-Video는 제너레이티브 모션 필드 적응 기술을 활용하여 정적인 이미지를 동적인 동영상으로 변환하는 최첨단 이미지 애니메이션 생성 툴입니다. 이 도구는 도쿄대학교 및 텐센트 AI 연구소와 공동으로 개발되었으며, 2024년 유럽 컴퓨터 비전 컨퍼런스에서 발표될 예정입니다(E...

2 년 전

078.5K

Potpie AI: 독점 코드 베이스를 빠르게 생성하기 위한 AI 엔지니어링 도우미

포괄적인 소개 Potpie AI는 개발자에게 맞춤형 AI 엔지니어링 어시스턴트를 제공하는 데 중점을 둔 오픈 소스 플랫폼입니다. AI 에이전트가 코드 구조와 로직을 심층적으로 이해하고 코드 베이스의 지식 그래프를 구축하여 디버깅, 테스트, 코드 생성과 같은 작업을 자동화할 수 있습니다. 사용자는 간단한...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

1 년 전

078.4K

MM-EUREKA: 시각적 추론 탐구를 위한 다중 모드 강화 학습 도구

종합 소개 MM-EUREKA는 상하이 인공 지능 연구소, 상하이 자오통 대학교 및 기타 관계자들이 개발한 오픈 소스 프로젝트입니다. 이 도구는 규칙 기반 강화 학습 기법을 통해 텍스트 추론 기능을 멀티모달 시나리오로 확장하여 모델이 이미지와 텍스트 정보를 처리할 수 있도록 지원합니다. 이 도구의 핵심은...

1 년 전

078.3K

Babelfish.ai: 브라우저에서 실행되는 실시간 음성 전사 및 번역 애플리케이션

일반 소개 Babelfish.ai는 허깅페이스 트랜스포머.js와 슈퍼베이스 리얼타임을 기반으로 구축된 실시간 전사 및 번역 애플리케이션입니다. 이 애플리케이션은 브라우저에서 대형 모델을 로드할 수 있으며...

2 년 전

078.2K

Pyramid Flow: Racer에서 출시한 오픈 소스 버전의 "Kringle", SD3 기반이며 8GB 미만의 GPU에서 실행되는 버전(원클릭 배포 버전).

종합 소개 피라미드 플로우는 플로우 매칭 기법을 기반으로 하는 효율적인 자동 회귀 동영상 생성 방법입니다. 이 방법은 다양한 해상도와 노이즈 레벨 사이에서 보간하여 비디오 콘텐츠를 생성하고 압축 해제할 때 더 높은 계산 효율성을 달성합니다...

2 년 전

078.2K

제미니 넥스트 채팅: 클릭 한 번으로 비공개 멀티모달 제미니 앱을 무료로 배포하세요!

일반 소개 Gemini Next Chat은 사용자가 비공개 Gemini 애플리케이션을 쉽게 배포할 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Gemini 1.5 및 Gemini 2.0 멀티모달 모델을 지원하며, 사용자는 클릭 한 번으로 배포할 수 있습니다.

2 년 전

078.2K

에이전트 실험실: 연구자를 위한 자동화된 코드 및 연구 작성 도우미

종합 소개 에이전트 실험실은 연구자가 연구 아이디어를 실현할 수 있도록 설계된 엔드투엔드 자율 연구 워크플로우입니다. 이 시스템은 문헌 검토 및 계획 개발부터 실행까지 전체 연구 워크플로우를 지원하는 대규모 언어 모델에 기반한 전용 에이전트로 구성되어 있습니다.

1 년 전

078.2K

Audibit: 인기 기술 기사를 바로 들을 수 있는 오디오 팟캐스트로 전환하기

일반 소개 Audibit은 오픈 소스 프로젝트로, 핵심 기능은 해커 뉴스, 테크크런치 및 기타 인기 기술 기사를 자동으로 오디오 팟캐스트로 변환하여 출퇴근, 피트니스 또는 바쁜 사용자가 웹이나 모바일을 통해 정보를들을 때 사용할 수 있도록하는 것입니다. 이 프로젝트는 ...

1 년 전

078K

Skywork-R1V: 쿤룬 완웬의 그래픽 하이브리드 멀티모달 추론 모델 오픈 소스

일반 소개 Skywork-R1V는 SkyworkAI(쿤룬 완웨이) 팀이 개발하여 GitHub에 공개한 오픈 소스 다중 모드 추론 모델로, 이미지와 텍스트를 동시에 처리하고 다단계 논리적 추론을 수행할 수 있으며 특히 복잡한 이미지 문제를 분석하는 데 능숙합니다. 이...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

078K

LaWGPT: 중국어 법률 지식 모델링, 법률 퀴즈 및 사법시험 교육 지원

일반 소개 LaWGPT는 난징대학교의 기계 학습 및 데이터 마이닝 연구 그룹이 지원하는 오픈 소스 프로젝트로, 중국 법률 지식을 기반으로 대규모 언어 모델을 구축하는 데 전념하고 있습니다. 일반 중국어 모델(중국어-LLaMA 및 ChatGLM 등)을 기반으로 합니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 교육 도구

1 년 전

078K

Devin Cursor Rules：让Cursor和Windsurf 强化为 Devin

Devin 커서 규칙: Devin을 위한 커서 및 윈드서핑 강화하기

일반 소개 Devin 커서 규칙은 구성 파일과 도구를 통해 커서 및 Windsurf 통합 개발 환경(IDE)을 개선하여 Devin과 유사한 고급 AI 기능을 구현하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 다음을 제공합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

078K

VideoGrain: 비디오 오픈 소스 프로젝트의 로컬 편집을 위한 텍스트 프롬프트

일반 소개 VideoGrain은 xAI 팀이 개발하고 GitHub에서 호스팅하는 세분화된 동영상 편집에 중점을 둔 오픈 소스 프로젝트입니다. 이 프로젝트는 "VideoGrain: 공간-시간 조절" 논문에서 비롯되었습니다.

1 년 전

078K

원 프롬프트-원 스토리: 텍스트 프롬프트가 캐릭터 아이덴티티 일관된 이미지를 생성합니다.

합성 원 프롬프트-원 스토리(1Prompt1Story)는 단일 프롬프트에서 일관된 이미지를 생성할 수 있도록 설계된 혁신적인 텍스트-이미지 생성 툴입니다. 이 도구는 ICLR 2025에서 Tao Liu 등이 발표했습니다.

1 년 전

078K

크로노스: 뉴스 검색 및 타임라인 생성 효율성을 개선하는 뉴스 타임라인 요약 도구

일반 소개 CHRONOS는 Alibaba NLP 팀에서 개발한 뉴스 타임라인 요약 도구입니다. 이 도구는 반복적 인 자체 질문을 통해 뉴스 이벤트의 타임 라인 요약을 생성합니다.CHRONOS는 오픈 도메인 타임 라인 요약 작업을 처리 할 수있을뿐만 아니라 효율성과 확장 성 측면에서도 ...

2 년 전

077.9K

Chitu(Red Rabbit): 칭화 팀의 고성능 대규모 언어 모델 추론 프레임워크

Chitu는 대규모 언어 모델을 실행하도록 특별히 설계된 "Red Rabbit"이라는 칭화대학교의 PACMAN 팀이 개발한 오픈 소스 추론 프레임워크입니다. 효율성, 유연성 및 실용성에 중점을 두어 기업이 다양한 장치에 대규모 모델을 신속하게 배포할 수 있도록 합니다. Chitu는 다양한 하드웨어를 지원합니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

077.9K

RAG 기반 건강 조언을 제공하는 미니 도우미 구축(시범 프로젝트)

일반 소개 LLM-RAG-Longevity-Coach는 사용자에게 개인화된 건강 및 장수 관련 조언을 제공하도록 설계된 대규모 언어 모델링(LLM) 및 검색 증강 생성(RAG) 기술을 기반으로 하는 챗봇입니다. 이 프로젝트는 타일러 벌레가 개발했습니다...

1 년 전

077.9K

GLIGEN GUI: 이미지 요소의 위치를 정밀하게 제어, ComfyUI 기반의 직관적인 그래픽 인터페이스

일반 소개 GLIGEN GUI는 이미지에서 객체의 위치를 정밀하게 지정할 수 있는 새로운 텍스트-이미지 모델인 GLIGEN 모델의 사용을 단순화하도록 설계된 ComfyUI 기반의 직관적인 그래픽 인터페이스입니다. GLIGE...

2 년 전

077.9K

LangManus: 다중 지능 협업을 지원하는 오픈 소스 AI 자동화 프레임워크

일반 소개 LangManus는 GitHub에서 호스팅되는 오픈 소스 AI 자동화 프레임워크입니다. 전직 동료들이 여가 시간에 개발한 이 프레임워크는 웹 검색, 데이터 크롤링 및 코드 실행을 위한 언어 모델과 전문 도구를 결합하는 것을 목표로 하는 학술 중심 프로젝트입니다....

1 년 전

077.8K

NoneBot DeepSeek 插件：基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek 플러그인: NoneBot 및 DeepSeek 기반의 고객 서비스를 위한 지능형 대화.

일반 소개 NoneBot DeepSeek 플러그인은 DeepSeek 모델을 통합하는 NoneBot 플러그인으로 지능형 대화 및 Q&A 기능을 제공하도록 설계되었습니다. 사용자는 DeepSeek 모델에 액세스하여 NoneBot을 사용할 수 있습니다.

1 년 전

077.8K

Quanta Quest：端侧大模型与面向个人数据的本地化AI搜索平台（预览版）

Quanta Quest: 개인 데이터를 위한 엔드사이드 빅데이터 모델 및 현지화된 AI 검색 플랫폼(미리 보기)

소개 퀀타 퀘스트는 세계 최초로 '엔드사이드 빅데이터 모델 + C사이드 데이터 현지화'를 핵심 진화 방향으로 삼은 제품입니다. 사용자가 Gmail, Notion, Dropbox 등의 모든 데이터를 로컬에 저장하고 벡터 데이터베이스를 통해 처리할 수 있도록 지원합니다.

2 년 전

077.8K