AI 오픈 소스 프로젝트

총 1020개 문서
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID: 이미지를 업로드하고 초상화 기능을 마이그레이션하여 다양한 스타일의 이미지를 생성합니다.

개요 InstantID는 단일 참조 ID 사진을 사용하여 높은 수준의 충실도를 보장하면서 개인화된 스타일이나 포즈를 가진 이미지를 몇 초 만에 생성하는 데 중점을 둔 고급 기술입니다. 이 기술은 얼굴 이미지, 랜드마크 지도를 통합하여 확산 모델 기반 솔루션을 사용합니다....
12개월 전
02.8K
Agent Inbox:与AI智能体进行人机交互的管理界面

상담원 수신함: 인간과 컴퓨터의 AI 인텔리전스 상호작용을 위한 관리 인터페이스

일반 소개 에이전트 인박스는 AI 지능과 상호 작용할 수 있는 새로운 사용자 경험을 제공하기 위해 LangChain 팀이 개발한 오픈 소스 프로젝트입니다. 이 프로젝트를 통해 사용자는 중앙 집중식 인터페이스를 통해 여러 AI 인텔리전스와의 상호 작용을 관리하고 최적화할 수 있습니다.
7개월 전
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS 생성기: AI를 통해 웹 콘텐츠를 RSS 피드로 변환하는 도구

일반 소개 AI RSS는 AI 기술을 통해 웹 콘텐츠를 RSS 피드로 변환하는 혁신적인 도구입니다. 브라우저 플러그인과 서버 측의 두 가지 주요 부분으로 구성됩니다. 브라우저 플러그인을 통해 사용자는 웹 페이지에서 목록을 선택하고 구조화된 데이터 설명(SDD) 파일을 생성할 수 있습니다.
7개월 전
02.8K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis: 이미지 단서 단어의 정확한 역전파를 위한 시각적 및 텍스트 정렬 모델

일반 소개 Ovis(오픈 비전)는 알리바바 국제 디지털 커머스 그룹의 AIDC-AI 팀이 개발하고 깃허브에서 호스팅하는 오픈 소스 멀티모달 대규모 언어 모델(MLLM)로, 이 모델은 혁신적인 구조 임베딩 정렬 기술을 사용하여 시각화합니다....
5개월 전
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

원자 에이전트: 경량 모듈식 AI 인텔리전스를 구축하기 위한 프레임워크

일반 소개 원자 에이전트는 에이전트 AI 파이프라인 및 애플리케이션 구축을 위해 원자 개념을 중심으로 설계된 매우 가벼운 모듈식 프레임워크입니다. 이 프레임워크는 강력한 애플리케이션을 만들기 위해 결합할 수 있는 일련의 도구와 에이전트를 제공합니다. 이 프레임워크는 Instruc ...
8개월 전
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: LLM 및 EKG(업계 지식)에 기반한 새로운 에이전트 오케스트레이션 프레임워크

일반 소개 뮤에이전트는 앤트 그룹에서 개발한 혁신적인 다중 지능 프레임워크입니다. 이 프레임워크는 사용자가 캔버스 드래그 앤 드롭과 간단한 텍스트 작성을 통해 다중 지능, 함수 호출, 코드 인터프리터 및 기타 기술과 협력하여 사람의 안내에 따라 다양하고 복잡한 표준 운영 절차(SOP)를 실행할 수 있도록 도와줍니다.
9개월 전
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: HTML URL에서 본문 데이터 추출, 일반 텍스트/마크다운 출력

일반 소개 magic-html은 HTML에서 본문 영역 콘텐츠를 추출하는 프로세스를 간소화하도록 설계된 Python 라이브러리입니다. 복잡한 HTML 구조를 다루든 간단한 웹 페이지를 다루든 이 라이브러리는 사용자에게 편리하고 효율적인 인터페이스를 제공하는 것을 목표로 합니다. 멀티모달 추출을 지원합니다...
11개월 전
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

지식 테이블: 구조화된 데이터의 효율적인 추출과 탐색을 위한 오픈 소스 도구

종합 소개 지식 테이블(Knowledge Table)은 비정형 문서에서 정형 데이터를 추출하고 탐색하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 사용자는 자연어 쿼리 인터페이스를 통해 표와 그래프와 같은 구조화된 지식 표현을 만들 수 있습니다. 이 도구는 추출 사용자 지정을 지원합니다 ...
10개월 전
02.8K
FantasyTalking:生成真实感说话肖像的开源工具

판타지토킹: 사실적으로 말하는 인물 사진을 생성하는 오픈 소스 툴

일반 소개 판타지토킹은 판타지-AMAP 팀이 개발한 오픈 소스 프로젝트로, 오디오 드라이브를 통해 사실적으로 말하는 인물 비디오를 생성하는 데 중점을 두고 있습니다. 이 프로젝트는 오디오 인코더 Wa와 결합된 고급 비디오 확산 모델 Wan2.1을 기반으로 합니다.
3 개월 전
02.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

Mac 어시스턴트: macOS 기기에서 데스크톱 작업을 자동화하는 AI 인텔리전스

일반 소개 맥 어시스턴트는 기본 소프트웨어와 웹 기능을 결합하여 사용자 작업을 간소화하는 것을 목표로 하는 macOS용으로 설계된 AI 인텔리전스 바디 프로젝트입니다. 이 프로젝트는 현재 OpenAI 및 GEMINI API를 지원하며 향후 지원할 계획입니다.
6개월 전
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT 박스: 다른 웹 페이지에서 ChatGPT를 작동시키는 브라우저 플러그인

일반 소개 ChatGPT Box는 ChatGPT를 사용자의 브라우저에 긴밀하게 통합하도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. josStorer에서 개발한 이 도구는 여러 언어를 지원하며 모든 페이지에서 채팅 쌍을 호출하는 등 다양한 기능을 제공합니다.
4개월 전
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

에이전틱 보안: 포괄적인 퍼즈 테스트 및 공격 기법을 제공하는 오픈 소스 LLM 취약점 스캔 도구

일반 소개 에이전트 보안은 개발자와 보안 전문가에게 포괄적인 퍼즈 테스트 및 공격 기술을 제공하도록 설계된 오픈 소스 LLM(대규모 언어 모델) 취약점 스캔 도구입니다. 이 도구는 사용자 지정 규칙 세트 또는 에이전트 기반 공격을 지원하며 LLM AP를 통합할 수 있습니다.
6개월 전
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70B를 기반으로 하는 일반적인 시맨틱 청크 전략

종합 소개 zChunk는 제로엔트로피에서 개발한 새로운 청킹 전략으로, 일반적인 의미론적 청킹을 위한 솔루션을 제공하는 것을 목표로 합니다. 이 전략은 청크 생성을 유도하여 문서의 청크 프로세스를 최적화하고 정보 검색을 높은 수준으로 유지하도록 보장하는 Llama-70B 모델을 기반으로 합니다.
6개월 전
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA: 초안 이메일(Gmail) 응답의 신속한 생성을 위한 현지화된 AI 이메일 자동화 시스템

일반 소개 LAMBDA(로컬 자동 받은 편지함 초안 작성 도우미)는 사용자의 이메일 스타일을 학습하여 Gmail 받은 편지함의 읽지 않은 모든 이메일에 대해 초안을 생성하도록 설계된 현지화된 AI 이메일 자동화 시스템입니다....
8개월 전
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

라이트아바타: 오디오 기반의 실시간 인터랙티브 디지털 인물 2D 초상화, CPU에서 30fps로 실행됨

일반 소개 LiteAvatar는 HumanAIGC 팀(Ali의 일부)이 개발한 오픈 소스 도구로, 오디오로 구동되는 2D 아바타에서 실시간으로 얼굴 애니메이션을 생성하는 데 중점을 두고 있습니다. CPU에만 의존하여 초당 30프레임(fps)으로 실행되며, 특히 다음과 같은 경우에 적합합니다.
6개월 전
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: 데스크톱 및 브라우저 자동화를 위한 지능형 바디 워크플로 구축 자연어

일반 소개 Eko는 자연어 설명을 통해 효율적인 지능형 에이전트 워크플로우를 구축하도록 설계된 프로덕션급 자바스크립트 프레임워크입니다. 개발자가 심층적인 프로그래밍 없이도 AI 기술을 사용하여 일상적인 작업을 자동화할 수 있도록 설계되었으며, Eko는 단일 ...
5개월 전
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: 멀티모달 매크로 모델을 사용한 흉부 방사선 사진 분석용 지능형 바디

포괄적인 소개 MedRAX는 흉부 엑스레이(CXR) 분석을 위해 설계된 최첨단 AI 인텔리전스입니다. 최첨단 CXR 분석 도구와 멀티모달 대규모 언어 모델을 통합하여 추가 교육 없이 복잡한 의료 쿼리를 동적으로 처리하며, 모듈식 설계를 통해 MedRAX는 ...
5개월 전
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: 문서를 구조화된 데이터로 추출하고 분류하여 문서 처리 프로세스를 최적화합니다.

포괄적인 소개 ExtractThinker는 LLM(대규모 언어 모델)을 사용하여 문서에서 구조화된 데이터를 추출하고 분류하는 유연한 문서 인텔리전스 도구로, 원활한 ORM과 같은 문서 처리 워크플로우를 제공합니다. Tess를 비롯한 다양한 문서 로더를 지원합니다.
7개월 전
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

쌍둥이자리 놀이터: 쌍둥이자리 멀티모달 대화 사이트의 서버리스 배포

일반 소개 제미니 플레이그라운드는 사용자가 멀티모달 대화 사이트를 빠르게 배포할 수 있도록 설계된 오픈소스 프로젝트입니다. 이 프로젝트는 기술 크롤링 새우에 의해 개발되었으며 10 초 만에 Gemini API 키 사용을 지원하여 배포를 완료합니다. 사용자가 ...
6개월 전
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: 주류 오픈 소스 비주얼 언어의 모델을 미세 조정하는 프로세스를 간소화하는 도구

종합 소개 Maestro는 Roboflow에서 멀티모달 모델을 미세 조정하는 과정을 단순화하고 가속화하여 누구나 자신만의 시각적 매크로 모델을 훈련할 수 있도록 개발한 도구입니다. 이 도구는 F와 같이 널리 사용되는 시각 언어 모델(VLM)을 미세 조정하기 위한 기성 레시피를 제공합니다.
6개월 전
02.7K
Autiobooks:将epub电子书转换为m4b有声书

오디오북: epub 전자책을 m4b 오디오북으로 변환하기

일반 소개 오토북은 사용자가 .epub 형식의 전자책을 .m4b 형식의 오디오북으로 빠르게 변환할 수 있도록 설계된 오픈 소스 도구입니다. Kokoro에서 제공하는 고품질 음성 합성 기술을 사용하여 자연스럽고 부드러운 오디오를 생성합니다. 이 도구는 ...에 의해 구동됩니다.
5개월 전
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

롱라이터: 위즈덤 스펙트럼은 매우 긴 텍스트를 생성하는 강력한 모델을 출시하여 단일 대화에서 10,000개 이상의 단어를 생성할 수 있도록 지원합니다.

종합 소개 LongWriter는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 강력한 긴 텍스트 생성 도구입니다. 이 도구는 고급 장문 언어 모델(LLM)을 기반으로 하며 10,000단어 이상의 긴 텍스트를 생성할 수 있습니다.LongWriter...
8개월 전
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI: 고부가가치 AI 모델 전달 인터페이스 관리 시스템, 공식 웹사이트에서 매일 무료 API 할당량을 제공합니다.

종합 소개 VoAPI는 주로 개인 또는 기업 내부 관리 및 배포 채널에 사용되는 새로운 고도의 고성능 AI 모델 인터페이스 관리 및 배포 시스템입니다. NewAPI를 기반으로 개발된 이 시스템은 풍부한 기능 모듈과 최적화된 사용자 인터페이스를 제공하여 다음을 향상시키는 것을 목표로 합니다.
9개월 전
02.7K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion: Xiaomi의 오픈 소스 엔드투엔드 자율 주행 추론 및 계획 프레임워크

개요 오리온은 샤오미 연구소에서 개발한 오픈 소스 프로젝트로, 엔드투엔드(E2E) 자율주행 기술에 중점을 두고 있습니다. 시각적 언어 모델링(VLM)과 생성 플래너를 통해 기존 자율 주행 방식의 복잡한 시나리오에서 인과 추론이 불충분한 문제를 해결하며, 오리온은 긴 ...
4개월 전
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG 웹 UI: 지능형 문서 Q&A 시스템 구축 및 비공개 웹 사이드 지식창고 간편하게 구축하기

종합 소개 RAG 웹 UI는 RAG(검색 증강 생성) 기술을 기반으로 한 지능형 대화 시스템입니다. 기업과 개인이 자체 지식 베이스를 기반으로 지능형 Q&A 시스템을 구축할 수 있도록 도와줍니다. 문서 검색과 대규모 언어 모델을 결합하여 정확하고 신뢰할 수 있는 ...
7개월 전
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: RAG 기법을 사용하여 텍스트에서 정확한 SQL 쿼리 생성하기

포괄적인 소개 Vanna는 RAG(검색 증강 생성) 기술을 통해 SQL 쿼리를 생성하는 데 중점을 둔 MIT 라이선스 오픈 소스 Python 프레임워크입니다. 사용자는 RAG 모델을 학습하고 자신의 데이터에 적용한 다음 질문을 하면 Vanna가 적절한 답변을 반환합니다.
7개월 전
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge: 대규모 언어 모델 힌트의 효과를 테스트하고 평가하기 위한 오픈 소스 시각적 프로그래밍 환경

일반 소개 ChainForge는 대규모 언어 모델(LLM) 단서의 효과를 테스트하고 평가하기 위해 설계된 오픈 소스 시각적 프로그래밍 환경입니다. 사용자가 LLM 응답에 대한 다양한 단서의 품질을 빠르게 탐색하고 분석할 수 있는 데이터 흐름 단서 엔지니어링 환경을 제공합니다.
8개월 전
02.7K
FireRedASR:多语言高精度语音识别开源模型

FireRedASR: 다국어 고정밀 음성 인식을 위한 오픈 소스 모델

일반 소개 FireRedASR은 고정밀, 다국어 지원 자동 음성 인식(ASR) 솔루션을 제공하는 데 중점을 둔 Little Red Book FireRed 팀이 개발하여 오픈소스로 공개한 음성 인식 모델입니다. 이 프로젝트는 개발자와 연구자를 위해 GitHub에서 호스팅되며 다음과 같은 기능을 제공합니다.
5개월 전
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: 감독 지능을 사용하여 다중 지능 협업을 관리하기 위한 도구

일반 소개 LangGraph Supervisor는 다중 지능형 바디 시스템을 생성하고 관리하기 위해 설계된 LangGraph 프레임워크에 기반한 Python 라이브러리입니다. 이 라이브러리는 중앙 감독 에이전트를 통해 여러 전문 에이전트의 작업을 조정하여 통신 흐름과 작업을 분담합니다.
6개월 전
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: 의류 디테일의 사실감을 높여주는 고충실도 AI 가상 피팅 도구

종합 소개 FitDiT는 확산 변압기(확산 트랜스포머)를 기반으로 한 고충실도 가상 피팅 시스템입니다. 텐센트 AI 랩에서 개발한 이 프로젝트는 의류 디테일을 보여주는 기존 가상 피팅 시스템의 한계를 해결하는 것을 목표로 합니다.FitD...
7개월 전
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

딥 파인더: 로컬 지식을 이용한 심층 추론 검색을 위한 오픈 소스 프로젝트

종합 소개 Deep Searcher는 개인 데이터를 기반으로 검색, 평가 및 추론하도록 설계된 LLM(대규모 언어 모델)과 벡터 데이터베이스를 결합하여 매우 정확한 답변과 포괄적인 보고서를 제공하는 강력한 도구입니다. 엔터프라이즈 지식 관리에 적합합니다...
6개월 전
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

조각: Anthropic의 클로드 아티팩트, Vercel v0 또는 GPT 엔지니어와 같은 애플리케이션의 오픈 소스 버전입니다.

일반 소개 E2B의 프래그먼트는 AI로만 생성된 애플리케이션을 구축하기 위한 Next.js 기반의 템플릿을 제공하는 오픈 소스 프로젝트입니다. E2B에서 개발한 이 프로젝트는 AI 애플리케이션의 개발 프로세스를 간소화하고 가속화하는 것을 목표로 합니다. 그것은 다양한 현재를 통합합니다 ...
9개월 전
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: 통합된 멀티 플랫폼 AI 모델을 갖춘 간단한 웹 채팅 인터페이스(배포 필요 없음)

일반 소개 오리온챗은 사용자에게 여러 주류 AI 모델과 상호 작용할 수 있는 통합 플랫폼을 제공하는 웹 기반 AI 채팅 인터페이스입니다. 이 프로젝트는 Ollama(로컬에서 실행), OpenAI GPT, Google Gemi... 등 다양한 AI 모델을 지원합니다.
8개월 전
02.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack: 긴 비디오 오픈 소스 프로젝트의 6G 저용량 그래픽 메모리 빠른 성장

일반 소개 프레임팩은 동영상 확산 기술을 보다 실용적으로 만드는 데 중점을 둔 오픈 소스 동영상 생성 도구입니다. 고유한 다음 프레임 예측 신경망을 통해 입력 프레임을 고정된 길이로 압축하여 동영상 길이와 생성 워크로드를 분리합니다. 즉, 긴 동영상을 생성할 때에도 비디오 메모리 요구 사항이 ...
3 개월 전
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: 사람에서 의류를 타일형 의류 디스플레이 이미지로 추출하는 AI 도구

종합 소개 TryOffAnyone은 이커머스 분야의 의류 디스플레이 문제를 해결하기 위해 특별히 설계된 획기적인 AI 이미지 처리 툴입니다. 실제 사람이 옷을 입은 사진을 평평한 디스플레이 효과 이미지로 지능적으로 변환할 수 있으며, 이 기술은 최신 잠재 차이 기술을 기반으로 합니다.
7개월 전
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA: 시각적 추론 탐구를 위한 다중 모드 강화 학습 도구

종합 소개 MM-EUREKA는 상하이 인공 지능 연구소, 상하이 자오통 대학교 및 기타 관계자들이 개발한 오픈 소스 프로젝트입니다. 이 도구는 규칙 기반 강화 학습 기법을 통해 텍스트 추론 기능을 멀티모달 시나리오로 확장하여 모델이 이미지와 텍스트 정보를 처리할 수 있도록 지원합니다. 이 도구의 핵심은...
5개월 전
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI 실시간 API Next.js: 실시간 음성 대화 AI 애플리케이션을 구축하기 위한 Next.js 템플릿

포괄적인 소개 OpenAI 실시간 API Next.js는 개발자가 실시간 음성 AI 애플리케이션을 빠르게 구축할 수 있도록 설계된 Next.js 프레임워크 기반의 오픈 소스 프로젝트입니다. 이 프로젝트는 OpenAI의 실시간 API와 WebRTC 기술을 통합하여 ...
7개월 전
02.7K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: 효율적인 데이터 분석 및 AI 애플리케이션을 위한 데이터 과학자를 위한 오픈 소스 Python 라이브러리

일반 소개 Taipy는 데이터 과학자와 머신 러닝 엔지니어가 데이터 기반 웹 애플리케이션을 신속하게 구축하고 배포할 수 있도록 Avaiga에서 개발한 강력한 Python 라이브러리로, Taipy는 다음과 같은 전체 도구 및 구성 요소를 제공합니다.
8개월 전
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

쿼드래틱: AI 대화와 코드 실행을 통합하는 온라인 데이터 분석 양식

일반 설명 Quadratic은 사용자에게 강력한 데이터 처리 및 분석 기능을 제공하도록 설계된 AI, 코드 및 데이터 연결 기능을 결합한 오픈 소스 스마트 스프레드시트 도구입니다. Python, SQL, Rust와 같은 프로그래밍 언어를 지원함으로써 Quadratic은...
6개월 전
02.7K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

라마 튜터: 개인 맞춤형 과외를 제공하는 AI 도구로, 라마 3.1을 기반으로 구축된 오픈 소스 AI 개인 튜터 프로젝트입니다.

일반 소개 라마 튜터는 사용자에게 개인화된 학습 경험을 제공하도록 설계된 라마 3.1 기반의 오픈 소스 AI 개인 비서 프로젝트입니다. Together AI, Next.js 및 T와 같은 여러 기술 스택을 통합하여 ...
9개월 전
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: 새로운 대화형 경험을 위해 빅 언어 모델과 시각 모델을 결합한 디지털 사용자를 위한 지능형 대화 시스템

일반 소개 린리토커는 대규모 언어 모델(LLM)과 시각 모델을 결합하여 인간과 컴퓨터의 상호작용에 대한 새로운 접근 방식을 만들어내는 혁신적인 디지털 인간 대화 시스템입니다. 이 시스템은 위스퍼, 린리, 마이크로와 같은 다양한 기술을 통합합니다.
6개월 전
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

코스모스: 세계 기본 모델, 물리적 세계의 AI 기본 모델을 구축하기 위한 플랫폼

포괄적인 소개 NVIDIA Cosmos는 개발자를 위한 월드 기반 모델링 플랫폼으로, 물리 AI 개발자가 물리 AI 시스템을 더 빠르고 효율적으로 구축할 수 있도록 특별히 설계되었습니다. 이 플랫폼은 확산 및 자동 회귀 월드 기반 등 다양한 사전 훈련된 모델을 제공합니다.
7개월 전
02.7K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: 안전하고 신뢰할 수 있는 LLM 애플리케이션 테스트 도구 제공

개요 프롬프트푸는 대규모 언어 모델(LLM) 애플리케이션의 평가 및 레드팀 테스트 전용 오픈 소스 명령줄 도구이자 라이브러리입니다. 개발자에게 신뢰할 수 있는 프롬프트, 모델 및 검색 기반 생성(RAG)을 자체적으로 구축하기 위한 완벽한 도구 세트를 제공합니다.
6개월 전
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: 고해상도 3D 모델링 디지털 에셋 생성을 위한 AI 플랫폼

일반 소개 Neural4D는 사용자가 간단한 텍스트 또는 이미지 입력으로 고품질 3D 모델과 애니메이션을 빠르게 생성할 수 있도록 지원하는 혁신적인 AI 기반 플랫폼입니다. 드림테크에서 개발한 이 플랫폼은 세계 최고의 엔드투엔드 3D 대형 모델 생성 기술을 기반으로 합니다....
6개월 전
02.7K
Meeting:本地实时转录和生成会议纪要的开源客户端

회의: 오픈 소스 클라이언트의 로컬 실시간 트랜스크립션 및 회의록 생성

일반 소개 회의록(일명 Meetily)은 Zackriya Solutions에서 개발한 무료 오픈 소스 AI 회의 보조 도구로, 회의 오디오를 실시간으로 캡처하고 텍스트로 변환된 텍스트를 생성하며 회의 내용을 자동으로 추출하는 데 중점을 두고 있습니다....
5개월 전
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: 프런트엔드 디자인을 위한 오픈 소스 커서, React 애플리케이션에서 코드를 디자인하고 게시하세요.

일반 소개 Onlook은 디자이너와 개발자를 위해 만들어진 오픈 소스 디자인 도구로, 사용자가 실행 중인 React 애플리케이션에서 직접 디자인하고 디자인 변경 사항을 코드로 변환할 수 있습니다. 이 도구는 Figma나 Webf...와 유사한 직관적인 시각적 편집 환경을 제공합니다.
6개월 전
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: 1분 안에 1분짜리 동영상을 생성한다고 주장하는 효율적인 동영상 오픈소스 프로젝트

종합 소개 Magic 1-For-1은 메모리 사용량을 최적화하고 추론 지연 시간을 줄이기 위해 설계된 효율적인 비디오 생성 모델입니다. 이 모델은 텍스트 대 비디오 생성 작업을 텍스트 대 이미지 생성 및 이미지 대 비디오 생성이라는 두 가지 하위 작업으로 분해하여 보다 효율적인 학습 및 증류 작업을 가능하게 합니다.
6개월 전
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

리틀 하프 워드프레스 AI 어시스턴트: 대화, 포스트 생성 및 번역을 위한 워드프레스 AI 어시스턴트 플러그인

종합 소개 워드프레스 AI 어시스턴트 플러그인(wp-ai-chat)은 AI 대화, 글 생성, 글 요약, 글 번역, 콘텐츠 읽기 등 다양한 AI 기능을 사용자에게 제공하도록 설계된 오픈 소스 워드프레스 플러그인입니다. 플러그인은 여러 개의 도킹을 지원합니다 ...
6개월 전
02.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: 로컬에서 LLM을 실행하고 미세 조정하는 가장 빠른 방법!

일반 소개 LlamaEdge는 로컬 또는 엣지 장치에서 대규모 언어 모델(LLM)을 실행하고 미세 조정하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Llama2 모델 제품군을 지원하며 사용자가 쉽게 생성하고 실행할 수 있는 OpenAI 호환 API 서비스를 제공합니다.
7개월 전
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

미니 커버: 블로그, 짧은 동영상, 소셜 미디어 등을 위한 맞춤형 커버를 제작할 수 있는 온라인 커버 메이커!

일반 소개 미니 커버는 블로그, 짧은 동영상, 소셜 미디어 등의 플랫폼을 위한 맞춤형 커버를 생성하도록 설계된 오픈 소스 온라인 커버 생성 도구입니다. JLinMr에서 개발한 이 도구는 사용자가 자신의 필요에 맞는 표지를 빠르게 생성할 수 있는 간단하고 효율적인 솔루션을 제공하는 것을 목표로 합니다.
8개월 전
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3 및 PlayHT TTS를 기반으로 하는 NotebookLM의 오픈 소스 구현

일반 소개 오픈 소스 노트북LM은 딥시크-V3의 언어 이해 기능과 PlayHT의 음성 합성 기술을 결합한 혁신적인 인공지능 프로젝트로, 지능형 노트 필기 대화 시스템을 만드는 것을 목표로 합니다. 이 프로젝트는 Build Fast w에서 개발했습니다.
7개월 전
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 고품질 선화 및 스케치 생성, 이미지 단서 단어 역전파, 원클릭 패키지 설치

일반 소개 Sketch-Gen은 아티스트와 디자이너가 고품질의 선화와 스케치를 빠르게 생성할 수 있도록 설계된 AI 기술 기반의 선화 및 스케치 생성 도구입니다. 페인츠-언두 프로젝트에서 파생된 이 도구는 고급 머신 러닝 모델을 사용해 다음을 수행할 수 있습니다.
8개월 전
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 비디오 이해와 여러 차례의 대화를 지원하는 오픈 소스 멀티모달 모델

종합 소개 CogVLM2는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 멀티모달 모델로, Llama3-8B 아키텍처를 기반으로 하며 GPT-4V와 비슷하거나 더 나은 성능을 제공하는 것을 목표로 합니다. 이 모델은 이미지 이해, 다원 대화, 시각적 ...
6개월 전
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

에이전트 클라이언트 데모: 직관적인 그래픽 사용자 인터페이스를 제공하여 지능형 바디를 실행하는 프로세스를 시연하는 Python 클라이언트

종합 소개 AgentClientDemo는 지능형(에이전트) 및 클라이언트(클라이언트) 기능을 통합하는 종합적인 Python 프로젝트입니다. 이 프로젝트는 PyQt 프레임워크를 기반으로 하며 직관적이고 사용하기 쉬운 그래픽 사용자 인터페이스(G...
8개월 전
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: LLM 취약점을 탐지하고 안전한 생성 AI를 위한 오픈 소스 도구

포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....
9개월 전
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: 텍스트, 이미지 및 오디오 멀티모달 이해 및 분석을 지원하는 엔드사이드 멀티모달 이해 모델

종합 소개 인피니메그레즈는 하드웨어와 소프트웨어의 공동 설계를 통해 효율적인 멀티모달 이해와 분석을 목표로 하는 인피닛 코어 돔(인피닛 AI)이 개발한 엣지 인텔리전스 솔루션입니다. 프로젝트의 핵심은 그래프를 지원하는 Megrez-3B 모델입니다.
7개월 전
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: 고품질의 긴 글을 작성하고, 외부 지식을 검색한 다음 이를 반영하여 단계별로 지식 트리를 구축하기 위한 글쓰기 프레임워크입니다.

포괄적인 소개 OmniThink는 인간의 인지 과정의 반복적인 확장과 반영을 모방하여 고품질의 긴 형식의 에세이를 생성하도록 설계된 혁신적인 기계 글쓰기 프레임워크입니다. 이 프레임워크는 지식의 경계를 확장하고 풍부하고 깊이 있는 정보를 생성하는 데 중점을 두며, 이를 위해 다음과 같이 구성됩니다.
7개월 전
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: 다국어 입력 및 긴 비디오 생성을 지원하는 Vincennes 비디오 모델

종합 소개 Step-Video-T2V는 StepFun AI(StepFun Star)의 고급 텍스트-비디오 변환 모델입니다. 이 모델에는 30억 개의 매개변수가 있으며 최대 204fps의 동영상을 생성할 수 있습니다. 고도로 압축된 가변 자동 인코더(VAE)를 통해 이 모델은 ...
6개월 전
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

박판-스플라인-모션 모델: 정적 인물 맵 레퍼런스 비디오 인물 모션 생성 비디오

일반 소개 박판 스플라인 모션 모델은 CVPR 2022에서 발표된 획기적인 이미지 애니메이션 생성 프로젝트입니다. 이 프로젝트는 박판 스플라인 변환 이론을 기반으로 하며, 주행 영상을 기반으로 정지 이미지에서 고품질의 모션을 구현할 수 있습니다.
7개월 전
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

AI 투자 시스템: 시장 데이터 분석을 위해 다중 지능 시스템을 사용하는 자동화된 A주 투자 의사결정 시스템

종합 소개 A_Share_investment_Agent는 다중 지능 시스템에 기반한 A주 투자 의사 결정 보조 시스템입니다. 이 시스템은 여러 협업 지능을 통해 시장 데이터를 분석하고, 주식의 내재 가치를 계산하고, 시장 심리 및 펀더멘털 데이터를 분석하여 다음과 같은 작업을 수행하도록 설계되었습니다.
7개월 전
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: 다중 지능형 신체 애플리케이션을 구축하기 위한 상탕의 오픈 소스 로우코드 개발 도구

포괄적인 소개 LazyLLM은 LazyAGI 팀이 개발한 오픈 소스 도구로, 다중 지능 대규모 모델 애플리케이션의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 개발자는 원클릭 배포와 가벼운 게이트웨이 메커니즘을 통해 복잡한 AI 애플리케이션을 빠르게 구축하여 지루한 엔지니어링 구성을 줄일 수 있습니다.
6개월 전
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

중국어 기반 풀 블러드 DeepSeek-R1 증류 데이터 세트, 중국어 R1 증류 SFT 데이터 세트 지원

종합 소개 중국 DeepSeek-R1 증류 데이터 세트는 기계 학습 및 자연어 처리 연구를 지원하도록 설계된 11만 개의 데이터가 포함된 오픈 소스 중국어 데이터 세트입니다. 이 데이터 세트는 Cong Liu의 NLP 팀에서 공개했습니다. 이 데이터 세트에는 수학 데이터뿐만 아니라 다수의 일반 유형도 포함되어 있습니다.
6개월 전
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDF 스캔 문서를 마크다운 오픈 소스 도구로 변환하기

일반 소개 PDF Craft는 책의 PDF를 스캔하고 마크다운 형식으로 변환하기 위해 설계된 오픈 소스 도구입니다. oomol-lab에서 개발했으며 전자책을 정리하고 싶어하는 사용자를 위해 깃허브에서 호스팅됩니다. 이 도구는 이것을 통해 작동합니다 ...
5개월 전
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: 노드 오케스트레이션 기반의 AI 모델용 워크플로 시각화 클라이언트

일반 소개 노드툴은 AI 애호가, 개발자, 데이터 과학자, 크리에이터를 위한 간단하고 직관적인 인터페이스를 제공하도록 설계된 혁신적인 AI 저작 플랫폼입니다. 아티스트, 개발자, 초보자 모두 NodeTool을 사용하면 창의적인 프로토타입을 빠르게 제작할 수 있습니다.
8개월 전
02.7K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW: 확장 가능한 플러그인을 갖춘 완전한 기능의 경량 크로스 플랫폼 AI 클라이언트

포괄적인 소개 AIaW(AI as Workspace)는 모든 기능을 갖춘 가볍고 확장 가능한 솔루션을 제공하도록 설계된 차세대 AI 클라이언트입니다. 이 플랫폼은 OpenAI, Anthropic, Google을 비롯한 다양한 서비스 제공업체를 지원하며 다음을 수행할 수 있습니다.
8개월 전
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

솔라나 에이전트 키트: AI 인텔리전스를 솔라나 프로토콜에 연결하기 위한 오픈 소스 툴킷

일반 소개 솔라나 에이전트 키트는 AI 지능을 솔라나 블록체인 프로토콜에 원활하게 연결하도록 설계된 오픈 소스 툴킷입니다. 이 키트를 사용하면 AI 연구자와 암호화폐 개발자 모두 모델 훈련을 받은 지능형 기관을 사용하여 다음을 실행할 수 있습니다.
6개월 전
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

위챗 마크다운 에디터: 간단하고 효율적인 위챗 그래픽 레이아웃 도구, 위챗 공개 번호에 기사를 붙여넣는 열쇠입니다.

종합 소개 WeChat 마크다운 편집기(WeChat 마크다운 편집기)는 사용자가 아름다운 WeChat 게시물을 쉽게 작성할 수 있도록 설계된 매우 간결한 WeChat 그래픽 레이아웃 도구입니다. 이 에디터는 모든 기본 마크다운을 지원합니다.
7개월 전
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 방대한 다중 소스 문서에서 콘텐츠를 검색하고 지식을 요약하세요.

종합 소개 wdoc은 대량의 다양한 문서를 처리하고 분석하기 위해 설계된 강력한 RAG(검색 증강 생성) 시스템입니다. PDF, 웹 페이지, YouTube 동영상, 오디오 파일 등 다양한 문서 유형에서 검색할 수 있으며, 특히 다음과 같은 처리에 적합합니다.
6개월 전
02.7K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: 맞춤형 면접 질문과 지능형 분석을 생성하는 오픈 소스 AI 음성 면접 플랫폼

일반 소개 FoloUp은 기업을 위한 AI 기반 음성 면접 솔루션을 제공하기 위해 설계된 오픈 소스 플랫폼입니다. FoloUp을 통해 기업은 직무 설명에 맞는 맞춤형 면접 질문을 빠르게 생성하고 AI와 자연스러운 대화형 면접을 진행할 수 있습니다. 이 플랫폼은 또한 상세한 인터뷰 분석도 제공합니다...
5개월 전
02.7K