최신 AI 리소스

共 2976 篇文章
iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸

AI: 지능형 AI 사진 편집기|무료 이미지 배경 제거|모델 꾸미기|얼굴 바꾸기

iFoto 일반 설명 ifoto는 전자상거래용으로 설계된 무료 온라인 AI 사진 편집 도구로 온라인 제품 프레젠테이션을 향상시키는 다양한 기능을 제공합니다. AI 기술을 통해 의류 모델을 사실적인 모델로 변환하고 제품에 대한 실제 장면의 다양한 배경을 제공합니다.
1 년 전
061.8K
iSlide:让PPT设计简单起来,PPT插件,PPT模板下载平台

iSlide : PPT 디자인을 간단하게 만들고, PPT 플러그인, PPT 템플릿 다운로드 플랫폼

포괄적 인 소개 iSlide는 사용자에게 방대한 양의 고품질 PPT 템플릿, 자료, 차트, 글꼴 및 기타 리소스를 제공하는 것을 목표로하는 전문 PPT 디자인 지원 도구입니다. iSlide를 사용하면 사용자는 고품질 PPT 프레젠테이션을 빠르게 만들고 90% 디자인 시간을 절약 할 수 있습니다.
1 년 전
061.8K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop: 자연어 컨트롤을 사용하는 브라우저 자동화 도구

일반 소개 Airtop은 AI 기반 브라우저 자동화 도구입니다. 사용자는 간단한 자연어 명령을 통해 클라우드 브라우저를 제어하여 웹사이트 로그인, 데이터 크롤링 또는 자동화 작업 수행과 같은 복잡한 웹 작업을 수행할 수 있습니다. 복잡하고 용량이 큰 기존 스크립트 작성의 문제를 해결합니다.
12개월 전
061.7K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

오픈 캔버스: 코드 편집 협업 캔버스, OpenAI 캔버스/클라우드 아티팩트 오픈 소스 버전

일반 소개 LangChain은 내장된 이중 에이전트 메모리 기능과 전체 실행 세부 사항을 관찰할 수 있는 통합 스미스를 통해 문서 편집 및 협업 경험을 향상하도록 설계된 오픈 소스 웹 애플리케이션인 오픈 캔버스를 선보입니다. 이 플랫폼은 오픈에이...
1 년 전
061.7K
Austen:分析书籍角色关系并生成图表的AI工具

Austen: 책 속 인물 관계를 분석하고 그래프를 생성하는 AI 도구

일반 소개 Austen은 Angular 프레임워크와 Analogjs 초기화를 사용하는 오픈 소스 AI 도구로, Mermaidjs 기술과 결합하여 사용자가 책 속 인물 관계를 분석하는 데 도움이 되는 차트를 생성합니다. 사용자는 열기...를 입력할 수 있습니다.
11개월 전
061.7K
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势

아바타 포즈 메이커: 개인화된 스탠드업 스켈레톤 포즈의 온라인 생성

일반 설명 아바타 포즈 메이커는 사용자가 개인화된 스탠드업 포즈를 디자인하고 생성할 수 있는 온라인 도구입니다. 사용자가 좋아하는 포즈를 만들어 3D 모델을 간단하고 효과적으로 제어할 수 있는 방법을 제공합니다. 특히 초보자에게 적합하며 다음과 같은 기능을 제공합니다.
1 년 전
061.7K
MyMap AI:通过聊天快速生成流程图和各类图表

MyMap AI: 채팅을 통해 빠르게 순서도 및 다양한 도표 생성하기

일반 소개 MyMap AI는 사용자에게 간단하고 빠른 시각화 솔루션을 제공하기 위해 고안된 AI 기반 온라인 도구입니다. 사용자는 디자인 경험 없이도 텍스트 채팅만으로 마인드맵, 순서도, 프레젠테이션 및 기타 콘텐츠를 생성할 수 있습니다. 이 웹사이트는 다중 입력을 지원합니다...
11개월 전
061.7K
UltraLight Digital Human:开源端侧实时运行的超轻量级数字人,附一键安装包

울트라라이트 디지털 휴먼: 원클릭 설치 패키지로 초경량 디지털 휴먼을 실시간으로 실행하는 오픈 소스 엔드사이드 실시간 실행

일반 소개 초경량 디지털 휴먼은 모바일 기기에서 실시간으로 실행 가능한 초경량 디지털 휴먼 모델을 개발하는 오픈소스 프로젝트입니다. 이 프로젝트는 알고리즘과 모델 구조를 최적화하여 모바일 기기에서 원활하게 작동할 수 있도록 합니다.
1 년 전
061.6K
Midjourney:创造你想象中的图像|Midjourney中文官网介绍|官网开放免费测试

미드저니: 상상 속의 이미지 만들기| 미드저니 중국어 웹사이트 소개| 무료 테스트용 공식 웹사이트 오픈

미드저니 소개 미드저니는 새로운 사고의 매체를 탐구하고 인류의 상상력을 확장하는 독립 연구실입니다. 텍스트 설명을 기반으로 이미지를 생성하는 AI 서비스를 제공하여 사용자가 사실적인 풍속화부터 추상적인 풍속화까지 다양한 예술 형식을 만들 수 있도록 합니다.
1 년 전
061.6K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端

HyperChat: MCP 인텔리전스를 사용하여 복잡한 작업을 수행하는 AI 대화 클라이언트

일반 소개 HyperChat은 BigSweetPotatoStudio에서 개발하고 GitHub에서 호스팅하는 오픈 소스 채팅 클라이언트로, OpenAI, Cla... 등 여러 대형 언어 모델(LLM)의 API를 통합하여 BigSweetPotatoStudio 언어 모델에 대한 포괄적인 개요를 제공하도록 설계되었습니다.
1 년 전
061.6K
StudyX:AI驱动的作业解答与学习助手

StudyX: AI 기반 숙제 솔루션 및 학습 도우미

일반 소개 StudyX는 학생과 평생 학습자를 위해 설계된 AI 학습 플랫폼으로, 숙제와 학습 자료에 대한 빠르고 정확한 답변을 제공하는 데 중점을 두고 있습니다. 수학, 물리, 화학, 문학 등 다양한 과목을 지원하며, 사용자가 텍스트, 사진 또는 공식을 통해 질문을 입력하면 자세한 답변을 얻을 수 있습니다.
11개월 전
061.6K
Ajelix:智能化Excel数据分析工具,接入多种数据源,AI生成各类可视化分析图表

Ajelix: 지능형 Excel 데이터 분석 도구, 다양한 데이터 소스에 대한 액세스, 다양한 시각적 분석 차트를 생성하는 AI

일반 소개 Ajelix는 데이터 분석 및 비즈니스 인텔리전스에 중점을 둔 플랫폼으로, Excel과 Google 스프레드시트의 사용을 단순화하고 향상시키는 다양한 AI 도구를 제공합니다. 이 플랫폼에는 Excel 수식 생성기, 데이터 ... 등 17개 이상의 AI 도구가 있습니다.
1 년 전
061.5K
Oliva:语音控制的多智能体产品搜索助手

올리바: 음성 제어 다중 지능 제품 검색 도우미

일반 소개 Oliva는 GitHub의 Deluxer에서 개발한 오픈 소스 다중 지능 지원 도구입니다. 여러 AI 지능의 협업을 통해 사용자가 Qdrant 데이터베이스에서 제품 정보를 검색할 수 있도록 도와줍니다. 주요 특징은 음성 조작을 지원한다는 것입니다...
12개월 전
061.5K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流

빠른 에이전트: 다중 지능형 바디 워크플로를 빠르게 구축하기 위한 선언적 문법 및 MCP 통합

일반 소개 Fast-Agent는 개발자가 다중 지능 워크플로를 신속하게 정의, 테스트 및 구축할 수 있도록 설계된 GitHub의 평가 팀이 관리하는 오픈 소스 도구입니다. 이 도구는 간단한 선언적 구문을 기반으로 하며 MCP(모드...
1 년 전
061.5K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS: 실제 사람이 말하는 목소리를 모방하는 음성 생성 모델(ChatTTS 원클릭 가속 패키지)

일반 소개 ChatTTS는 대화 시나리오를 위해 설계된 생성형 음성 모델입니다. 자연스럽고 표현력이 풍부한 음성을 생성하고, 여러 언어와 여러 화자를 지원하며, 대화형 대화에 적합합니다. 이 모델은 웃음, 일시 정지, 감탄사 등 세분화된 리듬을 예측하고 제어하여 이를 수행합니다.
1 년 전
061.5K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

잘못된 JSON 문자열을 수정하고 LLM에서 생성된 JSON 데이터에서 발생할 수 있는 서식 지정 오류를 해결합니다.

일반 설명 잘못된 JSON 파일을 수정하는 모듈로, 특히 LLM(대규모 언어 모델)에서 출력되는 잘못된 JSON 데이터를 구문 분석하기 위한 모듈입니다. 이 모듈은 따옴표 누락, 잘못된 쉼표, 이스케이프되지 않은 문자 및 불완전한 키-값과 같은 일반적인 JSON 구문 오류를 수정합니다.
1 년 전
061.5K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

플라잉 패들 PP-TableMagic: 복잡한 테이블을 위한 구조화된 정보 추출

표 인식의 목표는 이미지에서 표를 구문 분석하여 표 구조와 셀 위치를 정확하게 식별하고 이를 구조화된 표 형식(예: HTML)으로 변환하는 것입니다. 오늘날의 정보화 시대에는 여전히 많은 양의 중요한 표 데이터가 비정형화된 상태로 존재합니다(예: 통계표 그림이 있는 스캔 문서...).
1 년 전
061.5K
LLaMA Factory:高效微调百余种开源大模型,轻松实现模型定制

LLaMA Factory: 100개가 넘는 오픈 소스 매크로 모델의 효율적인 미세 조정, 손쉬운 모델 커스터마이징

일반 소개 LLaMA-Factory는 100개가 넘는 대규모 언어 모델(LLM)의 유연한 커스터마이징과 효율적인 학습을 지원하는 통합적이고 효율적인 미세 조정 프레임워크입니다. 내장된 LLaMA 보드 웹 인터페이스를 통해 사용자는 모델링을 완료하기 위해 코드를 작성할 필요가 없습니다.
1 년 전
061.4K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

레코드 카페: 원스톱 오디오/비디오 처리 플랫폼|비디오 생성|AI 자막|오디오 추출|음성 텍스트 변환

개요 레코드 카페는 원스톱 오디오/비디오 처리 플랫폼으로, AI 영상 대화, AI 자막, AI 음성 텍스트 변환 서비스를 제공합니다. 화면 녹화, 동영상 편집, GIF/오디오 변환 등의 기능을 제공하며, 클라우드 저장 및 공유를 지원합니다. 인터페이스는 직관적이고 사용하기 쉬우며 다중 화면 녹화 및 다국어 스마트 ...
1 년 전
061.4K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

YouTube 더빙: YouTube 동영상을 다른 언어로 번역하고 실시간으로 더빙을 동기화합니다.

일반 소개 YouTube 더빙은 동영상 제작자와 시청자에게 다국어 더빙 서비스를 제공하기 위해 고안된 지능형 더빙 플랫폼입니다. 이 플랫폼은 AI 기술을 통해 YouTube 동영상에서 자동으로 번역하고 더빙을 생성하여 여러 언어와 음성 스타일을 지원합니다. 사용자는 설치만 하면...
1 년 전
061.4K
SUDOAI:免费且易上手的文本或图片转3D建模工具

SUDOAI: 사용하기 쉬운 무료 텍스트 또는 이미지 3D 모델링 도구

일반 소개 SUDOAI는 힐봇이 제공하는 혁신적인 AI 플랫폼으로, AI 기술을 통해 고품질의 3D 모델을 생성하는 데 중점을 두고 있습니다. 사용자는 간단한 텍스트 설명이나 이미지 업로드를 통해 3D 모델을 빠르게 생성할 수 있으며 주로 게임 개발, 메타 유니버스 및 ...
1 년 전
061.4K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: 고해상도 3D 모델링 디지털 에셋 생성을 위한 AI 플랫폼

일반 소개 Neural4D는 사용자가 간단한 텍스트 또는 이미지 입력으로 고품질 3D 모델과 애니메이션을 빠르게 생성할 수 있도록 지원하는 혁신적인 AI 기반 플랫폼입니다. 드림테크에서 개발한 이 플랫폼은 세계 최고의 엔드투엔드 3D 대형 모델 생성 기술을 기반으로 합니다....
1 년 전
061.3K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: 가사를 전체 노래의 기본 모델로 변환하여 다양한 음악 스타일을 지원합니다.

일반 소개 YuE는 가사를 전체 곡으로 변환하는 데 중점을 둔 오픈 소스 전체 곡 생성 기본 모델입니다. 비보컬 음악의 짧은 스니펫만 생성하는 다른 모델과 달리 YuE는 최대 몇 분 길이의 리드 보컬과 백 보컬이 포함된 전체 곡을 생성할 수 있습니다. 이 모델은 음악 생성을 ...
1 년 전
061.3K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: 대규모 모델 그룹 채팅 프레임워크: 여러 개의 대규모 언어 모델과 동시에 채팅하기

종합 소개 OpenAOE는 오픈 소스 대규모 모델 그룹 채팅 프레임워크로, 현재 시장에 여러 모델이 병렬로 응답하는 채팅 프레임워크가 부족한 문제를 해결하기 위해 개발되었습니다. OpenAOE를 사용하면 사용자는 여러 LLM(대규모 언어 모델)과 동시에 대화하고 병렬 출력을 얻을 수 있습니다. 이 프레임워크는 다음을 지원합니다.
1 년 전
061.3K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台

GeekAI: 다중 모델 API 운영 백엔드에 완벽하게 액세스할 수 있는 자체 배포된 상용 다기능 AI 어시스턴트입니다.

포괄적인 소개 GeekAI는 AI 빅 언어 모델 API 구현을 기반으로 하는 AI 비서를 위한 오픈 소스 솔루션의 전체 세트입니다. 이 프로젝트는 즉시 사용 가능한 운영 관리 백엔드와 함께 제공되며 ChatGPT, Azure, ChatGLM, 슌페이 스타파이어, 웬신 이인 및 기타 여러 플랫폼과 통합되어 있습니다.
1 년 전
061.3K
闲鱼卖家全天自动值守的AI客服机器人

Idle Fish 판매자가 24시간 자동으로 유인하는 AI 고객 서비스 봇

종합 소개 XianyuAutoAgent는 개발자 shaxiu가 GitHub에서 오픈소스로 공개한 Idlefish 플랫폼용으로 설계된 지능형 고객 서비스 로봇 시스템입니다. AI 기술을 사용하여 7×24 시간 자동 근무를 수행하여 유휴 물고기 판매자가 응답할 수 있도록 지원합니다.
12개월 전
061.3K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: 다중 지능형 신체 애플리케이션을 구축하기 위한 상탕의 오픈 소스 로우코드 개발 도구

포괄적인 소개 LazyLLM은 LazyAGI 팀이 개발한 오픈 소스 도구로, 다중 지능 대규모 모델 애플리케이션의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 개발자는 원클릭 배포와 가벼운 게이트웨이 메커니즘을 통해 복잡한 AI 애플리케이션을 빠르게 구축하여 지루한 엔지니어링 구성을 줄일 수 있습니다.
1 년 전
061.3K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Gemini 모델을 사용하여 클릭 한 번으로 짧은 내레이션 동영상 또는 긴 동영상의 동영상 요약을 만듭니다.

개요 AI2SRT는 GeminiAI 빅 모델을 사용하여 한 번의 클릭으로 짧은 내레이션 동영상과 긴 동영상의 동영상 요약을 생성하는 동시에 오디오 및 동영상 전사 자막을 지원하는 오픈 소스 프로젝트입니다. 이 프로젝트는 동영상 콘텐츠 제작 과정을 간소화하고 효율적인 자막 생성 및 번역 기능을 제공하는 것을 목표로 합니다. 사용자는 통과할 수 있습니다...
1 년 전
061.3K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.
1 년 전
061.2K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge: 로컬에서 LLM을 실행하고 미세 조정하는 가장 빠른 방법!

일반 소개 LlamaEdge는 로컬 또는 엣지 장치에서 대규모 언어 모델(LLM)을 실행하고 미세 조정하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Llama2 모델 제품군을 지원하며 사용자가 쉽게 생성하고 실행할 수 있는 OpenAI 호환 API 서비스를 제공합니다.
1 년 전
061.2K
Vsub:输入文字或模板生成无需露脸的病毒营销视频

Vsub: 텍스트 또는 템플릿을 입력하여 얼굴을 노출하지 않아도 되는 바이럴 마케팅 동영상을 생성할 수 있습니다.

일반 소개 Vsub는 동영상 콘텐츠 제작 자동화에 중점을 둔 플랫폼으로, 콘텐츠 제작자가 얼굴 없는 동영상(페이스리스 동영상)을 빠르게 생성할 수 있도록 설계되었습니다. 인공지능 기술을 활용하여 사용자가 텍스트를 입력하거나 유튜브에 적합한 사전 설정 템플릿을 선택하여 동영상을 만들 수 있습니다.
1 년 전
061.2K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: 비디오 영상에 동기화된 음향 효과 및 사운드 트랙 생성, 비디오-오디오 멀티모달 코트레이닝 도구

일반 소개 MMAudio는 공동 멀티모달 훈련을 통해 고품질의 동기화된 오디오를 생성하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 홍콩 중문대학교의 호케이 쳉 등이 개발한 이 프로젝트의 주요 기능은 비디오 및/또는 텍스트 입력을 기반으로 동기화된 오디오를 생성하는 것입니다.MM...
1 년 전
061.1K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: 고해상도 이미지의 빠른 생성, 0.6B 초소형 모델, 로우 프로파일 노트북 GPU 작동

일반 소개 Sana는 NVIDIA 연구소에서 개발한 효율적인 고해상도 이미지 생성 프레임워크로, 최대 4096 × 4096 해상도의 이미지를 단 몇 초 만에 생성할 수 있으며, 선형 확산 트랜스포머와 딥 압축 셀프 인코더 기술을 사용하여 이미지를 크게...
1 년 전
061.1K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

자동 심층 연구: 문헌 쿼리 수행 및 연구 보고서 생성을 위한 다중 에이전트 협업

일반 소개 자동 심층 연구는 홍콩대학교 데이터 인텔리전스 연구소(HKUDS)에서 개발한 오픈 소스 AI 도구로, 사용자가 심층 연구 작업을 자동화할 수 있도록 지원하는 것을 목표로 합니다. 자동 에이전트 프레임워크를 기반으로 구축되었으며 여러 대규모 언어 모델을 지원합니다...
12개월 전
061.1K
removebg:一键去除图片背景,removebg在线免费中文版

removebg : 한 번의 클릭으로 사진 배경 제거, removebg 온라인 무료 중국어 버전

removebg 일반 설명 removebg는 사진의 배경을 자동으로 제거하는 온라인 도구로, 사용자는 사진을 업로드하기만 하면 되며, 시스템은 배경이 없는 투명한 이미지를 즉시 제공합니다. removebg는 고급 인공 지능 기술을 사용하여 사진 속의 사람, 동물을 인식합니다.
2 년 전
061.1K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

AR 드로잉: AR 및 AI 기술을 사용하여 사실적인 손 그리기 기술을 향상시키는 앱입니다.

일반 설명 AR 드로잉은 증강 현실(AR) 기술을 사용하여 사용자의 그림 실력을 향상시키는 데 도움을 주는 앱입니다. 이 앱은 초급부터 고급까지 다양한 수준의 드로잉 템플릿을 다루는 200개 이상의 단계별 가이드 드로잉 레슨을 제공합니다. 사용자는 휴대폰 카메라를 사용하여 이미지를 전송할 수 있습니다...
1 년 전
061.1K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

히비키: 실시간 음성 번역 모델, 원 음성의 특성을 보존하는 스트리밍 번역

일반 소개 히비키는 규타이 랩에서 개발한 고충실도 실시간 음성 번역 모델입니다. 기존의 오프라인 번역기와 달리 Hibiki는 사용자가 말하는 동안 실시간으로 대상 언어로 자연스러운 음성 번역을 생성할 수 있을 뿐만 아니라 텍스트 번역도 제공합니다. 모델...
1 년 전
061K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧

터프 텅 AI: AI 대화로 면접 및 직장 내 커뮤니케이션 기술 연습하기

일반 소개 터프 텅 AI는 어려운 대화 연습을 위해 설계된 인공 지능 플랫폼입니다. 사용자는 사전 설정된 시나리오를 선택하거나 사용자 지정 시나리오를 생성하여 면접, 연봉 협상, 영업 프레젠테이션 등 다양하고 복잡한 대화 상황을 시뮬레이션할 수 있습니다. 이 플랫폼은 비디오 및 ...
1 년 전
061K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

음성 노트: AI 음성 메모, 음성 녹음 및 전사, 회의 콘텐츠의 지능적인 관리

일반 소개 Voicenotes는 사용자가 음성 메모와 회의를 쉽게 녹음하고 관리할 수 있도록 설계된 스마트 음성 메모 앱입니다. 이 앱은 100개 이상의 언어로 음성 녹음을 지원합니다. 사용자는 자신의 생각을 말하기만 하면 Voicenotes가 자동으로 텍스트로 변환해 줍니다.
1 년 전
061K
Gemini Playground:无服务器部署Gemini多模态对话网站

쌍둥이자리 놀이터: 쌍둥이자리 멀티모달 대화 사이트의 서버리스 배포

일반 소개 제미니 플레이그라운드는 사용자가 멀티모달 대화 사이트를 빠르게 배포할 수 있도록 설계된 오픈소스 프로젝트입니다. 이 프로젝트는 기술 크롤링 새우에 의해 개발되었으며 10 초 만에 Gemini API 키 사용을 지원하여 배포를 완료합니다. 사용자가 ...
1 년 전
060.9K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

울트라박스: 실시간 엔드투엔드 음성 대화를 위한 오디오 멀티모달 매크로 모델, GPT-4o 음성 상호작용의 오픈 소스 구현

종합 소개 Ultravox는 실시간 음성 처리를 위해 설계된 혁신적인 멀티모달 대규모 언어 모델(LLM)입니다. 기존의 음성 인식 시스템과 달리 Ultravox는 별도의 ASR(오디오 음성 인식) 단계가 필요하지 않으며, 오디오를 고차원 공간으로 직접 변환할 수 있습니다.
1 년 전
060.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: 복잡한 형식의 문서를 구문 분석하고 멀티모달 데이터를 메타데이터와 텍스트로 추출합니다.

포괄적인 소개 NV Ingest(NVIDIA Ingest)는 수십만 개의 복잡하고 지저분한 비정형 PDF 및 기타 엔터프라이즈 문서를 구문 분석하도록 설계된 조기 액세스 마이크로서비스 제품군입니다. 이러한 문서를 메타데이터 및 텍스트로 변환하여 검색에 포함할 수 있습니다.
1 년 전
060.9K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识

시크릿 AI 검색: 광고 없는 효율적인 학술 검색 서비스, 심층 지식 마이닝을 위한 연구 모델 제공

회사 소개 시크릿 AI 검색은 인공지능 기술을 통한 생산성 향상에 전념하는 기술 기업입니다. 사용자에게 정확하고 빠른 검색 결과를 제공하는 것을 목표로 광고 없이 효율적인 학술 검색 서비스를 제공합니다. 시크릿타워 AI 검색은 자체 개발한 대규모 언어 모델인 MetaLLM을 보유하고 있으며, 이를 통해 ...
1 년 전
060.8K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - 알리 통이 오픈 소스 AI 학습 데이터 합성 시스템

웹쉐이퍼는 알리바바의 통이 연구소에서 출시한 AI 학습 데이터 합성 시스템으로, 공식 모델링 및 지능 확장 메커니즘을 기반으로 고품질의 확장 가능한 학습 데이터를 생성하여 AI 지능이 복잡한 정보 검색 기능을 향상시킬 수 있도록 지원합니다. 이 시스템은 "지식 투영"의 개념을 도입합니다 ...
8개월 전
060.8K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT: 객실 사진을 업로드하고 AI를 사용하여 다시 디자인하세요!

일반 소개 RoomGPT는 사용자가 방 사진을 업로드하고 인공지능 기술을 사용하여 새롭게 디자인된 버전을 생성할 수 있는 GitHub 사용자 Nutlope가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자가 비싼 디자이너 비용 없이 전문가 수준의 인테리어 디자인을 이용할 수 있도록 하는 것을 목표로 합니다....
1 년 전
060.7K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: 멀티모달 검색 및 지식 그래프 구성을 지원하여 매우 긴 동영상을 이해하기 위한 RAG 프레임워크입니다.

포괄적인 소개 VideoRAG는 매우 긴 컨텍스트 비디오를 처리하고 이해하도록 설계된 검색 강화 생성 프레임워크입니다. 이 도구는 그래프 중심의 텍스트 지식 기반과 계층적 멀티모달 컨텍스트 인코딩을 결합하여 단일 NVIDIA RTX 3090 GPU에서 효율적으로 처리합니다....
1 년 전
060.7K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)

희요: 아이와 동행하는 AI 동반자이자 아이들의 학습 경험을 향상시키는 지능형 AI 파트너(유료)

일반 설명 Heeyo는 3-11세 어린이가 대화형 게임과 대화를 통해 학습 경험을 향상시킬 수 있도록 설계된 AI 앱으로, 하버드와 스탠퍼드의 교육 전문가가 설계했으며 수학, 과학 및 사회 정서적 기술을 다루는 2000개 이상의 학습 게임을 제공합니다. Kids...
1 년 전
060.7K
Tabnine:AI代码助手,集成在IDE中生成代码用例插件(付费)

Tabnine: 코드 사용 사례 플러그인(유료)을 생성하기 위해 IDE에 통합된 AI 코드 도우미

일반 소개 Tabnine은 개발자가 고품질 코드를 더 빠르게 작성할 수 있도록 설계된 AI 기반 코드 완성 도구입니다. 탭나인은 생성형 AI 모델을 사용하여 문맥과 구문을 기반으로 다음 코드 줄을 예측하고 제안하며, 다양한 프로그래밍 언어와 집합을 지원합니다.
1 년 전
060.7K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Fast GraphRAG: 정확도가 높고 비용이 저렴한 그래픽 검색 향상 생성 도구

종합 소개 Fast GraphRAG는 지식 그래프와 페이지랭크 알고리즘을 통해 효율적이고 정확한 검색 증강 생성(RAG)을 가능하게 하기 위해 Circlemind AI에서 개발한 오픈 소스 도구입니다. 이 도구는 사용자의 용도에 맞게 지능적으로 적응합니다...
1 년 전
060.7K
NoteGPT:智慧学习助手|总结视频音频|生成思维导图

NoteGPT: 스마트 학습 도우미 | 비디오 및 오디오 요약하기 | 마인드맵 생성하기

일반 소개 NoteGPT는 AI 기술을 통해 학습 효율성을 향상시키기 위해 설계된 AI 지원 지식 베이스 및 노트 필기 도구입니다. 사용자는 AI를 사용해 링크를 수집 및 요약하고, 새로운 인사이트를 탐색하고, 콘텐츠의 AI 검색 및 관리를 수행할 수 있습니다.NoteGPT는 비디오 요약, 질문과 답변...
2 년 전
060.7K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象

OASIS: 복잡한 사회 현상을 연구하기 위해 수백만 사용자의 소셜 미디어 상호 작용을 다중 지능으로 시뮬레이션합니다.

일반 소개 OASIS(오픈 에이전트 소셜 상호작용 시뮬레이션)는 최대 100만 명의 사용자의 행동을 시뮬레이션할 수 있는 오픈 소스 소셜 미디어 시뮬레이터입니다. 이 플랫폼은 대규모 언어 모델과 규칙 기반...
1 년 전
060.7K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: 온라인 사진 처리 도구, 원클릭 키잉, 워터마크 제거, 사진 복원, 인물 편집

종합 소개 ZuoSugar(PicWish)는 다양한 온라인 사진 편집 도구를 제공하고 모든 플랫폼의 사용을 지원하는 지능형 AI 이미지 처리 플랫폼입니다. 사용자는 원클릭 키잉, 워터마크 제거, 흐릿한 사진 선명하게 만들기, 무손실 줌, 이미지 자르기, 이미지 압축 및 흑백 사진...을 쉽게 완료할 수 있습니다.
1 년 전
060.6K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI 얼굴 스왑: 오픈 소스 두 번째 오리 카메라, 프론트엔드 및 백엔드 완전한 엔터프라이즈 AI 얼굴 스왑 애플릿 배포(산술 서비스 결제, 두 개가 열려 있을 수 있음)

종합 소개 LunaAI 페이스 스왑 애플릿은 유니앱과 뷰 프레임워크를 기반으로 개발된 페이스 스왑 애플리케이션입니다. 이 애플리케이션은 애플릿을 통해 사용자의 얼굴 변경 작업 기능을 구현하기 위해 PHP, MySQL, Nginx 및 Redis를 사용합니다. 사용자는 이 작은 ...
1 년 전
060.6K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

자동 에이전트: 자연어를 통해 AI 인텔리전스를 신속하게 생성 및 배포하기 위한 프레임워크

일반 소개 AutoAgent는 홍콩대학교 데이터 인텔리전스 연구소(HKUDS)에서 개발하고 GitHub에서 호스팅하는 오픈 소스 AI 인텔리전스 프레임워크로, 사용자가 프로그래밍 기반 없이 순수 자연어로 요구 사항을 설명하여 맞춤형 AI 인텔리전스를 빠르게 생성하고 배포할 수 있습니다....
9개월 전
060.6K
自动爬取小说并生成多角色有声书的工具

소설을 자동으로 크롤링하여 여러 문자의 오디오북을 생성하는 도구

일반 소개 자동 오디오북은 GitHub에서 호스팅되는 오픈 소스 프로젝트입니다. 웹사이트에서 소설 콘텐츠를 자동으로 크롤링하여 여러 캐릭터의 목소리가 담긴 오디오북으로 변환합니다. 파이썬 3.1을 사용하는 zqq-nuli 개발자...
12개월 전
060.6K
知乎直达:智能问答与搜索工具,获取中文知识精准答案

지후 다이렉트: 중국어 지식에 대한 정확한 답변을 얻을 수 있는 지능형 Q&A 및 검색 도구

종합 소개 Zhihu Direct(zhida.ai)는 Zhihu에서 출시한 AI 빅 모델을 기반으로 한 지능형 Q&A 및 검색 도구입니다. Zhihu 커뮤니티의 고품질 콘텐츠를 핵심으로 삼고 여러 데이터 소스를 결합하여 사용자에게 신뢰할 수 있는 정보에 대한 액세스를 제공합니다. 지후다이렉트는 간단한 답변과 심층적인 답변을 모두 생성할 뿐만 아니라...
2 년 전
060.5K
NeuraVid:利用AI搜索视频关键帧与自动剪辑精彩片段

NeuraVid: AI를 사용하여 동영상 키프레임 검색 및 하이라이트 자동 편집하기

일반 소개 NeuraVid는 사용자가 동영상 콘텐츠를 빠르게 처리하고 이해할 수 있도록 설계된 AI 기반 동영상 분석 플랫폼입니다. 고급 AI 기술을 통해 동영상 트랜스크립션, 콘텐츠 검색 및 주요 정보 추출을 지원하여 사용자가 중요한 클립을 쉽게 찾거나 동영상에서 하이라이트를 생성할 수 있습니다. 이...
1 년 전
060.5K
Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)

Hallo2: 오디오 기반 립싱크/표정 동기화 인물 동영상 생성(Windows의 경우 원클릭 설치)

일반 소개 Hallo2는 푸단대학교와 바이두가 공동으로 개발한 오픈소스 프로젝트로, 오디오 기반 생성을 통해 고해상도 인물 애니메이션을 생성하는 것을 목표로 합니다. 이 프로젝트는 고급 GAN(생성적 적대 신경망)과 시간 정렬 기술을 활용하여 4K 해상도와 최대 1시간 길이의 동영상을 생성합니다....
1 년 전
060.4K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: X 사용자 데이터 및 트윗을 위한 트위터 데이터 크롤링 및 애널리틱스

일반 소개 X-Kit은 X(이전의 트위터) 사용자 데이터와 트윗을 크롤링하고 분석하기 위해 설계된 오픈 소스 도구입니다. GitHub 사용자 xiaoxiunique가 개발한 이 도구는 사용자가 특정 X 사용자에 대한 기본 정보와 트윗을 얻는 프로세스를 자동화할 수 있도록 설계되었습니다.
1 년 전
060.4K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务

Flow(Laminar): 작업을 간소화하고 유연하게 관리하는 빌딩 인텔리전스를 위한 경량 작업 엔진입니다.

포괄적인 소개 Flow는 단순성과 유연성에 중점을 두고 AI 에이전트 구축을 위해 설계된 경량 작업 엔진입니다. 기존의 노드 및 에지 기반 워크플로우와 달리 Flow는 병렬 실행, 동적 스케줄링 및 지능형 종속성 관리를 지원하는 동적 작업 대기열 시스템을 사용합니다. 핵심 개념은 ...
1 년 전
060.4K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 동영상 트랜스크립션 단어 수준 타임라인 자막, 동영상 자막 번역 및 현지화된 더빙 오픈 소스 도구

일반 설명 VideoLingo는 원시 기계 번역과 여러 줄의 자막을 제거하고 고품질 음성 해설을 추가하여 언어 장벽을 넘어 글로벌 지식을 공유할 수 있도록 넷플릭스 수준의 고품질 자막을 생성하도록 설계된 원스톱 동영상 번역 및 현지화 더빙 도구입니다. By...
1 년 전
060.4K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio: 분할 화면 관리 도구를 사용하여 여러 캐릭터를 설정하여 얼굴의 일관성을 유지할 수 있는 AI 영화 제작 플랫폼입니다.

일반 소개 LTX Studio는 크리에이터, 마케터, 영화 제작자 및 스튜디오를 위해 설계된 혁신적인 AI 기반 동영상 제작 플랫폼입니다. 스토리 구상, 분할 화면 생성, 키네틱 효과 추가, 포스트 편집에 이르는 전체 프로세스 작업을 제공하여 사용자가 창의적인 컨셉을 다음과 같이 변환할 수 있도록 도와줍니다.
1 년 전
060.3K
HyperBooth AI:用一张自拍照快速生成不同风格照片

HyperBooth AI: 한 장의 셀카로 다양한 스타일의 사진을 빠르게 생성할 수 있습니다.

일반 소개 하이퍼부스 AI는 사용자가 셀카 사진을 업로드하여 다양한 스타일의 AI 사진을 즉시 생성할 수 있는 서비스 플랫폼입니다. 사용자는 200개 이상의 사전 설정 스타일 중에서 선택하여 개인화된 예술적 이미지를 만들 수 있습니다. 이 플랫폼 고유의 제너레이터는 높은 시뮬레이션을 제공하고 ...
1 년 전
060.3K
Ollie:全球首个家庭AI助手,规划家庭生活,简化日常事务

올리: 가족 생활을 계획하고 일상 업무를 간소화하는 세계 최초의 가정용 AI 비서

종합 소개 Ollie는 가족들이 일상을 간소화하고 가족 구성원의 부담을 줄일 수 있도록 설계된 세계 최초의 가정용 AI 어시스턴트입니다. 지능형 작업 관리와 개인화된 추천 기능을 통해 Ollie는 식사 계획, 쇼핑 준비, 가정용품 및 선물 추천 등을 수행할 수 있습니다. Ollie...
1 년 전
060.3K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

모델베스트: 세계 최고의 경량, 고성능 엔드사이드 빅 모델

일반 소개 ModelBest는 경량 고성능 대형 모델 개발에 주력하는 회사로, 첨단 AI 기술을 주류 가전제품 및 일상 생활의 모든 종류의 최종 장치에 적용하는 데 전념하고 있습니다. 극한의 연산 능력과 메모리 사용 효율을 갖춘 MiniCPM 시리즈 엔드 사이드 모델은 ...
1 년 전
060.3K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Petals: 대규모 언어 모델의 분산 공유 GPU 실행 및 미세 조정, BitTorrent 네트워크와 같은 GPU 리소스 공유

일반 소개 꽃잎은 분산 컴퓨팅 접근 방식을 통해 대규모 언어 모델(LLM)을 실행하기 위해 BigScience 워크숍에서 개발한 오픈 소스 프로젝트입니다. 사용자는 가정에서 소비자용 GPU 또는 Google Co...를 사용하여 LLM을 실행할 수 있습니다.
1 년 전
060.2K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: 오프라인에서 실행되는 OLMoE 모델 기반의 오픈 소스 iOS AI 앱

일반 소개 Ai2 OLMoE는 앨런 인공지능 연구소(Ai2, Allen Institute for AI)에서 기기에서만 실행되는 인공지능 모델을 제공하기 위해 개발한 오픈 소스 iOS 앱입니다. 이 앱은 Ai2의 오픈 소스 OLMoE를 활용합니다.
1 년 전
060.2K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.
1 년 전
060.2K