최신 AI 리소스

共 3094 篇文章
Tempo Labs:使用AI快速构建React应用,多职能协作的React可视化编辑器

Tempo Labs: AI를 사용한 신속한 React 앱 빌드, 다기능 협업을 위한 React 비주얼 에디터

일반 소개 Tempo Labs는 인공 지능 기술을 사용하여 개발자와 디자이너가 React 애플리케이션을 빠르게 구축할 수 있도록 도와주는 플랫폼입니다. 이 플랫폼은 직관적인 드래그 앤 드롭 편집기와 풍부한 컴포넌트 라이브러리를 제공하여 고품질 사용자 인터페이스를 쉽게 디자인하고 개발할 수 있게 해줍니다.Tempo...
1 년 전
070.4K
TinyWow:免费使用多功能写作与图像在线编辑工具

TinyWow: 온라인에서 무료로 사용할 수 있는 다기능 글쓰기 및 이미지 편집 도구

일반 소개 TinyWow는 사용자의 디지털 생활을 간소화하도록 설계된 다양한 무료 디지털 도구를 제공하는 종합 온라인 플랫폼입니다. PDF 관리, 동영상 편집, 이미지 조작, AI 기반 글쓰기 지원 등 TinyWow는 사용자에게 필요한 모든 것을 갖추고 있습니다.
1 년 전
070.3K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio: 분할 화면 관리 도구를 사용하여 여러 캐릭터를 설정하여 얼굴의 일관성을 유지할 수 있는 AI 영화 제작 플랫폼입니다.

일반 소개 LTX Studio는 크리에이터, 마케터, 영화 제작자 및 스튜디오를 위해 설계된 혁신적인 AI 기반 동영상 제작 플랫폼입니다. 스토리 구상, 분할 화면 생성, 키네틱 효과 추가, 포스트 편집에 이르는 전체 프로세스 작업을 제공하여 사용자가 창의적인 컨셉을 다음과 같이 변환할 수 있도록 도와줍니다.
1 년 전
070.3K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.
1 년 전
070.3K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频

모프 스튜디오: AI로 동영상 스토리 만들기|텍스트를 동영상으로|이미지를 동영상으로

일반 소개 모프 스튜디오는 스토리텔링과 디자인의 독특한 조합을 전문으로 하는 크리에이티브 및 제작 스튜디오로 광고, 애니메이션, 뮤직 비디오 및 단편 영화 프로젝트를 진행하고 있습니다. 또한, 모프 스튜디오는 '모프 스튜디오'라는 새로운 프로그램을 시작했습니다.
2 년 전
070.3K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: 전용 OCR 인식 AI 모델, PDF를 마크다운으로 변환(오픈 소스/API)

포괄적인 소개 Datalab은 OCR, 레이아웃 분석, PDF에서 마크다운으로의 변환 등에 중점을 둔 다양한 고급 AI 모델을 제공합니다. 이러한 모델은 고성능일 뿐만 아니라 사용하기 쉽고 오픈 소스입니다. 플랫폼의 마커 모델은 빠르고 정확하게 ...
1 년 전
070.3K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

모델베스트: 세계 최고의 경량, 고성능 엔드사이드 빅 모델

일반 소개 ModelBest는 경량 고성능 대형 모델 개발에 주력하는 회사로, 첨단 AI 기술을 주류 가전제품 및 일상 생활의 모든 종류의 최종 장치에 적용하는 데 전념하고 있습니다. 극한의 연산 능력과 메모리 사용 효율을 갖춘 MiniCPM 시리즈 엔드 사이드 모델은 ...
2 년 전
070.2K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: 오프라인에서 실행되는 OLMoE 모델 기반의 오픈 소스 iOS AI 앱

일반 소개 Ai2 OLMoE는 앨런 인공지능 연구소(Ai2, Allen Institute for AI)에서 기기에서만 실행되는 인공지능 모델을 제공하기 위해 개발한 오픈 소스 iOS 앱입니다. 이 앱은 Ai2의 오픈 소스 OLMoE를 활용합니다.
1 년 전
070.2K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模

PSHuman: 사실적인 3D 인물 모델 생성, 사진을 사용하여 3D 인체 모델링 생성

일반 소개 PSHuman은 멀티뷰 확산 기술을 기반으로 한 단일 이미지 3D 인물 재구성 툴입니다. 이 도구는 옷을 입은 사람의 단일 사진에서 상세한 기하학적 구조와 사실적인 3D 인물 모델을 생성할 수 있으며, PSHuman의 핵심 기술에는 크로스 스케일 멀티뷰 확산이 포함되어 있습니다.
1 년 전
070.2K
HyperBooth AI:用一张自拍照快速生成不同风格照片

HyperBooth AI: 한 장의 셀카로 다양한 스타일의 사진을 빠르게 생성할 수 있습니다.

일반 소개 하이퍼부스 AI는 사용자가 셀카 사진을 업로드하여 다양한 스타일의 AI 사진을 즉시 생성할 수 있는 서비스 플랫폼입니다. 사용자는 200개 이상의 사전 설정 스타일 중에서 선택하여 개인화된 예술적 이미지를 만들 수 있습니다. 이 플랫폼 고유의 제너레이터는 높은 시뮬레이션을 제공하고 ...
2 년 전
070.2K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: 다중 지능형 신체 애플리케이션을 구축하기 위한 상탕의 오픈 소스 로우코드 개발 도구

포괄적인 소개 LazyLLM은 LazyAGI 팀이 개발한 오픈 소스 도구로, 다중 지능 대규모 모델 애플리케이션의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 개발자는 원클릭 배포와 가벼운 게이트웨이 메커니즘을 통해 복잡한 AI 애플리케이션을 빠르게 구축하여 지루한 엔지니어링 구성을 줄일 수 있습니다.
1 년 전
070.2K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI 얼굴 스왑: 오픈 소스 두 번째 오리 카메라, 프론트엔드 및 백엔드 완전한 엔터프라이즈 AI 얼굴 스왑 애플릿 배포(산술 서비스 결제, 두 개가 열려 있을 수 있음)

종합 소개 LunaAI 페이스 스왑 애플릿은 유니앱과 뷰 프레임워크를 기반으로 개발된 페이스 스왑 애플리케이션입니다. 이 애플리케이션은 애플릿을 통해 사용자의 얼굴 변경 작업 기능을 구현하기 위해 PHP, MySQL, Nginx 및 Redis를 사용합니다. 사용자는 이 작은 ...
1 년 전
070.2K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
1 년 전
070.2K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

울트라박스: 실시간 엔드투엔드 음성 대화를 위한 오디오 멀티모달 매크로 모델, GPT-4o 음성 상호작용의 오픈 소스 구현

종합 소개 Ultravox는 실시간 음성 처리를 위해 설계된 혁신적인 멀티모달 대규모 언어 모델(LLM)입니다. 기존의 음성 인식 시스템과 달리 Ultravox는 별도의 ASR(오디오 음성 인식) 단계가 필요하지 않으며, 오디오를 고차원 공간으로 직접 변환할 수 있습니다.
1 년 전
070.1K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

레코드 카페: 원스톱 오디오/비디오 처리 플랫폼|비디오 생성|AI 자막|오디오 추출|음성 텍스트 변환

개요 레코드 카페는 원스톱 오디오/비디오 처리 플랫폼으로, AI 영상 대화, AI 자막, AI 음성 텍스트 변환 서비스를 제공합니다. 화면 녹화, 동영상 편집, GIF/오디오 변환 등의 기능을 제공하며, 클라우드 저장 및 공유를 지원합니다. 인터페이스는 직관적이고 사용하기 쉬우며 다중 화면 녹화 및 다국어 스마트 ...
1 년 전
070.1K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

루이 모델: 렌즈 제어 및 모션 진폭 제어를 지원하는 이미지-투-비디오 오픈 소스 모델을 생성합니다.

일반 소개 Ruyi-Models는 이미지에서 고품질 동영상을 생성하도록 설계된 오픈 소스 프로젝트입니다. IamCreateAI 팀이 개발한 이 프로젝트는 768 해상도, 초당 24프레임, 5초에 120프레임의 시네마틱 비디오 생성을 지원합니다....
1 년 전
070.1K
StudyX:AI驱动的作业解答与学习助手

StudyX: AI 기반 숙제 솔루션 및 학습 도우미

일반 소개 StudyX는 학생과 평생 학습자를 위해 설계된 AI 학습 플랫폼으로, 숙제와 학습 자료에 대한 빠르고 정확한 답변을 제공하는 데 중점을 두고 있습니다. 수학, 물리, 화학, 문학 등 다양한 과목을 지원하며, 사용자가 텍스트, 사진 또는 공식을 통해 질문을 입력하면 자세한 답변을 얻을 수 있습니다.
1 년 전
070K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识

시크릿 AI 검색: 광고 없는 효율적인 학술 검색 서비스, 심층 지식 마이닝을 위한 연구 모델 제공

회사 소개 시크릿 AI 검색은 인공지능 기술을 통한 생산성 향상에 전념하는 기술 기업입니다. 사용자에게 정확하고 빠른 검색 결과를 제공하는 것을 목표로 광고 없이 효율적인 학술 검색 서비스를 제공합니다. 시크릿타워 AI 검색은 자체 개발한 대규모 언어 모델인 MetaLLM을 보유하고 있으며, 이를 통해 ...
1 년 전
070K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 비디오 자막용 네이티브 클라이언트, 다국어 자막 변환

일반 설명 MemoAI는 비디오 및 오디오 파일을 텍스트, 자막, 메모로 변환하도록 설계된 강력한 비디오 번역 도구입니다. YouTube 동영상, 팟캐스트, 로컬 파일 등 어떤 파일이든 MemoAI로 손쉽게 처리할 수 있습니다. 중국어, 영어, 일본어 등 90개 이상의 언어를 지원합니다.
1 년 전
070K
Vsub:输入文字或模板生成无需露脸的病毒营销视频

Vsub: 텍스트 또는 템플릿을 입력하여 얼굴을 노출하지 않아도 되는 바이럴 마케팅 동영상을 생성할 수 있습니다.

일반 소개 Vsub는 동영상 콘텐츠 제작 자동화에 중점을 둔 플랫폼으로, 콘텐츠 제작자가 얼굴 없는 동영상(페이스리스 동영상)을 빠르게 생성할 수 있도록 설계되었습니다. 인공지능 기술을 활용하여 사용자가 텍스트를 입력하거나 유튜브에 적합한 사전 설정 템플릿을 선택하여 동영상을 만들 수 있습니다.
1 년 전
069.9K
火山方舟:大模型训练与云计算服务,注册送150元等额算力

볼케이노 아크: 빅 모델 트레이닝 및 클라우드 컴퓨팅 서비스, $150 상당의 산술에 가입하세요.

종합적인 소개 Volcano Ark는 볼케이노 엔진에서 출시한 클라우드 컴퓨팅 플랫폼으로, 빅 모델 서비스에 중점을 두고 기업에게 모델 선택, 학습, 적용에 이르는 완벽한 솔루션을 제공하는 것을 목표로 합니다. 볼케이노 아크는 AI 분야에서 축적된 바이트댄스의 풍부한 경험을 바탕으로 여러 유명 AI 기업의 빅데이터 모델 리소스를 통합합니다....
1 년 전
069.9K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力

통이 천 개의 질문: 텍스트 응답, 이미지 이해, 동영상 구문 분석 기능을 갖춘 알리에서 출시한 대형 멀티모달 모델입니다.

종합 소개 통이천문은 알리윈이 개발한 지능형 빅모델로 딥러닝과 자연어 처리 기술을 통해 인간과 같은 상호작용 경험을 제공하는 것을 목표로 합니다. 창의적인 문구를 빠르게 생성하여 삶에 재미를 더하고 사용자가 모든 종류의 지식을 쉽게 배울 수 있도록 도와주는 학습 도우미 역할을 할 수 있습니다. 최첨단 기술과 진화하는 ...
1 년 전
069.8K
Anifusion - AI漫画和动漫图片制作平台,文本描述生成漫画页面和角色图像

Anifusion - AI 만화 및 애니메이션 이미지 제작 플랫폼, 만화 페이지 및 캐릭터 이미지에 대한 텍스트 설명 생성

애니퓨전은 AI 기술을 기반으로 한 온라인 AI 만화 및 애니메이션 이미지 제작 플랫폼으로, 창작자가 그림 실력이 없어도 전문가 수준의 만화 및 애니메이션 작품을 제작할 수 있도록 도와줍니다. 사용자가 설명 메시지를 입력하기만 하면 AI가 만화 페이지와 캐릭터 이미지를 자동으로 생성합니다. 이 플랫폼은 직관적인 레이아웃을 제공합니다...
11개월 전
069.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

쌍둥이자리 놀이터: 쌍둥이자리 멀티모달 대화 사이트의 서버리스 배포

일반 소개 제미니 플레이그라운드는 사용자가 멀티모달 대화 사이트를 빠르게 배포할 수 있도록 설계된 오픈소스 프로젝트입니다. 이 프로젝트는 기술 크롤링 새우에 의해 개발되었으며 10 초 만에 Gemini API 키 사용을 지원하여 배포를 완료합니다. 사용자가 ...
1 년 전
069.8K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

분석 GBI(XiYan-SQL): 간편한 ChatBI를 위한 텍스트-SQL 지능형 데이터 분석

종합 소개 GBI 분석은 알리클라우드 바이리안이 출시한 빅데이터 모델 기반의 지능형 데이터 분석 제품입니다. 이 제품은 고급 자연어 처리 기술을 사용하여 사용자가 복잡한 SQL 구문을 숙지하지 않고도 자연어를 통해 데이터를 쿼리하고 분석할 수 있도록 지원합니다. Analytics GBI는 다음을 포함한 여러 데이터 소스를 지원합니다.
1 년 전
069.8K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)

Mebot: 여러 유형의 문서에 대한 장기 메모리를 지원하는 풀 엔드포인트 개인용 AI 비서(권장)

일반 설명 Me.bot은 일상생활을 위해 만들어진 개인용 인공지능 비서입니다. 기억을 정리하고 창의력을 자극하며 아이디어를 증폭하는 데 도움을 주는 두 번째 두뇌 역할을 하며, Me.bot은 자체 개발한 강력한 개인 모델로 구동되며 고급 암호화 및 개인 정보 보호 기능을 통해 다음과 같은 기능을 보장합니다.
1 년 전
069.8K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)

희요: 아이와 동행하는 AI 동반자이자 아이들의 학습 경험을 향상시키는 지능형 AI 파트너(유료)

일반 설명 Heeyo는 3-11세 어린이가 대화형 게임과 대화를 통해 학습 경험을 향상시킬 수 있도록 설계된 AI 앱으로, 하버드와 스탠퍼드의 교육 전문가가 설계했으며 수학, 과학 및 사회 정서적 기술을 다루는 2000개 이상의 학습 게임을 제공합니다. Kids...
1 년 전
069.8K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: 원격 기술 인터뷰를 지원하는 보이지 않는 AI 도구

일반 소개 Interviewcoder는 기술 면접을 위해 설계된 AI 지원 도구로, 사용자가 프로그래밍 면접 중에 솔루션을 빠르게 생성하고 코드를 최적화하며 실시간으로 디버깅할 수 있도록 설계되었습니다. 이 도구는 사용자가 Zoom, Google...에서 사용할 수 있는 스텔스 데스크톱 애플리케이션으로 실행됩니다.
1 년 전
069.7K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: 언어 명령으로 애니메이션 동영상 및 캐릭터 상호작용을 생성하는 오픈 소스 도구

AnimeGamer는 텐센트 ARC Lab의 오픈 소스 툴입니다. 사용자는 "소우스케가 보라색 차를 타고 돌아다녀"와 같은 간단한 언어 명령으로 애니메이션 동영상을 생성할 수 있으며, 마법의 소녀의 모험과 스카이 시티의 키키와 같은 다양한 애니메이션 캐릭터가 서로 상호작용할 수 있습니다.
1 년 전
069.6K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 동영상 트랜스크립션 단어 수준 타임라인 자막, 동영상 자막 번역 및 현지화된 더빙 오픈 소스 도구

일반 설명 VideoLingo는 원시 기계 번역과 여러 줄의 자막을 제거하고 고품질 음성 해설을 추가하여 언어 장벽을 넘어 글로벌 지식을 공유할 수 있도록 넷플릭스 수준의 고품질 자막을 생성하도록 설계된 원스톱 동영상 번역 및 현지화 더빙 도구입니다. By...
2 년 전
069.5K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: Tencent ARC에서 출시한 이미지 복원 및 편집을 위한 올인원 도구

종합 소개 BrushEdit는 Tencent ARC Labs에서 개발한 올인원 이미지 복구 및 편집 도구입니다. 이 도구는 최신 AI 기술을 기반으로 하며 이미지의 결함을 자동으로 식별하고 복구하는 동시에 사용자의 대화형 편집을 지원할 수 있으며, BrushEdit는 다양한 기능을 결합합니다.
1 년 전
069.5K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合

Pika: 뛰어난 크리에이티브 비디오 생성 | 텍스트-비디오 변환 | 그래픽-비디오 변환 | 이미지-비디오 융합

피카 소개 피카닷아트는 아이디어를 동영상으로 만들어주는 플랫폼으로, 창의적인 사람들에게 인공지능 동영상 제작 도구를 제공하는 것을 목표로 합니다. 재미있는 클립, 소셜 미디어 콘텐츠 또는 단편 영화를 만들고 싶을 때 Pika.art는 사용자의 상상력을 따라갈 수 있습니다. 사용자...
11개월 전
069.5K
知乎直达:智能问答与搜索工具,获取中文知识精准答案

지후 다이렉트: 중국어 지식에 대한 정확한 답변을 얻을 수 있는 지능형 Q&A 및 검색 도구

종합 소개 Zhihu Direct(zhida.ai)는 Zhihu에서 출시한 AI 빅 모델을 기반으로 한 지능형 Q&A 및 검색 도구입니다. Zhihu 커뮤니티의 고품질 콘텐츠를 핵심으로 삼고 여러 데이터 소스를 결합하여 사용자에게 신뢰할 수 있는 정보에 대한 액세스를 제공합니다. 지후다이렉트는 간단한 답변과 심층적인 답변을 모두 생성할 뿐만 아니라...
2 년 전
069.5K
Topaz Labs:AI智能图像和视频处理专家,照片视频修复与无损放大

토파즈 랩: AI 지능형 이미지 및 비디오 처리 전문가, 사진 비디오 복원 및 무손실 확대

일반 설명 토파즈 랩스는 전문 콘텐츠 크리에이터에게 최적화된 기본 워크스테이션 환경을 제공하도록 설계된 AI 중심의 이미지 및 동영상 향상 소프트웨어를 제공합니다. 강력한 선명도, 노이즈 감소, 확대 기능을 제공합니다...
1 년 전
069.5K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - 네일과 통이가 공동으로 출시한 차세대 음성 인식 모델

Fun-ASR은 네일과 통이랩스가 공동으로 출시한 대형 음성 인식 모델입니다. 이 모델은 방대한 오디오 데이터로 학습되어 인터넷, 기술, 가정 장식 등과 같은 여러 산업 분야의 용어를 정확하게 식별할 수 있어 인식 정확도를 크게 향상시켰습니다. 이 모델은 추론 최적화를 위해 네일 엔터프라이즈 정보와 결합되어 팬텀 문제를 줄입니다.
8개월 전
069.4K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

이중 언어 북 메이커: AI 번역을 사용하여 이중 언어 전자책, 전체 책 자동 번역 도구를 만들 수 있습니다.

일반 소개 이중 언어 북 메이커는 사용자가 AI 기술을 사용하여 다국어 버전의 전자책을 만들 수 있도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 주로 번역을 위해 ChatGPT를 사용하며 epub, txt 및 srt를 포함한 여러 파일 형식을 지원합니다.
1 년 전
069.4K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: 오픈 소스 AI 회의 녹음 도우미, 회의 내용을 자동으로 녹음하여 요약을 생성합니다.

일반 소개 Amurex는 지능형 기능을 통해 회의 효율성을 개선하도록 설계된 The Personal AI Company에서 개발한 오픈 소스 AI 회의 도우미로, 실시간 조언 제공, 지능형 요약 생성, 회의 내용 기록, 자동 팔로우 전송이 가능합니다.
1 년 전
069.4K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

음성 노트: AI 음성 메모, 음성 녹음 및 전사, 회의 콘텐츠의 지능적인 관리

일반 소개 Voicenotes는 사용자가 음성 메모와 회의를 쉽게 녹음하고 관리할 수 있도록 설계된 스마트 음성 메모 앱입니다. 이 앱은 100개 이상의 언어로 음성 녹음을 지원합니다. 사용자는 자신의 생각을 말하기만 하면 Voicenotes가 자동으로 텍스트로 변환해 줍니다.
1 년 전
069.4K
They See Your Photos:基于 Google Vision 照片隐私信息分析

그들은 내 사진을 본다: Google 비전을 기반으로 한 사진 개인정보 정보 분석

일반 소개 그들이 당신의 사진을 봅니다는 사용자가 자신의 사진에 숨겨진 개인 정보를 이해할 수 있도록 설계된 사용하기 쉬운 온라인 도구입니다. 사용자는 어떤 이미지든 업로드할 수 있으며, 웹사이트는 인공 지능 기술을 통해 이미지 콘텐츠와 메타데이터를 분석하여 사진에서 드러날 수 있는 세부 정보를 표시합니다.
1 년 전
069.3K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - 워드프레스의 오픈 소스 다국어 번역 모델

Seed-X는 70억 개의 파라미터로 28개 언어의 양방향 번역을 지원하는 ByteDance의 Seed 팀이 출시한 다국어 번역 모델입니다. 이 모델은 다국어 데이터 사전 학습, 명령 미세 조정 및 강화 학습 기술을 결합하여 복잡한 언어 패턴을 효율적으로 처리하고 번역 품질을 개선합니다.
9개월 전
069.2K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: 단일 이미지에서 고해상도 3D 모델링 디지털 자산 생성

일반 소개 TripoSG는 단일 이미지에서 고품질 3D 모델을 생성하기 위해 VAST AI 연구팀에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 하이브리드 지도 학습 및 고품질 데이터 세트와 결합된 대규모 정류기-흐름 변환기 기술을 사용하여 생성된 3D 모델이 다음과 같은 기능을 갖출 수 있도록 합니다.
1 년 전
069.2K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

랩뱅크: 가사와 백킹 트랙에서 랩(Rap) 보컬을 직접 생성하는 모델(현재 오픈 데이터 세트)

일반 소개 랩뱅크는 랩 가사 생성을 위해 설계된 데이터 세트 및 도구 세트입니다. 이 프로젝트는 연구자와 개발자에게 YouTube에서 랩 노래를 수집하고 처리하여 고품질의 랩 가사 데이터를 제공하기 위해 NZqian에서 만들었습니다....
1 년 전
069.2K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: 멀티모달 검색 및 지식 그래프 구성을 지원하여 매우 긴 동영상을 이해하기 위한 RAG 프레임워크입니다.

포괄적인 소개 VideoRAG는 매우 긴 컨텍스트 비디오를 처리하고 이해하도록 설계된 검색 강화 생성 프레임워크입니다. 이 도구는 그래프 중심의 텍스트 지식 기반과 계층적 멀티모달 컨텍스트 인코딩을 결합하여 단일 NVIDIA RTX 3090 GPU에서 효율적으로 처리합니다....
1 년 전
069.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: 데스크톱 및 브라우저 자동화를 위한 지능형 바디 워크플로 구축 자연어

일반 소개 Eko는 자연어 설명을 통해 효율적인 지능형 에이전트 워크플로우를 구축하도록 설계된 프로덕션급 자바스크립트 프레임워크입니다. 개발자가 심층적인 프로그래밍 없이도 AI 기술을 사용하여 일상적인 작업을 자동화할 수 있도록 설계되었으며, Eko는 단일 ...
1 년 전
069.1K
MemeCam:使用AI生成搞笑表情包,在图片中加入搞笑文字,生成有趣的表情包。

MemeCam: AI를 사용하여 재미있는 이모티콘을 생성하고, 사진에 재미있는 텍스트를 추가하여 재미있는 이모티콘을 생성하세요.

일반 소개 MemeCam은 재미있는 이모티콘을 생성하는 데 특화된 혁신적인 AI 기반 플랫폼입니다. 사용자는 웹캠을 사용하여 이미지를 업로드하거나 사진을 찍을 수 있으며, MemeCam은 고급 GPT-4o 기술을 사용하여 이미지를 인식하고 자동으로 재미있는 텍스트를 생성합니다.
1 년 전
069.1K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

휘젓기: 여러 이미지를 업로드하고 테마, 장면 및 스타일을 혼합하여 독특한 아트웍을 만들어 보세요!

일반 소개 Whisk는 여러 이미지를 업로드하여 다양한 테마, 장면, 스타일을 혼합할 수 있도록 설계된 Google Labs의 혁신적인 AI 이미지 생성 도구입니다. 텍스트 프롬프트에 의존하는 기존 이미지 생성 도구와 달리 Whisk는 주로 이미지를 입력으로 사용합니다...
11개월 전
069.1K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NV Ingest: 복잡한 형식의 문서를 구문 분석하고 멀티모달 데이터를 메타데이터와 텍스트로 추출합니다.

포괄적인 소개 NV Ingest(NVIDIA Ingest)는 수십만 개의 복잡하고 지저분한 비정형 PDF 및 기타 엔터프라이즈 문서를 구문 분석하도록 설계된 조기 액세스 마이크로서비스 제품군입니다. 이러한 문서를 메타데이터 및 텍스트로 변환하여 검색에 포함할 수 있습니다.
1 년 전
069.1K
removebg:一键去除图片背景,removebg在线免费中文版

removebg : 한 번의 클릭으로 사진 배경 제거, removebg 온라인 무료 중국어 버전

removebg 일반 설명 removebg는 사진의 배경을 자동으로 제거하는 온라인 도구로, 사용자는 사진을 업로드하기만 하면 되며, 시스템은 배경이 없는 투명한 이미지를 즉시 제공합니다. removebg는 고급 인공 지능 기술을 사용하여 사진 속의 사람, 동물을 인식합니다.
2 년 전
069K
Jules:实验性AI代码助手,可自动执行Python和JavaScript编码任务,例如GitHub工作流中的错误修复。

Jules: GitHub 워크플로우에서 버그 수정과 같은 Python 및 JavaScript 코딩 작업을 자동화하는 실험적인 AI 코드 어시스턴트입니다.

일반 소개 Jules는 개발자의 프로그래밍 효율성 향상을 돕기 위해 설계된 Google Labs의 AI 코드 어시스턴트입니다. 최신 Gemini 2.0 플래시 모델을 통합하고 개발자에게 지능형 코드 제안 및 자동화를 Github에서 제공할 수 있습니다.
1 년 전
068.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

XYKS: 소형 유인원 구두 계산 리버스 노트, 리버스 엔지니어링 및 복호화 알고리즘

포괄적인 소개 유인원 입 계산기 리버스 노트는 유인원 입 계산기 애플리케이션을 리버스 엔지니어링하는 과정과 방법을 문서화하고 공유하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트에는 사용자가 작은 유인원 구강 산술 추가를 이해하고 해독하는 데 도움이 되는 지침을 사용하기 위한 다양한 리버스 도구 및 기술(예: Frida, dexdump 등)이 포함되어 있습니다.
2 년 전
068.9K
Animation:实时生成3D动画,打造栩栩如生的虚拟角色

애니메이션: 3D 애니메이션을 실시간으로 생성하여 실감나는 가상 캐릭터를 만듭니다.

일반 소개 애니메이션은 실시간 제너레이티브 애니메이션 기술을 전문으로 하는 기술 회사입니다. 이 회사는 첨단 AI 기술과 애니메이션 엔진을 통해 실제와 같은 가상 캐릭터를 제작하고 LLM(대규모 언어 모델링) 기반 대화형 경험을 향상시키는 데 전념하고 있습니다. 이 회사는 전 메타 엔지니어링에 의해 설립되었습니다...
1 년 전
068.9K
Portkey:连接多种AI模型并管理应用的开发工具

Portkey: 여러 AI 모델을 연결하고 애플리케이션을 관리하기 위한 개발 도구

일반 소개 Portkey는 기업과 개발자가 AI 애플리케이션을 신속하게 구축, 관리 및 최적화할 수 있도록 지원하는 플랫폼입니다. 200개가 넘는 대규모 언어 모델(LLM)을 통합 AI 게이트웨이를 통해 연결하여 신속한 관리, 로드 밸런싱, 실시간 모니터링 등의 기능을 제공합니다. 이 사이트의 핵심 목표는 ...
1 년 전
068.9K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

레이캐스트-G4F: 레이캐스트를 통해 GPT-4, 라마-3 및 기타 여러 AI 모델에 무료로 액세스하세요!

일반 소개 레이캐스트-G4F(GPT4Free)는 사용자가 GPT-4, 라마-3을 포함한 다양한 고급 AI 모델에 무료로 액세스할 수 있는 강력한 레이캐스트 확장 프로그램입니다. 이 확장 프로그램은 실시간 대화 스트리밍을 제공할 뿐만 아니라...
1 년 전
068.9K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: 가사를 전체 노래의 기본 모델로 변환하여 다양한 음악 스타일을 지원합니다.

일반 소개 YuE는 가사를 전체 곡으로 변환하는 데 중점을 둔 오픈 소스 전체 곡 생성 기본 모델입니다. 비보컬 음악의 짧은 스니펫만 생성하는 다른 모델과 달리 YuE는 최대 몇 분 길이의 리드 보컬과 백 보컬이 포함된 전체 곡을 생성할 수 있습니다. 이 모델은 음악 생성을 ...
1 년 전
068.8K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: 머신 러닝 논문을 실행 가능한 코드로 자동 변환하기

일반 소개 Paper2Code는 머신러닝 논문에 대한 코드 구현 부족 문제를 해결하기 위한 오픈 소스 프로젝트입니다. 이 프로젝트는 다중 에이전트 LLM(대규모 언어 모델링) 시스템인 PaperCoder를 통해 과학 논문을 실행 가능한 코드 리포지토리로 자동 변환합니다. 이 시스템은 계획을 사용합니다 ...
12개월 전
068.8K
Artflow:创作人物一致性的动画故事和虚拟数字人口播视频

아트플로우: 캐릭터가 일관된 애니메이션 스토리 및 가상 디지털 팝업 동영상 제작

일반 설명 Artflow는 사용자가 사진을 업로드하고, 전용 AI 캐릭터를 훈련시키고, 캐릭터와 일치하는 동영상과 애니메이션 스토리를 만들 수 있는 온라인 플랫폼입니다. 처음으로 무료 교육을 제공하는 사용자는 다양한 시나리오에 맞는 고유한 이미지와 동영상을 만들기 위해 자신의 아이덴티티를 사용자 지정할 수 있습니다. 월간 ...
2 년 전
068.8K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: 동영상에서 임의의 움직이는 객체를 자동으로 분할하는 오픈 소스 도구

일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.
1 년 전
068.7K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet: 텍스트 설명을 사용하여 온프레미스 애플리케이션을 빠르게 빌드 및 배포하기

일반 소개 ToolJet은 간단한 자연어 설명으로 맞춤형 AI 애플리케이션과 에이전트를 생성할 수 있는 AI 기반 엔터프라이즈 애플리케이션 개발 플랫폼입니다. 사용자는 원하는 애플리케이션을 설명하기만 하면 ToolJet이 UI, 데이터베이스, 쿼리 등 모든 설정을 수행합니다.
1 년 전
068.7K
Viggle:可控人物动作视频生成|视频人物转换风格

비글: 제어형 캐릭터 액션 비디오 생성 | 비디오 캐릭터 변환 스타일

일반 소개 비글은 캐릭터 동영상 생성에 초점을 맞춘 JST-1 모델 기반의 동영상 생성 서비스 플랫폼입니다. 사용자는 텍스트 프롬프트를 통해 캐릭터의 움직임을 제어하고, 정지된 캐릭터와 액션 동영상을 혼합하거나, 텍스트만으로 동영상을 제작할 수 있습니다. 현재 비글은...
1 년 전
068.7K
文心智能体平台:建立在完整分发渠道和商业闭环的智能体应用

웬신 인텔리전트 바디 플랫폼: 완전한 유통 채널 및 상업적 폐쇄를 기반으로 구축된 인텔리전트 바디 애플리케이션

소개 웬신 지능형 바디 플랫폼 에이전트 빌더는 웬신 지능형 바디 (에이전트) 플랫폼의 큰 모델을 기반으로 출시 된 바이두로, 자신의 산업 분야, 애플리케이션 시나리오에 따라 대다수의 개발자를 지원하고 다양한 유형의 개발 방법을 선택하여 제품 기능 시대의 큰 모델을 만듭니다. 개발자는 ...
1 년 전
068.6K
Unscreen:自动移除视频背景,轻松制作无背景视频

화면 해제: 동영상 배경을 자동으로 제거하여 배경 없는 동영상을 쉽게 만들 수 있습니다.

Unscreen은 동영상 배경을 자동으로 제거하는 데 중점을 둔 강력한 온라인 도구입니다. 사용자가 동영상을 업로드하거나 동영상 링크를 제공하기만 하면 Unscreen이 복잡한 과정 없이 자동으로 배경을 분석하고 제거합니다. 이 도구는 .mp를 포함한 다양한 동영상 형식을 지원합니다.
1 년 전
068.6K