최신 AI 리소스

共 3103 篇文章
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势

아바타 포즈 메이커: 개인화된 스탠드업 스켈레톤 포즈의 온라인 생성

일반 설명 아바타 포즈 메이커는 사용자가 개인화된 스탠드업 포즈를 디자인하고 생성할 수 있는 온라인 도구입니다. 사용자가 좋아하는 포즈를 만들어 3D 모델을 간단하고 효과적으로 제어할 수 있는 방법을 제공합니다. 특히 초보자에게 적합하며 다음과 같은 기능을 제공합니다.
2 년 전
074.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: 멀티모달 매크로 모델을 사용한 흉부 방사선 사진 분석용 지능형 바디

포괄적인 소개 MedRAX는 흉부 엑스레이(CXR) 분석을 위해 설계된 최첨단 AI 인텔리전스입니다. 최첨단 CXR 분석 도구와 멀티모달 대규모 언어 모델을 통합하여 추가 교육 없이 복잡한 의료 쿼리를 동적으로 처리하며, 모듈식 설계를 통해 MedRAX는 ...
1 년 전
074K
火山方舟:大模型训练与云计算服务,注册送150元等额算力

볼케이노 아크: 빅 모델 트레이닝 및 클라우드 컴퓨팅 서비스, $150 상당의 산술에 가입하세요.

종합적인 소개 Volcano Ark는 볼케이노 엔진에서 출시한 클라우드 컴퓨팅 플랫폼으로, 빅 모델 서비스에 중점을 두고 기업에게 모델 선택, 학습, 적용에 이르는 완벽한 솔루션을 제공하는 것을 목표로 합니다. 볼케이노 아크는 AI 분야에서 축적된 바이트댄스의 풍부한 경험을 바탕으로 여러 유명 AI 기업의 빅데이터 모델 리소스를 통합합니다....
1 년 전
074K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力

통이 천 개의 질문: 텍스트 응답, 이미지 이해, 동영상 구문 분석 기능을 갖춘 알리에서 출시한 대형 멀티모달 모델입니다.

종합 소개 통이천문은 알리윈이 개발한 지능형 빅모델로 딥러닝과 자연어 처리 기술을 통해 인간과 같은 상호작용 경험을 제공하는 것을 목표로 합니다. 창의적인 문구를 빠르게 생성하여 삶에 재미를 더하고 사용자가 모든 종류의 지식을 쉽게 배울 수 있도록 도와주는 학습 도우미 역할을 할 수 있습니다. 최첨단 기술과 진화하는 ...
1 년 전
074K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B 개방형 컴퓨터 사용: E2B 샌드박스에서 안전하게 AI 운영 체제 실행하기

일반 소개 E2B 개방형 컴퓨터 사용은 E2B 데스크톱 샌드박스를 통해 안전한 클라우드 기반 리눅스 컴퓨터 사용 경험을 제공하는 것을 목표로 하는 오픈 소스 프로젝트로, E2B 샌드박스는 사용자가 모든 대형 컴퓨터에 연결할 수 있는 데스크톱 그래픽 환경을 제공합니다.
1 년 전
074K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio: 분할 화면 관리 도구를 사용하여 여러 캐릭터를 설정하여 얼굴의 일관성을 유지할 수 있는 AI 영화 제작 플랫폼입니다.

일반 소개 LTX Studio는 크리에이터, 마케터, 영화 제작자 및 스튜디오를 위해 설계된 혁신적인 AI 기반 동영상 제작 플랫폼입니다. 스토리 구상, 분할 화면 생성, 키네틱 효과 추가, 포스트 편집에 이르는 전체 프로세스 작업을 제공하여 사용자가 창의적인 컨셉을 다음과 같이 변환할 수 있도록 도와줍니다.
1 년 전
074K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音

YouTube 더빙: YouTube 동영상을 다른 언어로 번역하고 실시간으로 더빙을 동기화합니다.

일반 소개 YouTube 더빙은 동영상 제작자와 시청자에게 다국어 더빙 서비스를 제공하기 위해 고안된 지능형 더빙 플랫폼입니다. 이 플랫폼은 AI 기술을 통해 YouTube 동영상에서 자동으로 번역하고 더빙을 생성하여 여러 언어와 음성 스타일을 지원합니다. 사용자는 설치만 하면...
2 년 전
073.9K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频

모프 스튜디오: AI로 동영상 스토리 만들기|텍스트를 동영상으로|이미지를 동영상으로

일반 소개 모프 스튜디오는 스토리텔링과 디자인의 독특한 조합을 전문으로 하는 크리에이티브 및 제작 스튜디오로 광고, 애니메이션, 뮤직 비디오 및 단편 영화 프로젝트를 진행하고 있습니다. 또한, 모프 스튜디오는 '모프 스튜디오'라는 새로운 프로그램을 시작했습니다.
2 년 전
073.9K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 입력 텍스트에서 화자별 텍스트 음성 변환 모델 생성

일반 소개 Parler-TTS는 고품질의 자연스러운 음성을 생성하도록 설계된 Hugging Face에서 개발한 오픈 소스 텍스트 음성 변환(TTS) 모델 라이브러리입니다. 이 모델은 특정 화자 스타일(예: 성별, 음조, 말하기 스타일 등)을 가진 입력 텍스트를 기반으로 음성을 생성할 수 있습니다.
1 년 전
073.8K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

분석 GBI(XiYan-SQL): 간편한 ChatBI를 위한 텍스트-SQL 지능형 데이터 분석

종합 소개 GBI 분석은 알리클라우드 바이리안이 출시한 빅데이터 모델 기반의 지능형 데이터 분석 제품입니다. 이 제품은 고급 자연어 처리 기술을 사용하여 사용자가 복잡한 SQL 구문을 숙지하지 않고도 자연어를 통해 데이터를 쿼리하고 분석할 수 있도록 지원합니다. Analytics GBI는 다음을 포함한 여러 데이터 소스를 지원합니다.
1 년 전
073.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台

알리마마 크리에이티브 센터: 타오바오 생태학 산하 지능형 마케팅 크리에이티브 지원 플랫폼

종합 소개 알리마마 크리에이티브 센터는 타오바오, 티몰 및 기타 전자상거래 플랫폼의 판매자에게 그래픽에서 동영상, 랜딩 페이지에 이르기까지 모든 범위의 크리에이티브 지원을 제공하도록 설계된 알리바바의 지능형 마케팅 크리에이티브 지원 플랫폼입니다. 크리에이티브 센터는 AI 지능형 카피라이팅 기능과 방대한 템플릿을 결합하여 디자인 효율성을 획기적으로 개선합니다....
2 년 전
073.7K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 비디오 자막용 네이티브 클라이언트, 다국어 자막 변환

일반 설명 MemoAI는 비디오 및 오디오 파일을 텍스트, 자막, 메모로 변환하도록 설계된 강력한 비디오 번역 도구입니다. YouTube 동영상, 팟캐스트, 로컬 파일 등 어떤 파일이든 MemoAI로 손쉽게 처리할 수 있습니다. 중국어, 영어, 일본어 등 90개 이상의 언어를 지원합니다.
2 년 전
073.7K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: 온라인 사진 처리 도구, 원클릭 키잉, 워터마크 제거, 사진 복원, 인물 편집

종합 소개 ZuoSugar(PicWish)는 다양한 온라인 사진 편집 도구를 제공하고 모든 플랫폼의 사용을 지원하는 지능형 AI 이미지 처리 플랫폼입니다. 사용자는 원클릭 키잉, 워터마크 제거, 흐릿한 사진 선명하게 만들기, 무손실 줌, 이미지 자르기, 이미지 압축 및 흑백 사진...을 쉽게 완료할 수 있습니다.
2 년 전
073.7K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: 오픈 소스 AI 회의 녹음 도우미, 회의 내용을 자동으로 녹음하여 요약을 생성합니다.

일반 소개 Amurex는 지능형 기능을 통해 회의 효율성을 개선하도록 설계된 The Personal AI Company에서 개발한 오픈 소스 AI 회의 도우미로, 실시간 조언 제공, 지능형 요약 생성, 회의 내용 기록, 자동 팔로우 전송이 가능합니다.
1 년 전
073.7K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

음성 노트: AI 음성 메모, 음성 녹음 및 전사, 회의 콘텐츠의 지능적인 관리

일반 소개 Voicenotes는 사용자가 음성 메모와 회의를 쉽게 녹음하고 관리할 수 있도록 설계된 스마트 음성 메모 앱입니다. 이 앱은 100개 이상의 언어로 음성 녹음을 지원합니다. 사용자는 자신의 생각을 말하기만 하면 Voicenotes가 자동으로 텍스트로 변환해 줍니다.
1 년 전
073.7K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: 동영상에서 임의의 움직이는 객체를 자동으로 분할하는 오픈 소스 도구

일반 소개 SegAnyMo는 UC 버클리와 북경대학교의 연구팀이 개발한 오픈 소스 프로젝트로, Nan Huang 등의 멤버가 참여하고 있습니다. 이 도구는 동영상 처리에 중점을 두고 있으며 동영상에서 사람, 동물 또는... 등 임의의 움직이는 물체를 자동으로 식별하고 세그먼트화할 수 있습니다.
1 년 전
073.7K
Prompt Smith:在线轻松管理多版本 Gen AI 提示词

프롬프트 스미스: 온라인에서 여러 버전의 Gen AI 프롬프트를 손쉽게 관리하기

일반 소개 프롬프트 스미스는 사용자가 생성형 AI 프롬프트를 쉽게 관리할 수 있도록 설계된 프롬프트 엔지니어링 솔루션입니다. 이 플랫폼은 사용자가 데이터를 완전히 제어할 수 있는 자체 호스팅 옵션을 제공합니다. 도커화된 배포를 통해 사용자는 쉽게 시작하고 실행할 수 있습니다.
2 년 전
073.7K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

울트라박스: 실시간 엔드투엔드 음성 대화를 위한 오디오 멀티모달 매크로 모델, GPT-4o 음성 상호작용의 오픈 소스 구현

종합 소개 Ultravox는 실시간 음성 처리를 위해 설계된 혁신적인 멀티모달 대규모 언어 모델(LLM)입니다. 기존의 음성 인식 시스템과 달리 Ultravox는 별도의 ASR(오디오 음성 인식) 단계가 필요하지 않으며, 오디오를 고차원 공간으로 직접 변환할 수 있습니다.
2 년 전
073.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio: 비디오 영상에 동기화된 음향 효과 및 사운드 트랙 생성, 비디오-오디오 멀티모달 코트레이닝 도구

일반 소개 MMAudio는 공동 멀티모달 훈련을 통해 고품질의 동기화된 오디오를 생성하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 홍콩 중문대학교의 호케이 쳉 등이 개발한 이 프로젝트의 주요 기능은 비디오 및/또는 텍스트 입력을 기반으로 동기화된 오디오를 생성하는 것입니다.MM...
2 년 전
073.7K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Petals: 대규모 언어 모델의 분산 공유 GPU 실행 및 미세 조정, BitTorrent 네트워크와 같은 GPU 리소스 공유

일반 소개 꽃잎은 분산 컴퓨팅 접근 방식을 통해 대규모 언어 모델(LLM)을 실행하기 위해 BigScience 워크숍에서 개발한 오픈 소스 프로젝트입니다. 사용자는 가정에서 소비자용 GPU 또는 Google Co...를 사용하여 LLM을 실행할 수 있습니다.
2 년 전
073.5K
Midreal AI:互动式AI文字冒险游戏和幻想小说创作

미드리얼 AI: 인터랙티브 AI 텍스트 어드벤처 게임과 판타지 소설 쓰기

일반 설명 Midreal AI는 흥미롭고 영감을 주는 대화를 통한 텍스트 어드벤처 게임으로, 플레이어에게 몰입감 넘치는 내러티브 경험을 제공하는 최첨단 AI 기술이 특징입니다. 플레이어는 자신만의 시나리오를 설정하여 게임 전반에 걸쳐 다양한 내러티브 스레드를 탐색하고 경험할 수 있습니다. 이 플랫폼은 특히 다음과 같은 경우에 적합합니다.
2 년 전
073.5K
DH live:在30/40系显卡流畅实时交互的AI数字人

DH 라이브: 30/40 시리즈 그래픽 카드에서 원활한 실시간 상호작용을 위한 AI 디지털 휴먼

일반 소개 DH_live는 샘플리스 학습을 기반으로 하는 실시간 라이브 디지털 휴먼 프로젝트로, 사용자에게 원활하고 인터랙티브한 라이브 스트리밍 경험을 제공하는 것을 목표로 합니다. 이 프로젝트는 NVIDIA 30 및 40 시리즈 그래픽 카드를 지원하며 25fps 이상에서 실시간으로 실행할 수 있습니다. 사용자는...
2 년 전
073.4K
They See Your Photos:基于 Google Vision 照片隐私信息分析

그들은 내 사진을 본다: Google 비전을 기반으로 한 사진 개인정보 정보 분석

일반 소개 그들이 당신의 사진을 봅니다는 사용자가 자신의 사진에 숨겨진 개인 정보를 이해할 수 있도록 설계된 사용하기 쉬운 온라인 도구입니다. 사용자는 어떤 이미지든 업로드할 수 있으며, 웹사이트는 인공 지능 기술을 통해 이미지 콘텐츠와 메타데이터를 분석하여 사진에서 드러날 수 있는 세부 정보를 표시합니다.
1 년 전
073.4K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet: 텍스트 설명을 사용하여 온프레미스 애플리케이션을 빠르게 빌드 및 배포하기

일반 소개 ToolJet은 간단한 자연어 설명으로 맞춤형 AI 애플리케이션과 에이전트를 생성할 수 있는 AI 기반 엔터프라이즈 애플리케이션 개발 플랫폼입니다. 사용자는 원하는 애플리케이션을 설명하기만 하면 ToolJet이 UI, 데이터베이스, 쿼리 등 모든 설정을 수행합니다.
1 년 전
073.3K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)

ClipZap AI 얼굴 스왑 도구: 사진 및 동영상에 대한 빠른 AI 얼굴 스왑(무료)

일반 설명 ClipZap AI 얼굴 대체 도구는 사진 및 동영상 얼굴 대체를 위해 설계된 선도적인 AI 얼굴 대체 도구입니다. 이 사이트는 고급 AI 기술을 사용하여 동영상과 이미지에서 사람을 자동으로 인식하고 고품질 얼굴 교체를 수행합니다. 재미있는 이모티콘을 만들든 ...
1 년 전
073.3K
Dzine:可控的AI图像生成功能与画布设计工具,提供数百种图像风格样式

Dzine: 제어 가능한 AI 이미지 생성 기능 및 캔버스 디자인 도구로 수백 가지 이미지 스타일과 스타일을 제공합니다.

일반 소개 Dzine(구 Stylar)은 이미지 생성부터 편집, 독보적인 이미지 구성 및 스타일 제어까지 통합된 워크플로우를 제공하는 올인원 AI 디자인 플랫폼입니다. 사전 정의된 스타일을 통해 모든 기술 수준의 사용자가 복잡한 과정 없이 쉽게 디자인을 맞춤 설정할 수 있습니다.
2 년 전
073.3K
TinyWow:免费使用多功能写作与图像在线编辑工具

TinyWow: 온라인에서 무료로 사용할 수 있는 다기능 글쓰기 및 이미지 편집 도구

일반 소개 TinyWow는 사용자의 디지털 생활을 간소화하도록 설계된 다양한 무료 디지털 도구를 제공하는 종합 온라인 플랫폼입니다. PDF 관리, 동영상 편집, 이미지 조작, AI 기반 글쓰기 지원 등 TinyWow는 사용자에게 필요한 모든 것을 갖추고 있습니다.
1 년 전
073.2K
QuillBot:智能辅助改写与校对文本的写作工具

QuillBot: 텍스트 재작성 및 교정을 지능적으로 지원하는 글쓰기 도구

일반 소개 QuillBot은 사용자가 텍스트 콘텐츠를 빠르게 재작성, 교정 및 최적화할 수 있도록 설계된 AI 기반 온라인 글쓰기 지원 플랫폼입니다. 자연어 처리 기술을 통해 텍스트 재작성, 문법 검사, 텍스트 요약 및 번역 기능을 제공하며 학생, 직장인 및 내부 직원에게 적합합니다.
1 년 전
073.2K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: 게임 채팅 콘텐츠의 실시간 번역을 위한 오픈 소스 클라이언트

일반 소개 DeepRant는 게이머를 위한 오픈 소스 번역 도구로, 국제 서버의 언어 장벽 문제를 해결하기 위해 설계되었습니다. 단축키를 통해 게임 내 텍스트를 즉시 번역할 수 있고, 여러 언어를 지원하여 서로 번역할 수 있으며, 플레이어가 게임을 종료하지 않고도 채팅 메시지를 빠르게 이해하고 답장할 수 있습니다....
1 년 전
073.2K
Consensus:优秀的学术论文搜索引擎

컨센서스: 학술 논문을 위한 훌륭한 검색 엔진

컨센서스는 AI 기술을 사용하여 과학 연구 논문을 찾고 요약하는 검색 엔진입니다. 이 플랫폼을 통해 사용자는 "크레아틴이 근육을 만드는 데 도움이 될 수 있나요?"와 같은 질문을 할 수 있습니다. 또는 "긍정적인 생각 명상이 수면을 개선할 수 있나요?"와 같은 질문을 할 수 있습니다. 2억 개가 넘는 과학 논문에서 인사이트를 얻을 수 있습니다...
2 년 전
073.1K
iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸

AI: 지능형 AI 사진 편집기|무료 이미지 배경 제거|모델 꾸미기|얼굴 바꾸기

iFoto 일반 설명 ifoto는 전자상거래용으로 설계된 무료 온라인 AI 사진 편집 도구로 온라인 제품 프레젠테이션을 향상시키는 다양한 기능을 제공합니다. AI 기술을 통해 의류 모델을 사실적인 모델로 변환하고 제품에 대한 실제 장면의 다양한 배경을 제공합니다.
2 년 전
073.1K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT: 자동화된 AI 인텔리전스를 생성하고 실행하는 오픈 소스 프로젝트

일반 소개 AgentGPT는 사용자가 브라우저를 통해 자율적으로 AI 인텔리전스를 생성, 구성 및 배포할 수 있도록 설계된 오픈 소스 프로젝트로, Reworkd 팀에서 개발하여 GitHub에서 호스팅하고 있습니다. 사용자는 목표를 설정하기만 하면 AgentGPT는 다음을 수행할 수 있습니다.
1 년 전
073.1K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

AR 드로잉: AR 및 AI 기술을 사용하여 사실적인 손 그리기 기술을 향상시키는 앱입니다.

일반 설명 AR 드로잉은 증강 현실(AR) 기술을 사용하여 사용자의 그림 실력을 향상시키는 데 도움을 주는 앱입니다. 이 앱은 초급부터 고급까지 다양한 수준의 드로잉 템플릿을 다루는 200개 이상의 단계별 가이드 드로잉 레슨을 제공합니다. 사용자는 휴대폰 카메라를 사용하여 이미지를 전송할 수 있습니다...
2 년 전
073.1K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: 데스크톱 및 브라우저 자동화를 위한 지능형 바디 워크플로 구축 자연어

일반 소개 Eko는 자연어 설명을 통해 효율적인 지능형 에이전트 워크플로우를 구축하도록 설계된 프로덕션급 자바스크립트 프레임워크입니다. 개발자가 심층적인 프로그래밍 없이도 AI 기술을 사용하여 일상적인 작업을 자동화할 수 있도록 설계되었으며, Eko는 단일 ...
1 년 전
073.1K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit: Tencent ARC에서 출시한 이미지 복원 및 편집을 위한 올인원 도구

종합 소개 BrushEdit는 Tencent ARC Labs에서 개발한 올인원 이미지 복구 및 편집 도구입니다. 이 도구는 최신 AI 기술을 기반으로 하며 이미지의 결함을 자동으로 식별하고 복구하는 동시에 사용자의 대화형 편집을 지원할 수 있으며, BrushEdit는 다양한 기능을 결합합니다.
2 년 전
073.1K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 시각 언어 모델의 일반화 기능을 위한 저비용 강화 학습

종합 소개 R1-V는 저비용 강화 학습(RL)을 통해 시각 언어 모델링(VLM)의 획기적인 발전을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 검증 가능한 보상 메커니즘을 활용하여 VLM이 일반적인 수 세기 능력을 학습하도록 동기를 부여합니다. 놀랍게도, R1-V의 2B는 ...
1 년 전
073K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
1 년 전
073K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台

GeekAI: 다중 모델 API 운영 백엔드에 완벽하게 액세스할 수 있는 자체 배포된 상용 다기능 AI 어시스턴트입니다.

포괄적인 소개 GeekAI는 AI 빅 언어 모델 API 구현을 기반으로 하는 AI 비서를 위한 오픈 소스 솔루션의 전체 세트입니다. 이 프로젝트는 즉시 사용 가능한 운영 관리 백엔드와 함께 제공되며 ChatGPT, Azure, ChatGLM, 슌페이 스타파이어, 웬신 이인 및 기타 여러 플랫폼과 통합되어 있습니다.
2 년 전
073K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合

Pika: 뛰어난 크리에이티브 비디오 생성 | 텍스트-비디오 변환 | 그래픽-비디오 변환 | 이미지-비디오 융합

피카 소개 피카닷아트는 아이디어를 동영상으로 만들어주는 플랫폼으로, 창의적인 사람들에게 인공지능 동영상 제작 도구를 제공하는 것을 목표로 합니다. 재미있는 클립, 소셜 미디어 콘텐츠 또는 단편 영화를 만들고 싶을 때 Pika.art는 사용자의 상상력을 따라갈 수 있습니다. 사용자...
1 년 전
073K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

루이 모델: 렌즈 제어 및 모션 진폭 제어를 지원하는 이미지-투-비디오 오픈 소스 모델을 생성합니다.

일반 소개 Ruyi-Models는 이미지에서 고품질 동영상을 생성하도록 설계된 오픈 소스 프로젝트입니다. IamCreateAI 팀이 개발한 이 프로젝트는 768 해상도, 초당 24프레임, 5초에 120프레임의 시네마틱 비디오 생성을 지원합니다....
2 년 전
072.9K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: 캐릭터가 일관된 비디오를 생성하는 인물 참조 맵, 신속한 다중 터미널 통합

개요 ConsisID는 북경대학교의 Yuan Rong 그룹이 개발한 오픈 소스 프로젝트로, 주파수 분해 기술을 통해 정체성 일관성 있는 텍스트-비디오 생성(IPT2V)을 달성하는 것을 목표로 합니다. 이 프로젝트의 핵심은 DiT(Diffusion Transfor ...
2 년 전
072.9K
Descript:一站式视频与播客编辑,简单如编辑文档

설명: 문서 편집만큼이나 간단한 원스톱 동영상 및 팟캐스트 편집 기능

설명 일반 설명 Descript는 강력하면서도 사용하기 쉬운 동영상 및 팟캐스트 편집 도구입니다. 업계 최고의 전사 정확도와 속도, 강력한 보정 도구는 물론 AI 기술로 비디오를 텍스트로 전사하고 텍스트를 편집하여 비디오를 편집할 수 있는 기능을 갖추고 있습니다. 그 외에도...
2 년 전
072.9K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 비디오 이해와 여러 차례의 대화를 지원하는 오픈 소스 멀티모달 모델

종합 소개 CogVLM2는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 멀티모달 모델로, Llama3-8B 아키텍처를 기반으로 하며 GPT-4V와 비슷하거나 더 나은 성능을 제공하는 것을 목표로 합니다. 이 모델은 이미지 이해, 다원 대화, 시각적 ...
1 년 전
072.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

XYKS: 소형 유인원 구두 계산 리버스 노트, 리버스 엔지니어링 및 복호화 알고리즘

포괄적인 소개 유인원 입 계산기 리버스 노트는 유인원 입 계산기 애플리케이션을 리버스 엔지니어링하는 과정과 방법을 문서화하고 공유하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트에는 사용자가 작은 유인원 구강 산술 추가를 이해하고 해독하는 데 도움이 되는 지침을 사용하기 위한 다양한 리버스 도구 및 기술(예: Frida, dexdump 등)이 포함되어 있습니다.
2 년 전
072.9K
Chatwise:共享知识变成收入的AI聊天机器人

Chatwise: 지식을 수익으로 전환하는 AI 챗봇

일반 소개 Chatwise는 사용자가 자신의 지식을 수익을 창출하는 인공지능 챗봇으로 전환할 수 있도록 도와주는 간단하고 유용한 플랫폼입니다. 파일, 문서 또는 링크를 업로드하기만 하면 유료 구독을 통해 다른 사람들이 콘텐츠를 통해 학습할 수 있는 지능형 봇을 빠르게 생성할 수 있습니다.
1 년 전
072.8K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频

VideoFX(Veo2): 높은 물리적 상태 재현과 네이티브 4K 비디오 출력을 지원하는 AI 생성 크리에이티브 비디오

일반 소개 VideoFX는 사용자가 창의적이고 시각적으로 멋진 동영상 콘텐츠를 쉽게 만들 수 있도록 설계된 Google Labs의 혁신적인 동영상 제작 도구입니다. 이 도구는 고급 Veo 2.0 기술을 활용하여 다양한 크리에이티브에 적합한 광범위한 동영상 효과 및 편집 기능을 제공합니다.
2 년 전
072.8K
PSHuman:生成逼真3D人像模型,使用一张照片生成3D人建模

PSHuman: 사실적인 3D 인물 모델 생성, 사진을 사용하여 3D 인체 모델링 생성

일반 소개 PSHuman은 멀티뷰 확산 기술을 기반으로 한 단일 이미지 3D 인물 재구성 툴입니다. 이 도구는 옷을 입은 사람의 단일 사진에서 상세한 기하학적 구조와 사실적인 3D 인물 모델을 생성할 수 있으며, PSHuman의 핵심 기술에는 크로스 스케일 멀티뷰 확산이 포함되어 있습니다.
2 년 전
072.8K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台

Fa Xing Bao: AI 법률 고문, 인공지능 법률 자문, 바이두 AI 법률 플랫폼

종합 소개 로신바오는 바이두에서 출시한 지능형 법률 서비스 플랫폼으로, 첨단 인공지능 기술과 전문 법률 지식 기반을 통합한 플랫폼입니다. 이 플랫폼은 사용자에게 지능형 법률 Q&A, 판례 분석, 계약서 검토 및 기타 기능을 포함한 편리하고 전문적인 법률 지능형 서비스를 제공하는 데 전념하고 있습니다. 딥러닝을 통해 ...
1 년 전
072.8K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: 가사를 전체 노래의 기본 모델로 변환하여 다양한 음악 스타일을 지원합니다.

일반 소개 YuE는 가사를 전체 곡으로 변환하는 데 중점을 둔 오픈 소스 전체 곡 생성 기본 모델입니다. 비보컬 음악의 짧은 스니펫만 생성하는 다른 모델과 달리 YuE는 최대 몇 분 길이의 리드 보컬과 백 보컬이 포함된 전체 곡을 생성할 수 있습니다. 이 모델은 음악 생성을 ...
1 년 전
072.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen: 오픈 소스 디지털 휴먼 강의 제작 플랫폼, PPT 원클릭 생성 복제 디지털 휴먼 강의 영상

종합 소개 Easegen은 AI 기술을 통해 교육 콘텐츠 제작 및 관리의 효율성을 높이는 것을 목표로 하는 오픈 소스 디지털 휴먼 코스 제작 플랫폼입니다. 이 플랫폼은 코스 제작, 비디오 관리, 지능형 질문까지 원스톱 솔루션을 제공하여 사용자가 디지털 휴먼 설명 비디오 코스를 제작할 수 있도록 지원합니다.
2 년 전
072.8K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: DeepSeek를 사용하여 4학년 단어 학습 자료를 생성하는 오픈 소스 도구입니다.

종합 소개 "Vocabulary Book by DeepSeek"은 영어 학습자가 대학 영어 레벨 4(CET-4)의 어휘를 효율적으로 마스터할 수 있도록 돕기 위해 DeepSeek의 빅 모델을 기반으로 개발된 오픈 소스 프로젝트입니다. 이 프로젝트는 GitHub에서 호스팅됩니다...
1 년 전
072.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

휘젓기: 여러 이미지를 업로드하고 테마, 장면 및 스타일을 혼합하여 독특한 아트웍을 만들어 보세요!

일반 소개 Whisk는 여러 이미지를 업로드하여 다양한 테마, 장면, 스타일을 혼합할 수 있도록 설계된 Google Labs의 혁신적인 AI 이미지 생성 도구입니다. 텍스트 프롬프트에 의존하는 기존 이미지 생성 도구와 달리 Whisk는 주로 이미지를 입력으로 사용합니다...
1 년 전
072.8K
Same:克隆网站UI生成生产级前端代码

동일: 웹사이트 UI를 복제하여 프로덕션급 프런트엔드 코드 생성하기

일반 소개 Same은 디자이너와 개발자에게 웹 인터페이스를 빠르게 복제할 수 있는 기능을 제공하도록 설계된 간단하고 유용한 온라인 도구입니다. URL을 입력하면 대상 페이지의 픽셀 단위 사본을 생성하여 사용자가 수동으로 다시 그려야 하는 시간을 절약할 수 있습니다. 사이트의 핵심은 '복사...
1 년 전
072.8K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: 모델 통합 및 데이터 흐름 관리를 지원하여 AI 채팅 인터페이스를 빠르게 구축할 수 있는 툴킷입니다.

종합 소개 Ant Design X는 개발자가 AI 기반 대화 인터페이스를 빠르게 구축할 수 있도록 설계된 Ant Group에서 오픈소스화한 툴킷입니다. 풍부한 구성 요소와 템플릿 세트를 제공하고 OpenAI 표준과 호환되는 모델 통합을 지원하며 지능형 고객 서비스, AI 어시스턴트 등 다양한 애플리케이션에 적합합니다.
2 년 전
072.8K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: 원격 기술 인터뷰를 지원하는 보이지 않는 AI 도구

일반 소개 Interviewcoder는 기술 면접을 위해 설계된 AI 지원 도구로, 사용자가 프로그래밍 면접 중에 솔루션을 빠르게 생성하고 코드를 최적화하며 실시간으로 디버깅할 수 있도록 설계되었습니다. 이 도구는 사용자가 Zoom, Google...에서 사용할 수 있는 스텔스 데스크톱 애플리케이션으로 실행됩니다.
1 년 전
072.7K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI 얼굴 스왑: 오픈 소스 두 번째 오리 카메라, 프론트엔드 및 백엔드 완전한 엔터프라이즈 AI 얼굴 스왑 애플릿 배포(산술 서비스 결제, 두 개가 열려 있을 수 있음)

종합 소개 LunaAI 페이스 스왑 애플릿은 유니앱과 뷰 프레임워크를 기반으로 개발된 페이스 스왑 애플리케이션입니다. 이 애플리케이션은 애플릿을 통해 사용자의 얼굴 변경 작업 기능을 구현하기 위해 PHP, MySQL, Nginx 및 Redis를 사용합니다. 사용자는 이 작은 ...
2 년 전
072.7K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧

터프 텅 AI: AI 대화로 면접 및 직장 내 커뮤니케이션 기술 연습하기

일반 소개 터프 텅 AI는 어려운 대화 연습을 위해 설계된 인공 지능 플랫폼입니다. 사용자는 사전 설정된 시나리오를 선택하거나 사용자 지정 시나리오를 생성하여 면접, 연봉 협상, 영업 프레젠테이션 등 다양하고 복잡한 대화 상황을 시뮬레이션할 수 있습니다. 이 플랫폼은 비디오 및 ...
1 년 전
072.7K
ModelsLab:AI图像生成为主的API服务商|免费体验1000+模型

ModelsLab: AI 이미지 생성 기반 API 서비스 제공업체 | 1000개 이상의 모델 무료 제공!

일반 소개 모델랩은 텍스트를 이미지, 비디오, 오디오 및 3D 모델로 변환하는 데 중점을 둔 다양한 AI 생성 도구를 제공하는 플랫폼입니다. 이 플랫폼은 개발자와 기업이 AI 생성 콘텐츠를 쉽게 만들고 통합할 수 있는 강력한 API 서비스를 제공합니다.모드...
2 년 전
072.7K
飞书知识问答:使用飞书文档作为AI知识库

플라이북 지식 퀴즈: 플라이북 문서를 AI 지식 베이스로 활용하기

종합 소개 플라잉북 지식 Q&A는 딥서치 R1 빅모델 기술을 심층적으로 통합한 플라잉북에서 출시한 AI 기반 지식 관리 및 Q&A 도구입니다. 실시간 네트워킹 검색, 다중 형식 파일 구문 분석(문서, 이미지 등 포함)을 지원하며 기업 지식 베이스를 원활하게 도킹하여 사용할 수 있습니다.
1 년 전
072.7K
Diagramming AI:使用AI在线设计UML图和工作流程图

다이어그램 작성 AI: AI를 사용하여 온라인에서 UML 다이어그램 및 워크플로 다이어그램 디자인하기

일반 소개 Diagramming AI는 인공 지능 기술을 사용하여 사용자가 UML 다이어그램과 워크플로 차트를 즉시 디자인하고 편집할 수 있도록 도와주는 강력한 온라인 도구입니다. 이 사이트는 순서도, 시퀀스 다이어그램, 간트 차트 등 다양한 다이어그램 형식을 제공하며, 사용자는 텍스트를 입력하기만 하면 ...
1 년 전
072.6K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM: 대규모 언어 모델을 추론하고 서비스하기 위한 효율적인 경량 프레임워크

포괄적인 소개 LightLLM은 경량 설계, 손쉬운 확장, 효율적인 성능으로 잘 알려진 Python 기반의 대규모 언어 모델(LLM) 추론 및 서비스 프레임워크입니다. 이 프레임워크는 FasterTransfor...를 비롯한 다양한 유명 오픈 소스 구현을 활용합니다.
1 년 전
072.5K
Mebot:支持长期记忆多类文档的全终端个人AI助手(推荐)

Mebot: 여러 유형의 문서에 대한 장기 메모리를 지원하는 풀 엔드포인트 개인용 AI 비서(권장)

일반 설명 Me.bot은 일상생활을 위해 만들어진 개인용 인공지능 비서입니다. 기억을 정리하고 창의력을 자극하며 아이디어를 증폭하는 데 도움을 주는 두 번째 두뇌 역할을 하며, Me.bot은 자체 개발한 강력한 개인 모델로 구동되며 고급 암호화 및 개인 정보 보호 기능을 통해 다음과 같은 기능을 보장합니다.
2 년 전
072.5K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: 전문 온라인 오디오 편집 도구|오디오북 제작|텍스트 음성 변환|반주 분리

일반 소개 XAudioPro는 전문성과 휴대성을 모두 갖춘 고급 온라인 오디오 실시간 편집 및 트랜스코딩 도구입니다. 자르기, 자르기, 복사, 삭제, 복원 및 진폭 게인 제어와 같은 전문적인 오디오 편집 기능을 지원합니다. 또한 스펙트럼 감산 노이즈 감소, 저역 통과와 같은 노이즈 제거 서비스도 제공합니다.
2 년 전
072.5K
Petal:使用AI分析和管理文档,检索多文档生成有据可查的答案

Petal: AI를 사용하여 문서를 분석 및 관리하고, 여러 문서를 검색하여 잘 문서화된 답변을 생성합니다.

일반 소개 Petal은 사용자가 문서를 효율적으로 관리하고 분석할 수 있도록 설계된 AI 기반 문서 분석 플랫폼입니다. Petal을 통해 사용자는 지식 베이스를 플랫폼에 연결하고 완전히 문서화되고 신뢰할 수 있는 답변을 생성할 수 있으며, Petal은 여러 문서 유형을 지원합니다.
1 년 전
072.5K
WeaveFox:前端智能研发平台,能够根据设计图直接生成源代码

WeaveFox: 설계 도면에서 직접 소스 코드를 생성하는 지능형 프런트엔드 개발 플랫폼

종합 소개 위브폭스는 앤트그룹에서 출시한 AI 프론트엔드 지능형 R&D 플랫폼으로, AI 기술을 통해 프론트엔드 개발의 효율성과 품질을 향상시키는 것을 목표로 합니다. 이 플랫폼은 설계 도면을 기반으로 프론트엔드 소스 코드를 직접 생성할 수 있고 여러 클라이언트 및 기술 스택을 지원하는 Ant가 자체 개발한 베일링 멀티모달 대형 모델을 기반으로 합니다....
2 년 전
072.5K
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: 기본적으로 오프라인에서 실행되는 실시간 음성 녹음 및 번역 소프트웨어

일반 설명 MacBook을 사용 중이라면 오디오를 녹음하고, 실시간 현지 음성을 텍스트로 변환하고, 번역하고, 자막을 내보낼 수 있는 AI Hear를 사용해 보세요. 국가 간 회의나 영어 오디오북을 들을 때 유용하게 사용할 수 있습니다. AI Hear는 로컬에서 실행되는 소프트웨어로, 클릭 한 번으로 실시간...
2 년 전
072.4K