최신 AI 리소스

共 2769 篇文章
SurveyGO卷姬 - 清华联合面壁智能推出的开源AI论文写作工具

SurveyGO 볼륨 지 - 칭화대학교에서 Facing Intelligence와 함께 출시한 오픈 소스 AI 에세이 작성 도구입니다.

SurveyGO(볼륨 지)는 칭화대학교가 Facing Intelligence 팀과 함께 개발한 오픈 소스 AI 논문 작성 도구로, 연구자와 학생이 문헌 검토 섹션을 빠르게 생성하는 데 도움을 줄 수 있습니다. 사용자는 논문의 주제와 설명만 입력하면 이 도구는 리뷰 기사의 명확한 구조와 풍부한 콘텐츠를 신속하게 생성하고 수만 단어 길이를 지원할 수 있습니다.
4개월 전
020.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPT 연구원: 로컬 및 웹 기반 데이터를 사용하여 포괄적이고 상세한 연구 보고서 생성

종합 소개 GPT Researcher는 로컬 및 웹 리서치를 수행하고 상세한 리서치 보고서를 생성하도록 설계된 LLM(대규모 언어 모델) 기반의 자율 에이전트 도구입니다. 이 도구는 에이전트 작업을 병렬화하여 안정적인 성능과 빠른 속도를 제공하고 정확한 정보를 보장합니다.
7개월 전
020.3K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - 알리 통이, 시각적 추론 모델 출시

QVQ-Max는 이미지와 비디오 콘텐츠를 "읽기"하고 분석 및 문제 해결을 위한 정보와 결합할 수 있는 알리토닉스의 최첨단 시각 추론 모델로, QVQ-72B-Preview의 업그레이드 버전입니다. QVQ-Max는 이미지 및 비디오 콘텐츠를 "읽기"하고 분석, 추론 및 문제 해결을 위해 정보를 결합할 수 있는 QVQ-72B-Preview의 업그레이드 버전입니다.QVQ-Max의 주요 기능에는 이미지 구문 분석, 비디오 분석 및 ...
4개월 전
020.3K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - 두뇌 크기의 협업 프레임워크를 구현한 Wisdom Spectrum의 오픈 소스 교차 온톨로지

RoboOS 2.0은 로봇이 단일 지능에서 그룹 협업 지능으로 전환하는 것을 촉진하는 교차 온톨로지 두뇌-두뇌 협업을 위한 오픈 소스 프레임워크입니다. 이 프레임워크는 '빅 브레인' 아키텍처를 사용하여 클라우드 브레인은 복잡한 의사 결정과 협업을 담당하고 스몰 브레인 모듈은 특정 기술을 실행하는 데 집중하는 효율적인 분업을 달성합니다.
3 개월 전
020.3K
CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - Amoy Group의 효율적인 VLA 모델

CombatVLA는 아모이 그룹의 퓨처 라이프 랩 팀이 개발한 혁신적인 3D 액션 롤플레잉 게임(ARPG) 전용 모델로, 3B 파라메트릭 스케일로 구축된 시각-언어-행동(VLA) 모델로, 모션 트래커를 통해 인간 플레이어의 동작을 수집합니다.
2개월 전
020.2K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

검색 o1: 추론 모델이 능동적으로 검색할 수 있도록 지원하여 대규모 모델이 사고하면서 외부 지식을 검색할 수 있도록 합니다.

종합 소개 Search-o1은 고급 검색 메커니즘을 통합하여 대규모 추론 모델(LRM)의 성능을 향상시키는 것을 목표로 하는 오픈 소스 프로젝트입니다. 핵심 아이디어는 동적 검색과 지식 통합을 통해 추론 과정에서 발생하는 지식 결핍 문제를 해결하는 것입니다. 이 프로젝트는 sunn이 후원합니다...
9개월 전
020.2K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - 구글 오픈 소스 프로그래밍 에이전트

Gemini CLI는 개발자에게 강력한 AI 기능을 제공하기 위해 Gemini 빅 모델을 개발자의 엔드포인트에 통합한 Google의 오픈 소스 AI 프로그래밍 도구입니다. 이 도구는 코드를 이해하고, 파일을 조작하고, 명령을 실행하고, 동적으로 문제를 해결하여 개발자가 효율적으로 생성 코드를 작성할 수 있도록 도와줍니다.
4개월 전
020.2K
Mapify - XMind推出的AI思维导图生成工具

Mapify - XMind의 AI 마인드맵 생성기

Mapify는 XMind 팀의 AI 마인드맵 생성기입니다. 텍스트, PDF, 웹 페이지, 비디오, 오디오 및 기타 형식을 구조화된 마인드맵으로 빠르게 변환하여 사용자가 핵심 정보를 효율적으로 추출하고 정리할 수 있도록 도와줍니다.
4개월 전
020.2K
魔力设 - AI设计平台,一键智能生成PPT和抠图

MagicSet - AI 디자인 플랫폼, 원클릭 지능형 PPT 및 키 입력 생성

매직셋은 효율적이고 편리한 온라인 AI 디자인 플랫폼으로, 사용자에게 원스톱 디자인 솔루션을 제공합니다. 이 플랫폼은 500,000개 이상의 정품 이미지, 일러스트, 아트 캐릭터 및 기타 자료가 포함된 풍부한 저작권 자료 라이브러리를 통합하여 사용자가 저작권 문제에 대한 걱정 없이 무료로 사용할 수 있습니다. 이 플랫폼은 다음을 포함한 200,000개 이상의 디자인 템플릿을 제공합니다.
4개월 전
020.2K
探饭 - 字节跳动推出的AI美食推荐工具

스카우팅 라이스 - 워드프레스에서 출시한 AI 음식 추천 도구

탄라이스는 바이트댄스의 자회사인 지터버그가 출시한 인공지능 음식 추천 도구로, 빈백 빅 모델을 기반으로 사용자에게 개인화된 음식 추천, 상점 검색 비교, 음식 팁 및 기타 서비스를 제공합니다. 탄라이스는 사용자의 취향과 위치를 기반으로 주변 레스토랑과 요리를 정확하게 추천하고, 주문 보조를 지원하며, 단체 구매 및 테이크아웃 서비스를 제공합니다....
4개월 전
020.1K
职达AI简历 - AI简历生成与优化平台,精准分析问题、提供优化建议

JobTech AI 이력서 - 문제를 정확하게 분석하고 최적화 제안을 제공하는 AI 이력서 생성 및 최적화 플랫폼입니다.

Job AI 이력서는 효율적이고 편리한 지능형 이력서 생성 및 최적화 플랫폼입니다. 이 플랫폼은 AI 기술을 기반으로 사용자가 전문적이고 개인화된 이력서를 빠르게 생성할 수 있도록 도와줍니다. 사용자는 기본 정보와 경력만 입력하면 다양한 직무를 포괄하는 2800개 이상의 아름다운 템플릿을 제공하여 단시간에 고품질의 이력서를 생성할 수 있습니다.
4개월 전
020K
LitServe:快速部署企业级通用AI模型推理服务

LitServe: 엔터프라이즈급 범용 AI 모델 추론 서비스의 신속한 배포

포괄적인 소개 LitServe는 범용 AI 모델을 위한 추론 서비스를 신속하게 배포하는 데 중점을 둔 FastAPI를 기반으로 구축된 Lightning AI의 오픈 소스 AI 모델 서비스 엔진입니다. 대규모 언어 모델(LLM), 시각적 모델부터 다양한 모델을 지원합니다.
7개월 전
020K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 다국어 번역 및 더빙을 지원하는 AI 디지털 휴먼 비디오 제작 플랫폼

헤이젠은 간소화된 동영상 제작 프로세스를 지원하는 AI 기반 디지털 휴먼 동영상 제작 플랫폼으로, 사용자가 전문가 수준의 디지털 휴먼 동영상을 빠르게 제작할 수 있도록 지원합니다. 이 플랫폼은 고급 AI 기술을 기반으로 하여 사용자가 디지털 캐릭터의 이미지와 음성을 완벽하게 제어할 수 있으며, 다양한 배경을 포함한 풍부한 자료 라이브러리를 제공합니다.
5개월 전
020K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

훈위안비디오-아바타 - 텐센트 하이브리드 오픈 소스 음성 디지털 휴먼 모델

후위안비디오-아바타는 텐센트 혼합원 팀과 텐센트 뮤직 티엔친 연구소가 공동으로 출시한 고급 음성 디지털 휴먼 모델입니다. 이 모델은 사용자가 업로드한 캐릭터 이미지와 오디오를 기반으로 자연스러운 표정을 생성하는 혁신적인 멀티모달 확산 트랜스포머 아키텍처를 기반으로 합니다.
5개월 전
020K
Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - Quintessence의 AI 음악 생성 모델

Mureka V7은 쿤룬 월드와이드에서 출시한 고급 AI 음악 생성 모델입니다. 이 모델은 보다 일관성 있고 예술적인 음악 작품을 생성하기 위해 세부 사항을 채우기 전에 음악의 전체 구조를 계획하는 것을 지원하는 MusiCoT 기술을 기반으로 합니다.
3 개월 전
020K
迅雷MCP - 迅雷推出的AI自动下载服务

쉰레이 MCP - 쉰레이에서 출시한 AI 자동 다운로드 서비스

쉰레이 MCP는 AI 기술을 기반으로 한 자동 다운로드 서비스인 쉰레이가 출시한 서비스입니다. 서비스를 지원하는 AI 애플리케이션의 사용자가 음성 또는 텍스트 입력으로 다운로드 요청을 하면 AI가 자동으로 네트워크 리소스를 검색하고 다운로드를 시작합니다. 쉰레이 MCP는 기존의 다운로드 방식을 탈피하여 PC 버전의 쉰레이와 NAS 쉰레이를 지원하며, 이를 통해 ...
4개월 전
020K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpialGen - Qunar Technologies의 오픈 소스 3D 씬 생성 모델

스페이셜젠은 확산 모델 아키텍처를 기반으로 하는 쿠나 테크놀로지의 오픈 소스 3D 장면 생성 모델로, 텍스트 설명, 참조 이미지 및 3D 공간 레이아웃을 기반으로 시공간적으로 일관된 멀티뷰 이미지를 생성하고 3D 가우시안 장면 생성 및 로밍 비디오 렌더링을 지원합니다.
2개월 전
019.9K
ML-Master – 上海交大推出的AI专家Agent

ML-Master - SJTU에서 출시한 AI 전문가 에이전트

ML-Master는 상하이교통대학교 인공지능 학교의 에이전트 팀이 출시한 AI 전문 지능입니다. OpenAI의 권위 있는 벤치마크 테스트인 MLE 벤치에서 평균 29.3%의 메달 비율로 1위를 차지하며 Microsoft의 RD-Agent...를 능가하는 우수한 성적을 거두었습니다.
4개월 전
019.9K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - Ali에서 출시한 멀티모달 통합 AI 모델

Ovis-U1은 알리바바 그룹의 Ovis 팀이 30억 개의 매개변수 규모로 도입한 멀티모달 통합 모델입니다. 이 모델은 멀티모달 이해, 텍스트-이미지 생성, 이미지 편집의 세 가지 핵심 기능을 갖추고 있으며 고급 아키텍처 설계와 협업 및 통합 교육 방법을 통해 고충실도 이미지 구현을 지원합니다.
4개월 전
019.9K
Engineering:GitHub自动化代码审查、文档生成和团队报告平台

엔지니어링: 자동화된 코드 검토, 문서 생성 및 팀 보고를 위한 GitHub의 플랫폼

일반 소개 엔지니어링은 엔지니어링 팀이 자동화된 코드 검토, 문서 생성, 실시간 코드 채팅과 같은 기능을 통해 생산성을 높일 수 있도록 설계된 AI 도구입니다. 이 플랫폼은 전체 엔지니어링 스택을 맥락적으로 이해하여 엔지니어가 사용하는 도구의 수를 줄일 수 있도록 도와줍니다.
8개월 전
019.9K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn - ZJU 및 Vivo 등의 비디오 가상 체험 프레임워크

MagicTryOn은 절강대학교 컴퓨터 과학 기술 대학이 생체 및 기타 조직과 협력하여 출시한 고급 비디오 가상 체험 프레임워크입니다. 이 프레임워크는 기존의 U-Net 아키텍처를 혁신적인 확산 트랜스포머(DiT) 아키텍처로 대체하고, 완전히 스스로 인식하는 기계와 결합하여 ...
4개월 전
019.9K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 앤섬 디지털의 금융 추론을 위한 대규모 모델

Agentar-Fin-R1은 Anthem에서 도입한 금융 분야를 위한 최첨단 대규모 언어 모델입니다. 강력한 Qwen3 아키텍처를 기반으로 개발된 이 모델은 8B와 32B의 두 가지 파라미터 스케일 버전을 제공하며 다단계 분석, 위험 평가, 전쟁 등 복잡한 재무 추론 작업을 정확하게 처리할 수 있습니다.
3 개월 전
019.9K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni: 텍스트, 이미지 및 오디오 멀티모달 이해 및 분석을 지원하는 엔드사이드 멀티모달 이해 모델

종합 소개 인피니메그레즈는 하드웨어와 소프트웨어의 공동 설계를 통해 효율적인 멀티모달 이해와 분석을 목표로 하는 인피닛 코어 돔(인피닛 AI)이 개발한 엣지 인텔리전스 솔루션입니다. 프로젝트의 핵심은 그래프를 지원하는 Megrez-3B 모델입니다.
9개월 전
019.9K
Workers AI LLM Playground:云服务商提供的开源AI文本生成模型试用平台

Workers AI LLM Playground: 클라우드 서비스 제공업체의 오픈 소스 AI 텍스트 생성 모델을 위한 평가판 플랫폼

일반 소개 Cloudflare는 사용자가 메시지를 작성하고 응답을 미세 조정하여 다양한 AI 텍스트 생성 모델을 탐색할 수 있는 고급 온라인 플랫폼인 Workers AI LLM Playground를 선보입니다. 이 플랫폼은 다음과 같은 다양한 모델을 제공합니다.
1 년 전
019.9K
咔皮记账 - 商汤科技推出的智能AI记账应用

카피 부기 - ShangTech의 지능형 AI 부기 앱

카피 부기는 샹탕 테크놀로지에서 출시한 지능형 AI 부기 애플리케이션입니다. 이 애플리케이션은 자동 부기 기능을 핵심 기능으로 삼아 금액과 카테고리를 자동으로 식별하고 음성 입력을 지원하여 쉽고 편리하게 부기를 할 수 있습니다. 카피 부기는 청구 데이터를 지능적으로 분석하고 정기적으로 개인화된 소비 요약 및 재정 조언을 푸시하여 사용자가 더 나은 ...
4개월 전
019.8K
MotionGo - AI PPT动画插件,简单指令交互生成PPT

MotionGo - AI PPT 애니메이션 플러그인, 간단한 명령으로 대화형 PPT를 생성할 수 있습니다.

MotionGo는 지능형 대화 및 독점 애니메이션 라이브러리를 기반으로하는 AI 기반 PPT 애니메이션 플러그인으로 사용자가 빠르고 효율적으로 프레젠테이션을 만들 수 있도록 도와줍니다.MotionGo는 7,000 가지 이상의 애니메이션 효과를 제공하고 FlowCode 기능을 지원하며 기존 애니메이션의 한계를 극복하고 복잡한 동작을 달성합니다....
4개월 전
019.8K
Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - 통이 첸첸의 통합된 멀티모달 이해 및 생성 모델

Qwen VLo는 통이 첸첸 팀이 도입한 멀티모달 통합 이해 및 생성 모델입니다. Qwen VLo는 세계를 '이해'하고 그 이해를 바탕으로 고품질로 재창조하여 인식에서 생성으로의 도약을 실현할 수 있습니다. VLo는 이미지의 내용을 정확하게 이해할 수 있으며, 이를 바탕으로 일관되고 고품질의 생성을 수행할 수 있습니다.
4개월 전
019.8K
元镜 - AI视频创作工具,自动生成脚本

메타스코프 - 자동 스크립트 생성 기능을 갖춘 AI 동영상 제작 도구

메타미러는 인간과 컴퓨터의 공생 엔진을 기반으로 한 인공지능 영상 제작 도구로, 창의적인 영감에서 완성된 영상까지 효율적인 제작을 지원합니다. 이 도구는 자동 스크립트 생성, 캐릭터 스타일 통일, 멀티모달 융합 및 지능형 워크플로우 등을 갖추고 있으며, 창의적인 비디오 스크립트, 멀티모달 분할 화면 디자인을 빠르게 생성하고 클릭 한 번으로 전체 비디오를 합성할 수 있습니다....
5개월 전
019.8K
Kimi-Dev - 月之暗面开源的代码模型

Kimi-Dev - 달의 어두운 면 오픈 소스 코드 모델

Kimi-Dev는 72억 개의 매개 변수를 사용하여 소프트웨어 엔지니어링을 위해 설계된 Moonshot AI의 오픈 소스 코드 모델입니다. 이 모델에는 코드 오류를 자동으로 찾아서 수정하는 강력한 버그 픽서 기능이 있으며, 테스트 코드 생성 기능을 제공합니다.
4개월 전
019.8K
DeepPiano - 智曲科技推出的AI钢琴应用

DeepPiano - 스마트쿼트 테크놀로지의 인공지능 피아노 앱

딥피아노는 Zhiqu Technology에서 출시한 빅 모델을 핵심으로 하는 지능형 피아노 앱입니다. 고급 인공 지능 기술을 통해 피아노 연주자와 학습자를위한 다양한 편리한 기능을 제공합니다.DeepPiano는 지능형 악보 페이지 넘기기, 연주 진행 상황 자동 인식, 수동 조작이 필요없는 ...
4개월 전
019.8K
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 모델 지침이 루브릭 세트를 따르는 능력에 대한 Meeseeks 오픈 소스 평가

미즈윅스는 메이퇀의 M17 팀이 모델의 지시를 따르는 능력을 평가하기 위해 사용하는 오픈 소스 대규모 모델 평가 세트입니다.미즈윅스는 3단계 평가 프레임워크를 사용하여 모델이 매크로에서 마이크로 수준까지 사용자의 지시에 따라 답변을 생성할 수 있는지 종합적으로 측정하며 답변 내용에 대한 지식은 긍정적으로 평가하지 않습니다.
2개월 전
019.7K
11ai - ElevenLabs推出个人AI语音助理

11ai - ElevenLabs, 개인용 AI 음성 비서 출시

11ai는 일레븐랩스에서 출시한 인공지능 음성비서로, 자연스럽고 부드러운 대화를 통해 사용자의 업무 효율성을 높여주는 음성 상호작용을 핵심으로 하며, 5,000개 이상의 음성을 지원하고 사용자가 전용 음성을 커스터마이징할 수 있어 더욱 개인화된 어시스턴트입니다. 지연 시간이 짧은 음성 인터랙션으로 ...
4개월 전
019.6K
WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - 텐센트 위챗 오픈 소스 문서 이해 및 시맨틱 검색 프레임워크

WeKnora는 대규모 언어 모델(LLM) 문서 이해 및 의미 검색 프레임워크에 기반한 텐센트 위챗 팀의 오픈 소스로, 복잡하고 이질적인 문서 콘텐츠 시나리오의 구조를 위해 설계되었으며 모듈식 아키텍처, 다중 모드 전처리 통합, 의미 벡터 인덱싱, 지능형 리콜 및 대규모 모델 생성 추론을 사용하도록 설계되었습니다 ....
1개월 전
019.5K
有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - 넷이즈 유다오가 출시한 차세대 AI 일반 학습 도우미

유다오 리틀 P는 넷이즈 유다오에서 출시한 AI 전과목 학습 도우미로, 초등학교, 중학교, 고등학교 전과목 Q&A를 다루고 개인화된 학습 조언을 제공하는 유다오 즈이 교육 빅 모델을 탑재하여 초중고 학생들을 위해 설계되었습니다. 인공지능 단어 검색 및 인공지능 번역 기능을 갖춘 Youdao Little P는 학생들이 언어 문제를 빠르게 해결할 수 있도록 도와줍니다.
4개월 전
019.5K
FactSnap - 新一代AI信息核查工具

팩트스냅 - 차세대 AI 정보 검증 도구

팩트스냅은 사용자가 웹 정보의 진위 여부를 빠르게 확인할 수 있도록 도와주는 차세대 AI 정보 검증 도구입니다. 여러 모델과 검색 엔진을 통합하여 사용자가 웹을 탐색하는 동안 선택한 텍스트에 대한 실시간 검증을 수행합니다.
4개월 전
019.5K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI 실시간 API Next.js: 실시간 음성 대화 AI 애플리케이션을 구축하기 위한 Next.js 템플릿

포괄적인 소개 OpenAI 실시간 API Next.js는 개발자가 실시간 음성 AI 애플리케이션을 빠르게 구축할 수 있도록 설계된 Next.js 프레임워크 기반의 오픈 소스 프로젝트입니다. 이 프로젝트는 OpenAI의 실시간 API와 WebRTC 기술을 통합하여 ...
10개월 전
019.5K
Wide Research - Manus平台推出的多智能体协同功能

광범위한 연구 - Manus 플랫폼에 다중 지능 협업 도입

와이드 리서치는 복잡하고 대규모 작업을 처리하도록 설계된 마누스 플랫폼의 강력한 기능입니다. 이 플랫폼은 시스템 수준의 병렬 처리 메커니즘과 인텔리전스 협업 프로토콜을 통해 수백 개의 범용 인텔리전스가 동시에 작업할 수 있도록 지원합니다.
3 개월 전
019.5K
Magistral - Mistral AI 推出的系列推理模型

Magistral - Mistral AI의 추론 모델 시리즈

Magistral은 투명한 다국어 및 도메인별 추론 기능에 중점을 둔 Mistral AI의 추론 모델입니다. 이 모델은 오픈 소스 버전(Magistral Small)과 엔터프라이즈 버전(Magistral Medium)으로 구성되어 있으며, 후자는 ...
4개월 전
019.4K
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: 누렇게 변색되고 낡은 오래된 사진을 지능적으로 복원하는 AI 도구

오래된 사진을 다시 생생하게 복원하기는 AI 기술을 사용하여 오래된 사진을 복원하는 데 중점을 둔 Microsoft 연구팀이 개발한 오픈 소스 프로젝트입니다. 스크래치와 같은 사진의 심각한 품질 저하 문제를 처리할 수 있는 딥 러닝 접근 방식을 기반으로 합니다....
8개월 전
019.4K
飞算JavaAI - AI Java开发助手,自然语言实现全流程智能化开发

Flycount JavaAI - 지능형 개발의 전 과정을 자연어로 구현하는 AI Java 개발 도우미입니다.

플라이카운트 자바AI는 플라이카운트 테크놀로지에서 출시한 지능형 자바 개발 어시스턴트입니다. 이 플랫폼은 자연어 입력을 지원하여 요구사항 분석부터 코드 생성까지 지능형 개발의 전 과정을 지원합니다. 개발자는 요구 사항에 대한 설명만 입력하면 Flycount JavaAI가 완전한 엔지니어링 코드 프레임워크인 플랫폼을 정확하게 이해하고 생성할 수 있습니다.
4개월 전
019.4K
妙构 - AI视频分析与生成工具,揭示爆款视频创作规律

폭발적인 동영상 제작의 법칙을 밝히는 AI 동영상 분석 및 생성 도구, MyoConstruct

Miaojiao는 딥러닝 알고리즘을 기반으로 하는 전문 AI 동영상 콘텐츠 분석 및 생성 도구로, 동영상의 시각, 오디오 및 창의적 구조를 전방위적으로 분석하여 폭발적인 동영상 뒤에 숨겨진 법칙을 밝혀냅니다. 미아오지아오는 구도, 색상 및 카메라 언어를 분석하고, 창의적인 독창성과 정서적 공감을 평가하며, 트렌드 인사이트와 최적화 제안을 제공합니다....
4개월 전
019.3K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

링코드 IDE - 통이 링코드, AI 네이티브 개발 환경 도구 출시

스피릿 코드 IDE는 통이 스피릿 코드가 출시한 AI 네이티브 통합 개발 환경(IDE)으로, 천문 3대 모델에 깊이 적용되었으며 강력한 프로그래밍 지능체 모드를 통해 프로젝트 인식, 코드 검색, 터미널 작업 실행 등 작업의 자율적 완수를 지원합니다. MCP 도구를 지원하며 Magic Hitch MCP Square의 3...
5개월 전
019.2K
Skywork-SWE-32B - 昆仑万维开源的自主代码智能体基座模型

Skywork-SWE-32B - 쿤룬완웨이 오픈 소스 자율 코드 지능형 바디 기본 모델

Skywork-SWE-32B는 쿤룬 월드와이드웹에서 도입한 오픈 소스 32B 규모의 소프트웨어 엔지니어링(SWE) 자율 코드 인텔리전스 기본 모델입니다. 이 모델은 소프트웨어 엔지니어링 작업에 초점을 맞추고 강력한 저장소 수준의 코드 복구 기능을 갖추고 있으며 다단계 상호 작용 및 긴 텍스트 처리가 있는 복잡한 시나리오에서 수행할 수 있습니다.
4개월 전
019.2K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - Ali, 실시간 텍스트 기반 대화형 아바타 생성 프레임워크 출시

옴니토커는 알리바바의 실시간 텍스트 기반 대화형 아바타 생성 프레임워크입니다. 이 프레임워크는 텍스트, 이미지, 오디오 및 비디오와 같은 여러 모달 입력을 동시에 처리하고 스트리밍 방식을 기반으로 자연스러운 음성 응답을 생성할 수 있습니다. 핵심은 씽커-토커 아키텍처를 기반으로 하며, 씬...
4개월 전
019.1K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

쿠션 원더풀 라이터 - AI 에세이 작성 도구, 아이디어에서 완성된 논문까지 원스톱 솔루션

Leaning Wonderful Writer는 학술 논문 작성을 위한 효율적이고 편리한 솔루션을 제공하는 AI 논문 작성 도구입니다. 이 도구는 학부 및 석사 학위와 같은 다양한 수준의 학문적 요구에 적용 가능하며 과학 기술, 예술 및 사회 과학과 같은 다학제 분야를 다루는 논문의 개요, 초록 및 초안을 한 번의 클릭으로 생성할 수 있도록 지원합니다.
4개월 전
019.1K
Why My Wife Yelling At Me:模拟婚姻沟通的互动工具

아내가 나에게 소리를 지르는 이유: 부부 의사소통 모델링을 위한 대화형 도구

일반 소개 "아내가 나에게 소리치는 이유"는 인공지능을 통해 파트너의 감정 반응과 의사소통 패턴을 이해할 수 있도록 설계된 독특한 결혼 관계 시뮬레이션 웹사이트입니다. 사용자는 다양한 시나리오를 입력하고 가상 파트너의 반응을 경험하며 실제와 같은 시뮬레이션을 할 수 있습니다.
6개월 전
019.1K
DeckSpeed - AI PPT制作工具,自然语言生成演示文稿

DeckSpeed - AI PPT 메이커, 자연어 생성 프레젠테이션

DeckSpeed는 대화형 상호작용을 기반으로 하는 AI 프레젠테이션 제작 도구로, 사용자가 자연어를 기반으로 자신의 요구를 표현하여 기존 템플릿에 의존하지 않고도 개인화된 슬라이드를 빠르게 생성할 수 있습니다. 이 도구는 실시간 피드백 조정을 지원하며, 사용자는 언제든지 슬라이드의 색상, 스타일, 내용을 수정하여 프레젠테이션을 완성할 수 있습니다.
4개월 전
019K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

회사 리서치: 회사 리서치 도구로, 회사의 웹 주소를 입력하면 자세한 리서치 정보를 확인할 수 있습니다.

일반 설명 회사 리서처(Company Researcher)는 사용자가 모든 회사에 대한 빠르고 포괄적인 개요를 얻을 수 있도록 설계된 무료 오픈 소스 도구입니다. 회사의 URL을 입력하기만 하면 이 도구가 웹에서 포괄적인 정보를 수집하여 조직, 제품 등에 대한 정보를 표시합니다.
7개월 전
019K
琴乐大模型 - 腾讯推出的AI音乐创作模型

피아노 음악 빅 모델 - 텐센트에서 출시한 AI 음악 작곡 모델

진뮤직 그랜드 모델은 텐센트 AI 랩과 텐센트 TME 티엔친 랩이 공동으로 출시한 고급 AI 음악 창작 그랜드 모델입니다. 이 모델은 사용자가 입력한 키워드, 설명 문구 또는 영어와 중국어로 된 오디오 클립을 기반으로 고품질 스테레오 오디오 또는 멀티 트랙 악보를 지능적으로 생성합니다.
5개월 전
019K
HuMo - 清华大学联合字节开源的多模态视频生成框架

HuMo - 칭화대학교 유나이티드 바이트 오픈 소스 멀티모달 비디오 생성 프레임워크

HuMo는 칭화대학교와 바이트댄스 인텔리전트 크리에이션 랩이 공동으로 오픈소스화한 멀티모달 비디오 생성 프레임워크로, 인간 중심의 비디오 생성에 중점을 두고 있습니다. 텍스트, 이미지 및 오디오와 같은 멀티모달 입력에서 고품질의 세밀하고 제어 가능한 휴먼 비디오를 생성할 수 있으며, HuMo는 강력한 텍스트 큐 팔로잉 기능을 지원합니다.
1개월 전
018.9K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Apple의 시각 언어 모델링

FastVLM(Fast Vision Language Model)은 Apple에서 도입한 효율적인 시각 언어 모델입니다. FastViTHD 하이브리드 비주얼 코더를 핵심으로 컨볼루션 및 트랜스포머 아키텍처를 통합하여 시각적...
2개월 전
018.8K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - 8가지 사고 경로를 동시에 열어주는 Ask o4에서 도입한 병렬 사고 모델

Ask White o4는 8개의 사고 경로를 동시에 열어 여러 관점에서 문제를 분석하고 최적의 해결책을 자동으로 필터링하는 혁신적인 병렬 사고 모델입니다. 이 모델은 고급 Long-CoT 강화 학습 및 프로세스 보상 학습 기법을 통합하고 강력한 심층 추론 기능을 갖추고 있으며 복잡한 작업에서 뛰어난 성능을 발휘합니다.
2개월 전
018.7K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - Google의 AI 추론 모델

Gemini 2.5 Deep Think는 복잡한 작업을 해결하기 위해 설계된 Google의 AI 추론 모델입니다. 2025년 국제 수학 올림피아드(IMO)에서 금메달을 획득한 모델의 변형으로, 병렬을 통해 복잡한 작업을 해결하도록 설계되었습니다 ...
3 개월 전
018.6K
CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 중국 최초의 부동산 AI 에이전트, CRIC 출시

CRIC 뎁스 인텔리전스는 CRIC가 독자적으로 개발한 중국 부동산 최초의 AI 지능체로, 부동산 업계에서 20년간 축적한 CRIC의 경험과 데이터, 멀티모달 대형 모델 기술을 바탕으로 데이터 통합, 지능형 분석, 콘텐츠 생성에 이르는 전체 사슬을 열어줍니다.
5개월 전
018.5K
万兴天幕 – 万兴科技推出AIGC视频创作平台

완싱 캐노피 - 완싱 테크놀로지, AIGC 비디오 제작 플랫폼 출시

완싱 캐노피는 완싱 테크놀로지가 출시한 AIGC 동영상 제작 플랫폼으로, 동영상, 사진, 오디오 생성의 3대 창작 분야를 다루며 미디어 및 문화 산업 종사자, 영화 및 텔레비전/포스트 프로덕션 종사자, 예술 및 디자인 종사자, 광고 및 마케팅 실무자 등을 위해 특별히 설계되어 원스톱 전문 창작 솔루션을 제공합니다.
4개월 전
018.4K
美间:在线软装(家装)设计工具,快速生成设计方案,软装辅助AI工具箱

메이만: 온라인 소프트 퍼니싱(홈 퍼니싱) 디자인 도구, 신속한 디자인 솔루션 생성, 소프트 퍼니싱 보조 AI 툴킷

종합 소개 Meiman은 주택 디자인 및 마케팅 협상에 중점을 둔 온라인 플랫폼입니다. 이 사이트는 디자이너와 주택 소유주가 고품질 디자인 제안서를 신속하게 생성할 수 있도록 풍부한 디자인 자료, 소프트 퍼니싱 및 제안서 PPT 템플릿, 포스터 템플릿 등을 제공합니다. 메이만의 온라인 소프트 퍼니싱 디자인 도구는 단 10초 만에 사용할 수 있습니다 ...
4개월 전
018.3K
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - 수조 개의 파라미터를 위한 Ant Group의 오픈 소스 범용 언어 모델

Ling-1T는 Ant Group에서 오픈소스화한 1조 개 매개변수 범용 언어 모델로, 베링의 대형 모델인 Ling 2.0 시리즈의 플래그십 제품에 속합니다. 이 모델은 고효율 MoE 아키텍처를 채택하고 128K 컨텍스트 윈도우를 지원하며 코드 생성, 수학적 추론, 논리 테스트 등 7가지 벤치마크에서 GPT를 능가합니다.
2 주 전
018.1K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - 통이 첸첸의 플래그십 빅 언어 모델

Qwen3-Max-Preview는 통이췐웬에서 출시한 최신 플래그십 대형 언어 모델입니다. Qwen3 제품군에서 가장 많은 파라미터를 가진 모델로, 파라미터 크기가 1조 개가 넘습니다. 이 모델은 추론, 명령어 추종, 다국어 지원 및 롱테일 지식 범위에서 상당한 개선을 이루었습니다...
1개월 전
017.9K
有道在线图片翻译:免费在线翻译图片|有道智云AI开放平台

요우다오 온라인 이미지 번역: 무료 온라인 이미지 번역|요우다오 지윤 AI 오픈 플랫폼

종합 소개 온라인 사진 번역 서비스는 OCR 기술과 텍스트 번역 기술을 통해 사진 속 텍스트를 인식하고 번역합니다. 이 서비스는 유다오 지윤에서 제공하며 여러 이미지 형식과 여러 언어를 지원합니다. 사용자는 웹사이트에서 직접 사용하거나 API 및 SDK를 통해 애플리케이션에 통합할 수 있습니다...
1 년 전
017.6K
HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

헌위안이미지 3.0 - 텐센트 오픈소스 무료 멀티모달 이미지 생성 모델

훈위안이미지 3.0(훈위안 이미지 3.0)은 텐센트에서 공개하고 오픈소스로 제공한 네이티브 멀티모달 이미지 생성 모델입니다. 모델 매개변수 크기는 80B로, 현재 오픈소스 이미지 생성 모델 중 가장 많은 매개변수를 가진 최고의 평가 결과입니다. 하이브리드 이미지 3.0은 실시간 이미지 생성을 지원하며, 사용자는 측면 ...
3주 전
017.5K
ZeroSearch - 阿里通义推出的开源大模型搜索引擎框架

제로서치 - 알리 통이, 오픈 소스 빅 모델 검색 엔진 프레임워크 출시

제로서치는 알리바바 통이랩의 오픈소스 혁신적 대형 모델 검색 엔진 프레임워크입니다. 이 프레임 워크는 검색 엔진의 시뮬레이션을 기반으로 실제 검색 엔진과 상호 작용할 필요가 없으며 자체 사전 학습 지식의 대규모 모델을 사용하여 관련 문서 또는 노이즈 문서를 생성하여 교육 비용을 크게 줄입니다 (80% 이상 감소 ...
4개월 전
017.4K