AI 공유 서클

왕을 위해 전당포와 나눔을 실천하는 날!
DeepSeek 发布了 v3 模型的首个开源版本,现阶段拥有(国产)最强代码能力

DeepSeek, 현 단계에서 가장 강력한 코드(중국에서)를 갖춘 첫 번째 오픈 소스 버전의 v3 모델 출시

DeepSeek-V3는 총 671억 개의 파라미터와 각 토큰에 대해 37억 개의 파라미터가 활성화된 강력한 전문가 혼합(MoE) 언어 모델입니다. 이 모델은 혁신적인 멀티 헤드 잠재적 주의(Mu ...
1 년 전
079.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.
1 년 전
065.3K
达摩院“寻光”视频创作平台全面评测

달마 인스티튜트의 '서치라이트' 동영상 제작 플랫폼에 대한 전체 리뷰

오늘 새벽에 '서치라이트'의 내부 테스트 신청이 승인되었다는 연락을 받았기 때문에 잠자리에 들기 전에 간단한 리뷰를 올리려고 합니다. 이 플랫폼은 달마 연구소의 "시각 기술 역량 응용 플랫폼"으로 자리 매김하고 있으며 현재는 (출시에 비해) 응용 프로그램이 적어 점차 더 많은 시각 응용 프로그램을 열 수 있기를 기대합니다. 빛에 대한 검색은 두 가지 주소로 나뉩니다 : https ...
1 년 전
043.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: 사람의 자세를 정밀하게 제어하여 춤추는 여성을 만드는 동영상 생성

개요 DisPose는 제어된 캐릭터 이미지 애니메이션 생성에 초점을 맞춘 혁신적인 오픈 소스 인공지능 프로젝트입니다. 연구팀이 개발하고 깃허브에서 오픈소스화한 이 프로젝트는 고급 딥러닝 기술을 사용하여 골격 포즈 정보를 분해하여 정밀한 캐릭터 애니메이션 제어를 실현합니다....
1 년 전
054.6K
스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

스몰라젠트: AI 지능의 신속한 개발과 지능의 경량화를 위한 오픈 소스 프로젝트

개요 스몰에이전트는 HuggingFace에서 개발한 경량 지능형 에이전트 라이브러리로, AI 에이전트 시스템의 개발 프로세스를 간소화하는 데 중점을 두고 있습니다. 이 프로젝트는 핵심 코드가 약 1000줄에 불과할 정도로 설계 철학이 단순하면서도 강력한 기능 통합 기능을 제공하는 것으로 유명합니다. 그것은 가장 ...
1 년 전
087.6K
通过视觉提取文档为Markdown格式文档的组合提示词指令

문서를 마크다운 형식의 문서로 시각적으로 추출하기 위한 결합된 큐워드 명령어

이 명령은 Vision Parse 프로젝트에서 제공되며 두 단계로 마크다운 문서를 추출합니다. 이미지 분석 프롬프트(img_analysis.prompt): 이 이미지를 분석하고 다시 ...
1 년 전
046.5K
Napkin AI 中文入门指南

냅킨 AI 중국어 시작 가이드

냅킨 AI로 시각적 콘텐츠 생성을 시작하려면 어떻게 해야 하나요? (계정 생성, 시각적 생성, PDF 또는 이미지 파일로 내보내기...) 텍스트를 아름다운 비주얼로 쉽게 변환할 수 있는 도구인 Napkin AI에 오신 것을 환영합니다. 이 가이드는 ...
1 년 전
056.1K
비전 구문 분석: 시각 언어 모델을 사용하여 PDF 문서를 마크다운 형식으로 지능적으로 변환하기

비전 구문 분석: 시각 언어 모델을 사용하여 PDF 문서를 마크다운 형식으로 지능적으로 변환하기

포괄적 인 소개 Vision Parse는 혁신적인 문서 처리 도구로, 최첨단 시각 언어 모델 (비전 언어 모델) 기술, 고품질 마크 다운 형식으로 지능적으로 변환 된 PDF 문서 기능을 영리하게 결합합니다....
1 년 전
056.3K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 이미지 해상도 품질 향상을 위한 오픈 소스 이미지 초고해상도 프로젝트

일반 소개 InvSR은 저해상도 이미지를 고품질 고해상도 이미지로 변환할 수 있는 확산 반전 기법을 기반으로 하는 혁신적인 오픈 소스 이미지 초고해상도 프로젝트입니다. 이 프로젝트는 사전 훈련된 대규모 확산 모델에 포함된 풍부한 이미지 사전 지식을 활용하며, 유연한 샘플링 메커니즘을 통해 다음을 지원합니다.
1 년 전
071.1K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

무한대: 무제한 고해상도 이미지 생성을 위한 고해상도 이미지 생성의 비트 단위 자동 회귀 모델링

일반 소개 Infinity는 FoundationVision 팀에서 개발한 획기적인 고해상도 이미지 생성 프레임워크입니다. 이 프로젝트는 혁신적인 비트 레벨의 시각적 자동 회귀 모델링 접근 방식을 통해 기존 이미지 생성 모델의 한계를 극복합니다.Infinity의 핵심 기능은 다음과 같습니다.
1 년 전
064.4K