최신 AI 리소스

共 3143 篇文章

순서대로 정렬

톡킹헤즈: 사진을 몇 초 만에 대화로 만들어주는 무료 엔터테인먼트 도구

종합 소개 로즈버드 AI가 만든 톡킹헤즈는 AI 기술을 사용하여 사진 속 인물을 몇 초 만에 움직이고 말하게 만드는 앱으로, AI 마법으로 인물 사진에 즉시 생명을 불어넣고 작품에 생기를 불어넣을 수 있으며, iOS에서도 사용할 수 있습니다.

최신 AI 리소스 # AI 디지털 맨

2 년 전

097.9K

ChatPDF: 모든 PDF 문서와의 대화 및 요약

일반 소개 ChatPDF는 대화를 통해 PDF 파일과 상호 작용하도록 설계된 AI 기반 도구입니다. 사용자는 어떤 PDF 파일이라도 업로드하고 ChatGPT와 유사한 인터페이스를 통해 파일 내용과 대화를 나누며 필요한 정보를 빠르게 얻을 수 있습니다. 학술 논문이든...

최신 AI 리소스 # AI 텍스트 및 오디오/비디오 요약 도구

2 년 전

097.8K

ConsisID: 캐릭터가 일관된 비디오를 생성하는 인물 참조 맵, 신속한 다중 터미널 통합

개요 ConsisID는 북경대학교의 Yuan Rong 그룹이 개발한 오픈 소스 프로젝트로, 주파수 분해 기술을 통해 정체성 일관성 있는 텍스트-비디오 생성(IPT2V)을 달성하는 것을 목표로 합니다. 이 프로젝트의 핵심은 DiT(Diffusion Transfor ...

2 년 전

097.8K

Strawberry: 자동화된 작업을 위한 AI 스마트 브라우저

일반 설명 Strawberry는 사용자가 일상적인 작업을 자동화하고 효율성을 향상시킬 수 있도록 설계된 AI 비서가 내장된 스마트 브라우저입니다. AI 기술을 통합하여 웹 콘텐츠를 실시간으로 이해하고 빠른 검색, 콘텐츠 작성과 같은 복잡한 작업을 수행한다는 점에서 기존 브라우저와 차별화됩니다.

최신 AI 리소스 # 데스크톱 자동화 인텔리전스

1 년 전

097.8K

YTSage：YouTube下载器，免费下载YouTube视频，提取音频，获取字幕

YTSage: 유튜브 다운로더, 유튜브 비디오 무료 다운로드, 오디오 추출, 자막 가져오기

일반 소개 YTSage는 깔끔한 PyQt6 인터페이스를 갖춘 최신 YouTube 다운로드 도구입니다. 사용자는 YTSage를 사용하여 모든 화질의 동영상을 다운로드하고, 오디오를 추출하고, 자막(자동 생성 자막 포함)을 가져오고, 동영상의 메타 정보를 볼 수 있습니다.

2 년 전

097.8K

GeoSpy AI: 이미지의 지리적 위치를 위한 지능형 예측 플랫폼

일반 소개 GeoSpy AI는 인공 지능 기술을 사용하여 사진의 지리적 위치를 분석하는 온라인 도구입니다. 사용자가 사진을 업로드하기만 하면 시스템이 사진의 다양한 세부 정보와 단서를 분석하여 가능한 위치를 추론합니다.GeoSpy AI는 법 집행 기관, 정부 부처에 적합합니다 ...

최신 AI 리소스 # AI 이미지 생성 보조 장치

2 년 전

097.8K

보이스패널: AI가 고객 피드백을 자동으로 수집하고 분석하는 리서치 도구

일반 소개 보이스패널은 기업이 사용자 피드백을 빠르고 쉽게 수집하고 분석할 수 있도록 설계된 AI 기반 고객 조사 플랫폼입니다. 기업은 간단한 조작을 통해 AI 기술을 사용하여 음성 또는 비디오 형식으로 대상 사용자와 심층 인터뷰를 진행하고 실시간으로 ...

최신 AI 리소스 # AI 마케팅

1 년 전

097.8K

LlamaEdge: 로컬에서 LLM을 실행하고 미세 조정하는 가장 빠른 방법!

일반 소개 LlamaEdge는 로컬 또는 엣지 장치에서 대규모 언어 모델(LLM)을 실행하고 미세 조정하는 프로세스를 간소화하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 Llama2 모델 제품군을 지원하며 사용자가 쉽게 생성하고 실행할 수 있는 OpenAI 호환 API 서비스를 제공합니다.

2 년 전

097.8K

Nexa: 로컬에서 실행되는 소규모 멀티모달 AI 솔루션

포괄적인 소개 Nexa AI는 로컬에서 실행되는 멀티모달 AI 솔루션에 중점을 둔 플랫폼입니다. 로컬 디바이스에서 사용할 수 있는 자연어 처리(NLP), 컴퓨터 비전, 음성 인식 및 생성(ASR 및 TTS) 등 다양한 AI 모델을 제공합니다...

최신 AI 리소스 # 로컬 배포 오픈 소스 대규모 모델 도구

2 년 전

097.8K

Hume AI：赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: 감정 인식으로 AI 역량 강화하기 | 소리와 표정에서 감정 상태 인식하기 | 감정 상태로 음성 생성하기

일반 소개 흄 AI는 사람의 감정을 이해하고 반응하는 멀티모달 AI 기술을 개발하는 감성 지능에 중점을 둔 AI 회사입니다. 주력 제품인 공감 음성 인터페이스(EVI)는 사용자의 감정을 인식하고 이에 반응할 수 있습니다.

최신 AI 리소스 # AI 오픈 서비스 # AI 텍스트 음성 변환

2 년 전

097.7K

Tabnine: 코드 사용 사례 플러그인(유료)을 생성하기 위해 IDE에 통합된 AI 코드 도우미

일반 소개 Tabnine은 개발자가 고품질 코드를 더 빠르게 작성할 수 있도록 설계된 AI 기반 코드 완성 도구입니다. 탭나인은 생성형 AI 모델을 사용하여 문맥과 구문을 기반으로 다음 코드 줄을 예측하고 제안하며, 다양한 프로그래밍 언어와 집합을 지원합니다.

최신 AI 리소스 # AI 프로그래밍

2 년 전

097.7K

스왑페이스: 효율적이고 간단한 실시간 AI 얼굴 교체 소프트웨어

일반 설명 스왑페이스는 사용자가 카메라를 사용하여 실시간으로 얼굴을 변경할 수 있는 애플리케이션입니다. 주요 기능은 단순성, 개인 정보 보호 및 비용 효율성입니다. 이 앱은 고급 AI 모델을 사용하여 시간에 민감하고 계산 효율이 높은 매우 사실적이고 자연스러운 얼굴 표현을 만듭니다. 사용자는 그저...

최신 AI 리소스 # AI 비디오 페이스 스왑

2 년 전

097.7K

NVIDIA Garak: LLM 취약점을 탐지하고 안전한 생성 AI를 위한 오픈 소스 도구

포괄적인 소개 NVIDIA Garak은 LLM(대규모 언어 모델)의 취약점을 탐지하도록 특별히 설계된 오픈 소스 툴입니다. 정적, 동적 및 적응형 프로빙을 통해 착시, 데이터 유출, 힌트 삽입, 오류 메시지 생성, 유해 콘텐츠 생성 등과 같은 여러 약점이 있는지 모델을 검사합니다....

2 년 전

097.7K

크리스퍼위스퍼: 정확한 축어체 음성 전사 도구

일반 설명 크리스퍼위스퍼는 빠르고 정확한 단어 단위 음성 녹취에 중점을 둔 OpenAI 위스퍼 기반의 고급 음성 인식 도구입니다. 음성 채우기 및 일시 정지 시에도 정확한 단어 수준의 타임스탬프를 제공합니다.

2 년 전

097.5K

Vapi: 개발자가 지연 시간이 짧은 음성 어시스턴트를 빠르게 구축할 수 있도록 지원

포괄적인 소개 Vapi는 개발자를 위한 음성 AI 플랫폼입니다. 사용자가 몇 분 안에 음성 AI 비서를 구축, 테스트 및 배포할 수 있어 시간이 많이 걸리고 확장하기 어려운 기존 음성 애플리케이션 개발의 문제를 해결할 수 있으며, 실시간 대화를 지원하는 완벽한 도구와 인프라를 제공합니다.

최신 AI 리소스 # AI 오픈 서비스 # AI 텍스트 음성 변환

1 년 전

097.5K

ChatTTS: 실제 사람이 말하는 목소리를 모방하는 음성 생성 모델(ChatTTS 원클릭 가속 패키지)

일반 소개 ChatTTS는 대화 시나리오를 위해 설계된 생성형 음성 모델입니다. 자연스럽고 표현력이 풍부한 음성을 생성하고, 여러 언어와 여러 화자를 지원하며, 대화형 대화에 적합합니다. 이 모델은 웃음, 일시 정지, 감탄사 등 세분화된 리듬을 예측하고 제어하여 이를 수행합니다.

1 년 전

097.5K

FlowDown: iOS/macOS를 위한 원활한 AI 클라이언트 경험

일반 소개 FlowDown-App은 사용자에게 빠르고 원활한 지능형 대화 경험을 제공하기 위해 Swift와 UIKit을 사용하는 개발자 팀이 개발한 가볍고 효율적인 AI 대화 클라이언트입니다. 이 앱은 표준 버전(FlowDown...

1 년 전

097.4K

Melty: AI 기반 코드 편집기를 경험하고 모든 대화를 Git 커밋으로 만들어 보세요!

일반 소개 Melty는 채팅 대화와 Git 버전 제어를 결합한 혁신적인 AI 코드 편집기입니다. Replicate의 Charlie와 Jackson이 개발한 이 도구는 기존 AI 코딩 도구의 문제점을 해결하는 것을 목표로 합니다. 가장 큰 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

097.4K

CopyWeb: 프로토타입/스크린샷을 즉시 사용 가능한 웹 코드로 변환하기

일반 소개 CopyWeb은 개발자와 디자이너가 디자인을 제작 가능한 코드로 빠르게 변환하는 데 중점을 둔 AI 기반 웹 디자인 변환 도구입니다. 웹사이트 스크린샷, URL 또는 피그마에서 직접 깔끔하고 반응이 빠른 HTTP 생성을 지원합니다.

최신 AI 리소스 # AI 페이지 디자인

1 년 전

097.4K

트래커: 동영상 개체 추적을 위한 오픈 소스 도구 라이브러리

일반 소개 트래커는 동영상에서 다중 객체 추적에 초점을 맞춘 오픈 소스 Python 도구 라이브러리입니다. 이 라이브러리는 SORT 및 DeepSORT와 같은 여러 주요 추적 알고리즘을 통합하고 사용자가 다양한 객체 감지 모델(예: YOLO...

1 년 전

097.3K

LanPaint: 모든 모델을 위한 ComfyUI 이미지 복원 워크플로

일반 소개 LanPaint는 안정적 확산 모델을 위해 설계된 고품질 이미지 복원 도구입니다. 이 도구의 가장 큰 특징은 모든 안정적 확산 모델에서 정확한 이미지 복원을 달성하기 위해 추가 교육이 필요하지 않다는 것입니다...

최신 AI 리소스 # AI 이미지 확대 및 복원 # ComfyUI

1 년 전

097.3K

Fast GraphRAG: 정확도가 높고 비용이 저렴한 그래픽 검색 향상 생성 도구

종합 소개 Fast GraphRAG는 지식 그래프와 페이지랭크 알고리즘을 통해 효율적이고 정확한 검색 증강 생성(RAG)을 가능하게 하기 위해 Circlemind AI에서 개발한 오픈 소스 도구입니다. 이 도구는 사용자의 용도에 맞게 지능적으로 적응합니다...

2 년 전

097.3K

BGM Cat: AI 생성 배경음악(BGM)/크레딧 음악, 원클릭 팟캐스트 사운드트랙 생성

일반 소개 BGM Cat은 DeepMusic(베이징 링동인 기술 유한회사)에서 개발한 AI 맞춤형 배경음악 제작 플랫폼입니다. 사용자는 간단한 설명만으로 동영상, 팟캐스트 및 기타 장면에 적합한 배경 음악과 타이틀 음악을 생성할 수 있습니다. 이 플랫폼은 고급 AI 음악 생성 기술을 사용합니다 ...

최신 AI 리소스 # AI 음악

2 년 전

097.3K

Amurex: 오픈 소스 AI 회의 녹음 도우미, 회의 내용을 자동으로 녹음하여 요약을 생성합니다.

일반 소개 Amurex는 지능형 기능을 통해 회의 효율성을 개선하도록 설계된 The Personal AI Company에서 개발한 오픈 소스 AI 회의 도우미로, 실시간 조언 제공, 지능형 요약 생성, 회의 내용 기록, 자동 팔로우 전송이 가능합니다.

2 년 전

097.3K

VDraw: 전문 인포그래픽 및 순서도 무료 생성

일반 소개 VDraw는 텍스트, 문서 또는 동영상을 전문적인 인포그래픽과 플로차트로 무료로 변환하는 데 중점을 둔 온라인 AI 디자인 플랫폼입니다. 사용자는 디자인 경험이 없어도 콘텐츠를 입력하기만 하면 AI가 멋진 시각화를 빠르게 생성합니다. 이 플랫폼은 개인, 마케터, 교사에게 적합합니다.

최신 AI 리소스 인포그래픽이 포함된 # AI 화이트보드

1 년 전

097.2K

GraphRAG Visualizer：可视化和探索Microsoft GraphRAG工件的工具

GraphRAG 비주얼라이저: Microsoft GraphRAG 아티팩트를 시각화하고 탐색하기 위한 도구

일반 소개 GraphRAG Visualizer는 사용자가 Microsoft GraphRAG의 아티팩트를 시각화하고 탐색할 수 있도록 설계된 웹 기반 도구입니다. 파를 업로드하여 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # 지식 그래프

2 년 전

097.2K

완싱 야옹 그림자(Filmora): 올인원 동영상 편집 도구

종합 소개 완싱 야옹 그림자는 윈도우와 맥용 완싱 테크놀로지의 올인원 동영상 편집 도구입니다. 이 소프트웨어는 AI 생성 음악, 지능형 사람 목소리 분리, 지능형 텍스트 빠른 자르기 등 다양한 AI 기능을 통합하여 사용자가 전문적인 동영상을 쉽게 만들 수 있도록 도와줍니다. 파티든...

최신 AI 리소스 # AI 오디오/비디오 편집기

2 년 전

097.2K

파인쉐어 싱기파이: AI 커버곡, 스타 복제 보이스 커버를 빠르게 제작하세요.

일반 설명 Fineshare Singify는 온라인 AI 노래 커버 생성기입니다. 기술 제한 없이 사이트에서 좋아하는 가수나 캐릭터의 AI 커버를 쉽게 만들 수 있습니다. 노래 커버를 생성하는 세 가지 쉬운 방법을 제공합니다: 노래 검색, 오디오 업로드 ...

최신 AI 리소스 # AI 음악

2 년 전

097.1K

Galaxy.ai：集成1700+AI工具库的多功能平台，用于了解市场中各类生成式AI工具（付费）

Galaxy.ai: 시중의 모든 유형의 제너레이티브 AI 도구를 이해하기 위한 1700개 이상의 AI 도구 라이브러리를 통합하는 다기능 플랫폼(유료)

종합 소개 Galaxy.ai는 사용자에게 종합적인 AI 솔루션을 제공하기 위해 설계된 다양한 AI 도구를 통합한 플랫폼입니다. 텍스트 생성, 이미지 처리, 동영상 제작, 음성 합성 등 Galaxy.ai는 다양한 사용자 요구를 충족할 수 있습니다. 이 플랫폼은 다음을 제공합니다.

최신 AI 리소스 # AI 오픈 서비스

2 년 전

097.1K

Sana: 고해상도 이미지의 빠른 생성, 0.6B 초소형 모델, 로우 프로파일 노트북 GPU 작동

일반 소개 Sana는 NVIDIA 연구소에서 개발한 효율적인 고해상도 이미지 생성 프레임워크로, 최대 4096 × 4096 해상도의 이미지를 단 몇 초 만에 생성할 수 있으며, 선형 확산 트랜스포머와 딥 압축 셀프 인코더 기술을 사용하여 이미지를 크게...

2 년 전

097K

Open Canvas：代码编辑协作画布，开源版OpenAI Canvas/Claude Artifacts

오픈 캔버스: 코드 편집 협업 캔버스, OpenAI 캔버스/클라우드 아티팩트 오픈 소스 버전

일반 소개 LangChain은 내장된 이중 에이전트 메모리 기능과 전체 실행 세부 사항을 관찰할 수 있는 통합 스미스를 통해 문서 편집 및 협업 경험을 향상하도록 설계된 오픈 소스 웹 애플리케이션인 오픈 캔버스를 선보입니다. 이 플랫폼은 오픈에이...

1 년 전

097K

ZeroGPT: AI가 생성한 콘텐츠를 탐지하는 무료 도구

일반 소개 ZeroGPT는 ChatGPT, GPT-4 또는 기타 언어 모델과 같은 AI에 의해 생성된 텍스트인지 여부를 감지하는 무료 온라인 도구입니다. 언어 패턴, 문장 구조 및 기타 특징에 대한 텍스트를 분석하여 콘텐츠가 사람에 의해 작성되었는지 아니면 기계에 의해 작성되었는지를 판단합니다....

최신 AI 리소스 # AI 쓰기 # AI 교육 도구

1 년 전

097K

LogoCreator: AI 인텔리전스를 사용하여 전문적인 브랜드 로고를 생성하는 오픈 소스 로고 생성기입니다.

일반 소개 로고크리에이터는 기업과 개인을 위한 빠르고 전문적인 로고 디자인 서비스를 제공하는 데 중점을 둔 Together AI 및 Flux 모델 기반의 오픈 소스 로고 생성기입니다. 이 프로젝트는 개발자 Nutlope가 Git에서 개발 및 오픈 소스화했습니다.

2 년 전

097K

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

울트라박스: 실시간 엔드투엔드 음성 대화를 위한 오디오 멀티모달 매크로 모델, GPT-4o 음성 상호작용의 오픈 소스 구현

종합 소개 Ultravox는 실시간 음성 처리를 위해 설계된 혁신적인 멀티모달 대규모 언어 모델(LLM)입니다. 기존의 음성 인식 시스템과 달리 Ultravox는 별도의 ASR(오디오 음성 인식) 단계가 필요하지 않으며, 오디오를 고차원 공간으로 직접 변환할 수 있습니다.

2 년 전

097K

SUDOAI: 사용하기 쉬운 무료 텍스트 또는 이미지 3D 모델링 도구

일반 소개 SUDOAI는 힐봇이 제공하는 혁신적인 AI 플랫폼으로, AI 기술을 통해 고품질의 3D 모델을 생성하는 데 중점을 두고 있습니다. 사용자는 간단한 텍스트 설명이나 이미지 업로드를 통해 3D 모델을 빠르게 생성할 수 있으며 주로 게임 개발, 메타 유니버스 및 ...

최신 AI 리소스 # AI 텍스트 및 이미지를 3D로 변환하기

2 년 전

097K

레코드 카페: 원스톱 오디오/비디오 처리 플랫폼|비디오 생성|AI 자막|오디오 추출|음성 텍스트 변환

개요 레코드 카페는 원스톱 오디오/비디오 처리 플랫폼으로, AI 영상 대화, AI 자막, AI 음성 텍스트 변환 서비스를 제공합니다. 화면 녹화, 동영상 편집, GIF/오디오 변환 등의 기능을 제공하며, 클라우드 저장 및 공유를 지원합니다. 인터페이스는 직관적이고 사용하기 쉬우며 다중 화면 녹화 및 다국어 스마트 ...

2 년 전

096.9K

腾讯混元3D（Hunyuan3D）：生成高分辨率3D资产，多种3D素材生成工作流

텐센트 하이브리드 3D(Hunyuan3D): 고해상도 3D 에셋 생성, 다양한 3D 머티리얼 생성 워크플로

종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.

2 년 전

096.9K

코그에이전트: 그래픽 인터페이스 자동화를 위한 스마트 스펙트럼의 오픈 소스 지능형 시각 언어 모델

종합 소개 CogAgent는 칭화대학교 데이터 마이닝 연구 그룹(THUDM)에서 개발한 오픈 소스 시각 언어 모델로, 여러 플랫폼에서 그래픽 사용자 인터페이스(GUI)의 작동을 자동화하는 것을 목표로 합니다. 이 모델은 CogVLM(GLM-4V-9B)을 기반으로 하며 중국어와 영어 이중 언어를 지원합니다.

2 년 전

096.9K

Doclingo 문서 번역: PDF 문서를 위한 AI 번역 서비스, 문서 레이아웃 유지, 번역 후 편집 서비스

종합 소개 Doclingo는 고급 인공 지능 기술을 사용하여 사용자에게 효율적이고 정확한 번역 서비스를 제공하는 전문 문서 번역 플랫폼입니다. 이 플랫폼은 PDF, DOCX, PPT, EXCEL, JPG, JPEG, PNG... 등 다양한 파일 형식을 지원합니다.

최신 AI 리소스 # AI 번역

2 년 전

096.9K

ImageFX：Google实验室推出的图像生成工具，提供独特的图像提示词聚合选项

ImageFX: 고유한 이미지 단서 단어 집계 옵션을 제공하는 Google 연구소의 이미지 생성 도구입니다.

일반 소개 ImageFX는 구글 연구소의 강력한 이미지 생성 도구입니다. 사용자는 간단한 텍스트 입력만으로 아이디어를 고품질 이미지로 변환할 수 있습니다. 이 도구는 고급 인공 지능 기술을 사용하여 다양한 스타일과 테마의 이미지 생성을 지원합니다.

최신 AI 리소스 # AI 온라인 이미지 생성

2 년 전

096.9K

하나의 허브: 여러 모델 및 통계 기능을 지원하는 OpenAI 인터페이스 관리 및 배포

일반 소개 원 허브는 원 API의 2차 개발을 기반으로 한 오픈AI 인터페이스 관리 및 배포 시스템입니다. 더 광범위한 모델 지원과 향상된 통계 기능을 제공하기 위해 MartialBE에서 개발했습니다.One Hub에는 다음과 같은 기능이 있습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

096.9K

매직 보이스 워크샵: 전문 보이스오버 및 짧은 동영상 내레이션 제작 플랫폼 | 실제 인물 보이스오버 | 목소리 복제 | 원클릭으로 영화 만들기

종합 소개 매직보이스 워크샵은 소프트웨어 더빙, 실제 더빙, 사운드 라이브러리, 복제 서비스 등에 대한 정보를 제공하는 원스톱 단편 동영상 및 AI 더빙 플랫폼입니다. 이 플랫폼에는 오디오 관련 서비스 및 콘텐츠 제작을 위한 오디오 편집, AI 카피 생성, 비디오 편집 및 협업 도구가 통합되어 있습니다. 사용자가 오디오 편집기를 체험해 보세요...

2 년 전

096.8K

Chance AI: AI 기술을 통한 이미지 인식 및 시각적 스토리텔링

일반 소개 Chance AI는 시각 지능 기술에 중점을 둔 혁신적인 회사로, 인공지능을 통해 독특한 이미지 인식과 시각적 스토리텔링 경험을 제공하는 데 전념하고 있습니다. 핵심 제품인 'Chance AI Lens'는 인공지능 기반의 시각적 검색 도구입니다...

최신 AI 리소스 # AI 검색 도구 # AI 생활 효율 도우미

1 년 전

096.8K

AI ContentCraft：生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: 단편 스토리, 대화 스크립트, 보이스오버, 그래픽을 생성하는 다목적 AI 콘텐츠 제작 툴입니다.

일반 설명 AI ContentCraft는 텍스트 생성, 음성 합성, 이미지 생성 등을 통합하는 다목적 콘텐츠 제작 도구입니다. 크리에이터가 스토리, 팟캐스트 스크립트, 함께 제공되는 오디오 및 비디오 콘텐츠를 빠르게 생성할 수 있도록 도와줍니다. 이 도구는 여러 언어 변환을 지원하며 일괄적으로 ...

최신 AI 리소스 # AI 쓰기 # AI 자바 오픈 소스 프로젝트

2 년 전

096.7K

AiPy: 데이터 분석을 위한 Python 코드 실행 작업 자동화

일반 소개 AiPy는 Knownsec 팀에서 개발한 오픈 소스 Python 명령줄 도구입니다. 대규모 언어 모델(LLM)과 파이썬 런타임 환경을 결합하여 사용자가 파이썬을 자동으로 생성하고 실행할 수 있도록 합니다.

1 년 전

096.6K

AIVLOG: 동영상 하이라이트를 자동으로 편집하고 전문적인 브이로그를 손쉽게 제작하세요.

종합 소개 AIVLOG는 브이로그 제작자를 위해 설계된 AI 동영상 편집 도구입니다. 동영상 콘텐츠를 자동으로 분석하고 하이라이트를 지능적으로 편집하여 사용자의 편집 시간을 95% 절약할 수 있습니다. 일상 생활, 여행 기록, 대화 등 어떤 영상이든 AIVLOG는 쉽게...

최신 AI 리소스 # AI 오디오/비디오 편집기

2 년 전

096.6K

HIX.AI: 일상적인 글쓰기, 마케팅 카피라이팅부터 학술 논문까지 만능 AI 글쓰기 도우미

일반 소개 HIX.AI는 120개 이상의 AI 도구를 제공하여 사용자의 글쓰기, 커뮤니케이션 및 생산성을 향상시키도록 설계된 강력한 올인원 AI 글쓰기 도우미입니다. 이 플랫폼은 GPT-3.5/4로 구동되며 여러 언어를 지원하여 사용자가 빠르게 생성할 수 있도록 도와줍니다.

최신 AI 리소스 # AI 쓰기

2 년 전

096.6K

Cohere: Command 시리즈 모델을 무료로 체험해 보세요!

포괄적인 소개 Cohere는 엔터프라이즈급 애플리케이션 시나리오를 위한 대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 기능을 제공하는 데 중점을 둔 선도적인 AI 플랫폼입니다. 실제 문제를 해결하고 개발자와 기업이 언어 AI로 놀라운 제품을 구축하여 다음과 같은 목표를 달성할 수 있도록 지원하는 것을 목표로 합니다.

최신 AI 리소스 # AI 빅 모델 네이티브 대화 도구

2 년 전

096.5K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: 전용 OCR 인식 AI 모델, PDF를 마크다운으로 변환(오픈 소스/API)

포괄적인 소개 Datalab은 OCR, 레이아웃 분석, PDF에서 마크다운으로의 변환 등에 중점을 둔 다양한 고급 AI 모델을 제공합니다. 이러한 모델은 고성능일 뿐만 아니라 사용하기 쉽고 오픈 소스입니다. 플랫폼의 마커 모델은 빠르고 정확하게 ...

2 년 전

096.4K

바이촨 오디오: 실시간 음성 상호작용을 지원하는 엔드투엔드 오디오 모델

포괄적인 소개 Baichuan-Audio는 Baichuan Intelligence(baichuan-inc)에서 개발한 오픈 소스 프로젝트로, 엔드투엔드 음성 상호작용 기술에 중점을 두고 GitHub에서 호스팅됩니다. 이 프로젝트는 음성을 지원하는 완벽한 오디오 처리 프레임워크를 제공합니다.

1 년 전

096.4K

glhf.chat：运行几乎(所有)开源大模型，免费使用GPU资源和API服务（测试期）

glhf.chat: 거의 모든 오픈 소스 빅 모델 실행, GPU 리소스 및 API 서비스 무료 액세스(베타 기간)

일반 소개 굿럭 해브 펀(glhf.chat)은 오픈 소스 빅 모델 채팅 서비스를 제공하는 웹사이트입니다. 이 플랫폼을 통해 사용자는 vLLM과 커스텀 자동 스케일링 GPU 스케줄러를 사용하여 거의 모든 오픈 소스 빅 모델을 실행할 수 있습니다. 사용자는 간단히 ...

최신 AI 리소스 # AI 오픈 서비스 # 무료 대형 모델 API

2 년 전

096.4K

Awex - Ant Group 오픈 소스 고성능 가중치 교환 프레임워크

Awex는 강화 학습에서 대규모 파라미터 동기화를 위해 설계된 Ant Group의 오픈 소스 고성능 가중치 교환 프레임워크입니다. 몇 초 만에 테라바이트의 파라미터 교환을 완료하여 훈련 및 추론의 효율성을 크게 향상시킬 수 있으며, Awex는 매우 빠른 동기화 성능을 가지고 있으며, 수천 개의 카드 클러스터에서 6초 이내에 1조 개의 파라미터 모델을 완료할 수 있습니다....

최신 AI 리소스

8개월 전

096.4K

Austen: 책 속 인물 관계를 분석하고 그래프를 생성하는 AI 도구

일반 소개 Austen은 Angular 프레임워크와 Analogjs 초기화를 사용하는 오픈 소스 AI 도구로, Mermaidjs 기술과 결합하여 사용자가 책 속 인물 관계를 분석하는 데 도움이 되는 차트를 생성합니다. 사용자는 열기...를 입력할 수 있습니다.

1 년 전

096.2K

Zed: Rust에서 개발한 고성능 멀티플레이어 협업 코드 에디터

일반 소개 Zed는 Atom과 Tree-sitter의 제작자가 개발한 고성능 다중 사용자 협업 코드 편집기로, Rust 언어로 작성되어 빠르고 유연한 코딩 경험을 제공하도록 설계되었습니다. 주요 기능으로는 멀티플레이어 지원이 있습니다...

2 년 전

096.2K

알리마마 크리에이티브 센터: 타오바오 생태학 산하 지능형 마케팅 크리에이티브 지원 플랫폼

종합 소개 알리마마 크리에이티브 센터는 타오바오, 티몰 및 기타 전자상거래 플랫폼의 판매자에게 그래픽에서 동영상, 랜딩 페이지에 이르기까지 모든 범위의 크리에이티브 지원을 제공하도록 설계된 알리바바의 지능형 마케팅 크리에이티브 지원 플랫폼입니다. 크리에이티브 센터는 AI 지능형 카피라이팅 기능과 방대한 템플릿을 결합하여 디자인 효율성을 획기적으로 개선합니다....

최신 AI 리소스 # AI 마케팅

2 년 전

096.1K

Moshi: 음성 대화 기본 모델을 위한 여러 언어와 악센트를 지원하는 실시간 음성 대화 프레임워크

일반 소개 모시 챗은 프랑스의 비영리 AI 연구소인 큐타이의 엔드투엔드 실시간 AI 음성 비서입니다. 실시간으로 들을 뿐만 아니라 자연스러운 대화에 참여하고 보고, 듣고, 말하는 기능을 포함한 다중 모드 상호 작용을 지원합니다.모시 챗 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

096.1K

code2prompt: 코드 라이브러리를 이해하기 쉬운 빅 모델 프롬프트 파일로 변환하기

일반 소개 코드2프롬프트는 개발자 Mufeed VH가 GitHub에서 만들고 호스팅하는 오픈 소스 명령줄 도구로, 사용자가 전체 코드 베이스를 LLM(대규모 언어 모델)에 적합한 프롬프트로 빠르게 변환할 수 있도록 설계되었습니다(프롬프트 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

096.1K

FreeTTS: 무료 온라인 텍스트 음성 변환 도구|오디오 향상|오디오 클립

FreeTTS 일반 설명 FreeTTS는 사용자가 텍스트를 자연스러운 음성 파일로 변환할 수 있는 무료 온라인 텍스트 음성 변환 도구입니다. 여러 언어와 사운드 옵션을 지원하여 텍스트를 MP3, WAV, OGG 및 ACC 형식으로 변환할 수 있습니다....

2 년 전

096K

커서를 사용하여 Figma 디자인을 읽고 수정할 수 있는 MCP 서비스입니다.

일반 소개 커서 토크 투 피그마 MCP는 AI 프로그래밍 도구 커서와 디자인 소프트웨어 피그마를 연결하는 오픈 소스 프로젝트입니다....

1 년 전

095.9K

Remio: 정보를 지능적으로 정리하는 개인 지식 관리 도구

일반 소개 Remio는 사용자가 정보를 효율적으로 수집, 정리, 활용할 수 있도록 돕는 데 중점을 둔 AI 기반 개인 지식 관리 도구입니다. 웹 콘텐츠, 로컬 파일, 사용자 메모를 자동으로 캡처하고 지능형 분석을 통해 명확하게 구조화된 지식 베이스로 정리하며, 데이터 프라이버시를 강조하는 Remio는 ...

최신 AI 리소스 # AI 노트

1 년 전

095.9K

Trancy：沉浸式翻译 & YouTube AI 双语字幕 & 语言学习助手浏览器插件

트랜시: 몰입형 번역 & YouTube AI 이중 언어 자막 & 언어 학습 도우미 브라우저 플러그인

일반 소개 Trancy는 언어 학습자를 위해 설계된 올인원 도구로, 유튜브와 넷플릭스용 이중 언어 자막을 지원하고 웹페이지 AI 스트로크 번역과 전체 텍스트 번역을 제공합니다. Trancy를 통해 사용자는 비디오 및 웹 콘텐츠를 변환할 수 있습니다.

최신 AI 리소스 # AI 교육 도구 # AI 번역

2 년 전

095.9K

Eightfold AI: 기업 인재 확보 및 관리 최적화를 위한 HR 인텔리전스 플랫폼

일반 소개 Eightfold AI는 조직이 인재를 보다 효율적으로 채용, 관리 및 유지할 수 있도록 지원하는 AI 기반 인재 인텔리전스 플랫폼입니다. 딥러닝 기술을 사용하여 전 세계 10억 개 이상의 경력 궤적과 100만 개 이상의 기술 데이터를 분석하여 기업에 정확한 정보를 제공합니다.

최신 AI 리소스 # 전문가용 생산성 도구

1 년 전

095.9K

커리어 드리머: AI를 활용하여 커리어 잠재력을 탐색하는 커리어 플래너

일반 소개 커리어 드리머는 사용자가 커리어 잠재력을 발견하고 기술을 분석하여 새로운 커리어 경로를 제안할 수 있도록 설계된 Google의 AI 기반 커리어 탐색 도구입니다. 이 도구는 사용자의 배경, 기술 및 관심사를 분석하여 개인화된 커리어 구축을 제공합니다....

최신 AI 리소스 # AI 생활 효율 도우미

1 년 전

095.8K

Fireflies.ai: 자동화된 회의 녹취 및 분석 기능을 갖춘 지능형 회의 도우미

일반 소개 Fireflies.ai는 비즈니스 회의를 필사, 요약 및 분석하기 위해 설계된 고급 AI 기반 회의 도우미입니다. 음성 인식 및 자연어 처리 기술을 사용하여 사용자가 회의 내용을 자동으로 기록하고 분석하여 실행 가능한 데이터와 줄거리로 만들 수 있도록 도와줍니다.

최신 AI 리소스 # AI 텍스트 및 오디오/비디오 요약 도구

2 년 전

095.7K

아케이드: 화면상의 작업을 녹화하여 대화형 제품 데모 동영상을 빠르게 생성할 수 있습니다.

일반 설명 Arcade는 사용자가 대화형 데모를 빠르게 만들 수 있도록 도와주는 사용하기 쉬운 온라인 플랫폼입니다. 마케터, 제품 관리자 및 영업팀이 제품 기능을 시연하는 데 적합합니다. 화면의 동작을 녹화하여 Arcade는 사용자가 단 몇 분 만에 사용할 수 있는 대화형 데모 콘텐츠를 자동으로 생성합니다....

최신 AI 리소스 # AI 생성 프레젠테이션/PPT # AI 마케팅

1 년 전

095.7K

Markdownify MCP Server：基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP 서버: MCP 프로토콜을 기반으로 다양한 콘텐츠를 마크다운 형식으로 변환합니다.

일반 소개 마크다운파이 MCP 서버는 모델 컨텍스트 프로토콜을 기반으로 하는 오픈 소스 도구로, 개발자 Zach Caceres가 GitHub에서 호스팅합니다 ...

1 년 전

095.7K

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: 오픈 소스 대형 모델 인스턴트 메시징 로봇, 여러 WeChat, QQ, Flybook 및 기타 멀티 플랫폼 배포를 지원하는 AI 로봇.

LangBot은 여러 메시징 플랫폼과 대형 모델을 지원하는 대형 모델 기반 인스턴트 메시징 봇 플랫폼입니다. 이 플랫폼은 QQ, 위챗(기업용 위챗, 개인용 위챗), 플라이북, 디스코드, 원봇 및 기타 메시징 플랫폼에 맞게 조정되며, 오픈...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

095.6K

DeepEP：专为MoE模型优化通信效率的开源工具（DeepSeek 开源周第二天）

DeepEP: MoE 모델을 위해 특별히 통신 효율성을 최적화하는 오픈 소스 도구(딥시크 오픈 소스 주간 2일차)

종합 소개 DeepEP는 deepseek-ai 팀이 개발한 오픈 소스 통신 라이브러리로, 전문가 혼합(MoE) 모델과 전문가 병렬 처리(EP)의 훈련 및 추론 효율성을 개선하는 데 중점을 두고 있습니다. 이 라이브러리는 다음을 통해 GPU 간의 데이터 교환을 최적화합니다.

최신 AI 리소스

1 년 전

095.6K

RoomGPT: 객실 사진을 업로드하고 AI를 사용하여 다시 디자인하세요!

일반 소개 RoomGPT는 사용자가 방 사진을 업로드하고 인공지능 기술을 사용하여 새롭게 디자인된 버전을 생성할 수 있는 GitHub 사용자 Nutlope가 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 사용자가 비싼 디자이너 비용 없이 전문가 수준의 인테리어 디자인을 이용할 수 있도록 하는 것을 목표로 합니다....

2 년 전

095.6K

TxAgent: 의사가 약물 효과와 치료 옵션을 분석하는 데 도움을 주는 AI 도구

종합 소개 TxAgent는 의사가 약물 상호작용을 분석하고 맞춤형 치료 계획을 개발할 수 있도록 하버드 대학교의 의료 및 과학 인공 지능 팀(MIMS)에서 개발한 오픈 소스 AI 도구입니다. 다단계 추론과 생의학 지식의 실시간 검색을 통해 환자별 상황을 결합하여...

1 년 전

095.6K

Dify-Plus: Dify를 위한 온프레미스 관리 백엔드

포괄적인 소개 Dify-Plus는 Dify 오픈 소스 프로젝트의 2차 개발을 기반으로 하는 AI 애플리케이션 개발 플랫폼입니다. Dify에 기반한 새로운 관리 센터를 추가하고 기업 시나리오에 맞게 기능을 최적화합니다. 이 프로젝트는 처음에 기업 내부용으로 개발되었으나 나중에 커뮤니티에도 비슷한 요구가 있다는 것을 알게 되었습니다.

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

095.6K

희요: 아이와 동행하는 AI 동반자이자 아이들의 학습 경험을 향상시키는 지능형 AI 파트너(유료)

일반 설명 Heeyo는 3-11세 어린이가 대화형 게임과 대화를 통해 학습 경험을 향상시킬 수 있도록 설계된 AI 앱으로, 하버드와 스탠퍼드의 교육 전문가가 설계했으며 수학, 과학 및 사회 정서적 기술을 다루는 2000개 이상의 학습 게임을 제공합니다. Kids...

최신 AI 리소스 # AI 교육 도구

2 년 전

095.6K

프롬프트 스미스: 온라인에서 여러 버전의 Gen AI 프롬프트를 손쉽게 관리하기

일반 소개 프롬프트 스미스는 사용자가 생성형 AI 프롬프트를 쉽게 관리할 수 있도록 설계된 프롬프트 엔지니어링 솔루션입니다. 이 플랫폼은 사용자가 데이터를 완전히 제어할 수 있는 자체 호스팅 옵션을 제공합니다. 도커화된 배포를 통해 사용자는 쉽게 시작하고 실행할 수 있습니다.

최신 AI 리소스 # 프롬프츠 보조 도구

2 년 전

095.6K

핀로봇: 금융 데이터 분석 효율성과 투자 리서치를 개선하는 지능형 기관

종합 소개 FinRobot은 AI4Finance Foundation에서 개발한 오픈 소스 AI 인텔리전스 플랫폼으로, 금융 분석을 위해 설계되었습니다. 전통적인 언어 모델뿐만 아니라 다양한 AI 기술을 통합하여 금융 산업을 위한 포괄적인 솔루션을 제공하는 것을 목표로 합니다.F....

1 년 전

095.5K

SQL 채팅: 웹 기반 채팅 인터페이스가 있는 SQL 클라이언트

일반 소개 SQL Chat은 자연어를 통해 데이터베이스와 상호 작용하도록 설계된 오픈 소스 SQL 쿼리 및 관리 도구입니다. 사용자는 채팅 인터페이스를 통해 쿼리, 수정, 추가, 삭제와 같은 데이터베이스 작업을 수행할 수 있습니다. 이 도구는 MySQL을 포함한 다양한 데이터베이스를 지원합니다.

최신 AI 리소스 # AI 데이터 분석

2 년 전

095.5K

POE: 메인스트림 텍스트와 이미지를 통합하여 대규모 모델을 생성하기 위한 봇 통합 플랫폼

POE 일반 소개 POE는 빠르고 유용한 인공지능 채팅 플랫폼으로, 다양한 인공지능 기반 봇과 질문하고, 즉각적인 답변을 받고, 대화를 나눌 수 있습니다. 사용자는 ChatGPT, GPT-4, Cla와 같은 여러 AI 모델과 텍스트를 통해 채팅할 수 있습니다.

최신 AI 리소스 # AI 통합 다중 모델 대화 플랫폼

2 년 전

095.5K

Enchanted: iOS 및 macOS용 기본 비공개 모델을 지원하는 멀티모드 채팅 앱

일반 설명 Enchanted는 라마 2, 미스트랄, 비쿠나, 스탈링과 같은 비공개 모델과의 멀티모드 채팅을 위해 설계된 오픈 소스 iOS, macOS 및 비전OS 앱입니다. 이 앱은 다음과 호환됩니다.

최신 AI 리소스 # AI 현지화 채팅 애플리케이션

1 년 전

095.5K

AnyText: 다국어 이미지 텍스트를 생성하고 편집할 수 있으며, 이미지에 여러 줄의 중국어를 생성하도록 고도로 제어할 수 있습니다.

종합 소개 AnyText는 확산 모델을 기반으로 개발된 혁신적인 다국어 시각 텍스트 생성 및 편집 도구입니다. 이미지에서 자연스러운 고품질 다국어 텍스트를 생성하고 유연한 텍스트 편집 기능을 지원합니다. 연구팀이 개발하여 ICLR 2024에서 발표했습니다...

2 년 전

095.4K

PandasAI: 자연어로 데이터 쿼리 및 차트 생성을 위한 데이터 분석 대화 플랫폼

일반 소개 PandasAI는 자연어 처리 기술을 통해 데이터 분석 프로세스를 간소화하도록 설계된 Python 기반 오픈 소스 플랫폼입니다. 사용자가 데이터베이스(예: SQL, CSV, 판다, 폴라, 몽고DB, ...)와의 대화를 통해 작업할 수 있도록 지원합니다.

2 년 전

095.4K

1688 AI 에디션 - 알리 1688 플랫폼에서 출시한 AI 비즈니스 어시스턴트

1688 AI 버전은 알리바바의 1688 플랫폼에서 출시한 지능형 비즈니스 비서 애플리케이션으로, 소규모 B 구매자와 판매자를 위해 설계되었습니다. 1688 플랫폼의 방대한 데이터를 기반으로 비즈니스 기회 푸시, 제품 추천, 아이디어 생성, 기업 쿼리 등과 같은 기능을 제공하여 사용자가 시장 역학을 정확하게 파악하고 신속하게 ...

최신 AI 리소스

1 년 전

095.4K

Memo AI: 비디오 자막용 네이티브 클라이언트, 다국어 자막 변환

일반 설명 MemoAI는 비디오 및 오디오 파일을 텍스트, 자막, 메모로 변환하도록 설계된 강력한 비디오 번역 도구입니다. YouTube 동영상, 팟캐스트, 로컬 파일 등 어떤 파일이든 MemoAI로 손쉽게 처리할 수 있습니다. 중국어, 영어, 일본어 등 90개 이상의 언어를 지원합니다.

2 년 전

095.4K

Project IDX：云端集成多开发环境的AI IDE，Google基于网页的免费AI代码编辑器

Project IDX: 클라우드 통합 다중 개발 환경을 위한 AI IDE, Google의 무료 웹 기반 AI 코드 편집기

종합 소개 프로젝트 IDX는 Google에서 제공하는 AI 지원 풀스택, 멀티플랫폼 애플리케이션 개발 작업 공간입니다. Google 클라우드를 기반으로 하며 여러 프레임워크와 언어를 지원하며 다양한 Google 제품과 서비스를 통합합니다.

최신 AI 리소스 # AI IDE # AI 프로그래밍

1 년 전

095.4K

Petal: AI를 사용하여 문서를 분석 및 관리하고, 여러 문서를 검색하여 잘 문서화된 답변을 생성합니다.

일반 소개 Petal은 사용자가 문서를 효율적으로 관리하고 분석할 수 있도록 설계된 AI 기반 문서 분석 플랫폼입니다. Petal을 통해 사용자는 지식 베이스를 플랫폼에 연결하고 완전히 문서화되고 신뢰할 수 있는 답변을 생성할 수 있으며, Petal은 여러 문서 유형을 지원합니다.

최신 AI 리소스 # AI 쓰기 # 지식 검색 및 RAG 프레임워크

2 년 전

095.3K

Diffus（GRAVITI Diffus）：功能完整的原生云端 Stable Diffusion WebUI(NSFW)

Diffus(그라비티 디퓨즈): 모든 기능을 갖춘 네이티브 클라우드 안정적 디퓨즈 웹UI(NSFW)

일반 소개 Diffus는 안정적인 확산 기술을 기반으로 한 전문 크리에이터와 예술 애호가를 위한 AI 이미지 생성 플랫폼입니다. 이 사이트는 사용자가 간단한 프롬프트만으로 고품질 이미지를 생성할 수 있도록 다양한 모델, 확장 기능 및 도구를 제공합니다....

최신 AI 리소스 # AI 온라인 이미지 생성

2 년 전

095.3K

티저 더빙: 짧은 동영상 내레이션 및 제작에 중점을 둔 지능형 더빙 도구

종합 소개 Tease Dubbing은 5백만 명 이상의 사용자가 사용하는 인기 있는 AI 더빙 소프트웨어입니다. 이 소프트웨어는 고급 AI 지능형 더빙 기술을 사용하여 전문적이고 사실적인 더빙 효과를 제공하며, 이는 짧은 동영상, 광고 제작, 교육 및 훈련 및 기타 시나리오에 적합합니다. 티저 더빙은 사용자에게 빠른 서비스를 제공하기 위해 최선을 다하고 있습니다.

2 년 전

095.3K

Segmind: 서버리스 API를 사용한 생성형 AI 오케스트레이션 워크플로, 다양한 주류 모델 API 제공

종합 소개 Segmind는 제너레이티브 AI에 중점을 둔 온라인 플랫폼으로, 사용자가 멀티모달 워크플로를 쉽게 구축하고 배포할 수 있도록 다양한 서버리스 API와 워크플로 도구를 제공합니다. 이 플랫폼은 다음과 같은 다양한 제너레이티브 AI 모델을 지원합니다.

최신 AI 리소스 # AI 오픈 서비스

2 년 전

095.3K

Kotaemon: 배포가 간편한 오픈 소스 멀티모달 문서 퀴즈 도구

일반 소개 코타에몬은 최종 사용자와 개발자에게 검색 증강 생성(RAG) 기반의 Q&A 기능을 제공하기 위해 설계된 오픈 소스 문서 Q&A 도구입니다. 이 프로젝트는 Cinnamon에서 개발했으며 다양한 LLM API 제공업체(예: OpenA...

2 년 전

095.3K

R1-V: 시각 언어 모델의 일반화 기능을 위한 저비용 강화 학습

종합 소개 R1-V는 저비용 강화 학습(RL)을 통해 시각 언어 모델링(VLM)의 획기적인 발전을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 검증 가능한 보상 메커니즘을 활용하여 VLM이 일반적인 수 세기 능력을 학습하도록 동기를 부여합니다. 놀랍게도, R1-V의 2B는 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

2 년 전

095.2K

플라잉 패들 PP-TableMagic: 복잡한 테이블을 위한 구조화된 정보 추출

표 인식의 목표는 이미지에서 표를 구문 분석하여 표 구조와 셀 위치를 정확하게 식별하고 이를 구조화된 표 형식(예: HTML)으로 변환하는 것입니다. 오늘날의 정보화 시대에는 여전히 많은 양의 중요한 표 데이터가 비정형화된 상태로 존재합니다(예: 통계표 그림이 있는 스캔 문서...).

1 년 전

095.2K

Aide: VSCode 개발 환경, 원클릭 주석, 변환 및 코드의 UI 생성을 향상시키는 AI 도우미 확장 프로그램입니다.

일반 소개 AIDE(AI 지원 개발 확장 프로그램)는 독특하고 유용한 AI 프로그래밍 지원을 제공하는 데 중점을 둔 VSCode용 강력한 AI 지원 개발 확장 프로그램입니다. GitHu와는 다릅니다...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 프로그래밍

2 년 전

095.2K

핀챗: 지능형 주식 리서치 플랫폼, 미국 상장 기업 실적 분석

일반 소개 FinChat은 투자자에게 고품질의 금융 데이터와 분석 도구를 제공하도록 설계된 AI 기반 주식 리서치 플랫폼입니다. 750개 이상의 기업 데이터와 100명 이상의 슈퍼 투자자의 투자 정보를 통합하여 사용자가 시장에 빠르게 접근할 수 있도록 도와줍니다.

최신 AI 리소스 # AI 금융 데이터 분석

2 년 전

095.2K

모나랜드: 초현실적인 AI 채팅 가상 세계|대화형 스크립트|역할 놀이|가상 동반자

일반 소개 모나랜드는 사용자가 상호작용할 수 있는 다양한 초현실적인 AI 캐릭터 컬렉션을 제공하는 AI 채팅 유니버스 플랫폼입니다. 사용자는 마피아 보스, 마법의 가지 모자, 그루트 등 다양한 가상의 캐릭터와 시나리오 기반의 대화를 나눌 수 있습니다. 일부 캐릭터에는 사이먼 라일리가 포함됩니다.

최신 AI 리소스 # AI 역할극

2 년 전

095.2K

PSHuman: 사실적인 3D 인물 모델 생성, 사진을 사용하여 3D 인체 모델링 생성

일반 소개 PSHuman은 멀티뷰 확산 기술을 기반으로 한 단일 이미지 3D 인물 재구성 툴입니다. 이 도구는 옷을 입은 사람의 단일 사진에서 상세한 기하학적 구조와 사실적인 3D 인물 모델을 생성할 수 있으며, PSHuman의 핵심 기술에는 크로스 스케일 멀티뷰 확산이 포함되어 있습니다.

최신 AI 리소스 # AI 텍스트 및 이미지를 3D로 변환하기

2 년 전

095.1K

인오리더: 나만의 뉴스 피드 만들기|RSS 리더|소셜 미디어 모니터

Inoreader는 강력한 온라인 RSS 리더이자 콘텐츠 애그리게이터입니다. 사용자는 즐겨 찾는 웹사이트, 블로그, 소셜 미디어 채널 등을 구독하여 최신 콘텐츠를 실시간으로 받아볼 수 있으며, Inoreader는 ...

최신 AI 리소스 # AI 오픈 서비스

2 년 전

095K

CYAN.AI（青色木偶科技）：动作生成大模型，实现2D视频生成3D动作数据的AI平台

CYAN.AI(Cyan Puppet Technology): 액션 생성 대형 모델, 2D 영상에서 3D 액션 데이터를 생성하는 AI 플랫폼

일반 소개 사이언퍼펫 테크놀로지스(Cyanpuppets)는 컨볼루션 신경망(CNN) 및 심층 신경망(DNN) 알고리즘을 통해 2D 동영상에서 3D 액션 데이터를 생성하는 데 주력하는 선도적인 AI 기술 회사입니다. 핵심 제품인 CYAN.AI 플랫폼은 높은...

최신 AI 리소스 # AI 이미지 생성 보조 장치

2 년 전

095K

HyperChat: MCP 인텔리전스를 사용하여 복잡한 작업을 수행하는 AI 대화 클라이언트

일반 소개 HyperChat은 BigSweetPotatoStudio에서 개발하고 GitHub에서 호스팅하는 오픈 소스 채팅 클라이언트로, OpenAI, Cla... 등 여러 대형 언어 모델(LLM)의 API를 통합하여 BigSweetPotatoStudio 언어 모델에 대한 포괄적인 개요를 제공하도록 설계되었습니다.

1 년 전

095K