AI 공유 서클

왕을 위해 전당포와 나눔을 실천하는 날!

Google 동영상: 프롬프트 지침 및 문서로 시작하는 마케팅 설명 동영상 만들기

일반 소개 Google Vids는 사용자가 업무 관련 동영상 콘텐츠를 쉽게 제작하고 공유할 수 있도록 설계된 Google Workspace 제품군의 AI 기반 동영상 제작 도구입니다. 간단한 프롬프트와 클립 통합을 통해 사용자는 스토리를 생성할 수 있습니다.

최신 AI 리소스 # AI 이미지 편집기 # AI 텍스트 비디오 변환

1 년 전

060.1K

TableGPT2: 표 형식 데이터 통합을 위한 멀티모달 모델

종합 소개 TableGPT2는 절강대학교 연구팀이 개발한 멀티모달 모델로, 표 형식 데이터의 통합과 처리에 중점을 두고 있습니다. 이 모델은 강력한 범용 언어 및 코딩 기능을 유지하면서 테이블 데이터 관련 작업을 잘 수행할 수 있도록 사전 학습 및 미세 조정되었습니다....

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

054.7K

Context：无缝集成各类数据源源，多角色Agent自动化完成不同工作场景内容

컨텍스트: 다양한 데이터 소스의 원활한 통합, 다양한 작업 시나리오 콘텐츠를 완성하기 위한 다중 역할 에이전트 자동화

일반 소개 컨텍스트 오토파일럿은 심층적인 통합과 사무 자동화를 통해 팀 생산성을 향상시키도록 설계된 Context의 지능형 AI 생산성 도구입니다. 이 도구는 세계 최초의 컨텍스트 엔진인 Context-1...을 활용합니다.

최신 AI 리소스 # 지능형 바디 애플리케이션

1 년 전

054.7K

即将推出可灵（Kling）1.5：“自定义模型”用自己的视频素材训练人物一致性角色。

곧 출시될 Kling 1.5: '커스텀 모델'은 자신만의 비디오 영상으로 캐릭터를 훈련시킵니다.

기존의 동영상 생성 방식을 뒤집다 Kling AI의 '맞춤형 모델' 기능을 사용하면 10~30개의 동영상(각각 최소 10초 길이)을 업로드하여 캐릭터를 훈련시킬 수 있습니다. 이 과정은 기존의 이미지 트레이닝 모델과는 매우 다른데, Kling AI는 캐릭터에 비디오 영상을 사용하기 때문입니다.

AI 뉴스

1 년 전

055.5K

EyeLevel（GroundX）：多模态企业文档数据处理平台，从RAG源头消除LLMs幻觉

EyeLevel(GroundX): RAG 소스에서 LLM의 착각을 없애는 멀티모달 엔터프라이즈 문서 데이터 처리 플랫폼입니다.

종합 소개 EyeLevel은 복잡한 엔터프라이즈 콘텐츠를 대규모 언어 모델링(LLM) 처리에 적합한 데이터로 변환하여 데이터 착시를 방지하는 데 중점을 두고 있습니다. 고유한 데이터 변환 엔진과 멀티모달 처리 기술을 통해 복잡한 표, 차트를 변환할 수 있는 EyeLevel은 ...

최신 AI 리소스 # AI 오픈 서비스

1 년 전

056.1K

WebSpy: 웹사이트 요청을 분석 및 테스트하고 웹사이트 성능을 최적화하는 웹사이트 SEO 지표

일반 소개 WebSpy는 개발자와 테스터를 위해 설계된 강력한 웹사이트 분석 및 테스트 도구입니다. 사용자는 웹 사이트의 HTTP 요청과 응답을 모니터링하고 편집할 수 있으며, 여러 요청 유형(예: GET, POST, PUT, PATCH, DE...)을 지원합니다.

최신 AI 리소스 # AI 오픈 서비스

1 년 전

052.2K

fal: 리치 미디어 클래스 개발자를 위한 제너레이티브 매크로 모델링 API

일반 소개 fal은 사용자가 이미지, 비디오, 오디오 등 고품질 생성 미디어 모델을 사용하여 실시간 AI 애플리케이션을 구축할 수 있도록 지원하는 온라인 AI 추론 플랫폼입니다. 콜드 스타트가 필요 없는 종량제 방식이며, Stable Dif...와 같은 다양한 사전 학습된 생성 모델을 제공합니다.

최신 AI 리소스 # AI 오픈 서비스

1 년 전

075.3K

VideoChat：自定义形象和音色克隆的实时语音交互数字人，支持端到端语音方案和级联方案

비디오챗: 사용자 지정 이미지 및 톤 복제가 가능한 실시간 음성 대화형 디지털 사람, 엔드투엔드 음성 솔루션 및 캐스케이딩 솔루션 지원

일반 소개 비디오챗은 오픈 소스 기술을 기반으로 하는 실시간 음성 상호작용 디지털 사람 프로젝트로, 엔드투엔드 음성 체계(GLM-4-Voice - THG)와 캐스케이드 체계(ASR-LLM-TTS-THG)를 모두 지원합니다. 이 프로젝트를 통해 사용자는 디지털 ...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트 # AI 디지털 맨

1 년 전

062.7K

Ichigo(llama3-s): 로컬 실시간 음성 AI 비서, Siri의 오픈 소스 버전

일반 소개 Ichigo는 텍스트 기반 언어 모델을 네이티브 '듣기' 기능으로 확장하는 것을 목표로 하는 오픈 소스 실시간 음성 AI 프로젝트입니다. 이 프로젝트는 메타의 카멜레온 논문에서 영감을 얻은 초기 융합 기술을 사용하며, Ichigo의 목표는 다음과 같습니다.

1 년 전

062.6K

SFT-data-builder：利用免费大模型API生成AI训练数据，0成本大模型训练数据生成

SFT-데이터 빌더: 무료 빅 모델 API를 사용하여 AI 학습 데이터 생성, 0 비용 빅 모델 학습 데이터 생성

종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...

최신 AI 리소스 # AI 자바 오픈 소스 프로젝트

1 년 전

056.6K