AI 공유 서클

왕을 위해 전당포와 나눔을 실천하는 날!
Google Vids:从提示指令和文档开始创作营销讲解视频

Google 동영상: 프롬프트 지침 및 문서로 시작하는 마케팅 설명 동영상 만들기

일반 소개 Google Vids는 사용자가 업무 관련 동영상 콘텐츠를 쉽게 제작하고 공유할 수 있도록 설계된 Google Workspace 제품군의 AI 기반 동영상 제작 도구입니다. 간단한 프롬프트와 클립 통합을 통해 사용자는 스토리를 생성할 수 있습니다.
1 년 전
060.1K
TableGPT2:表格数据集成的多模态模型

TableGPT2: 표 형식 데이터 통합을 위한 멀티모달 모델

종합 소개 TableGPT2는 절강대학교 연구팀이 개발한 멀티모달 모델로, 표 형식 데이터의 통합과 처리에 중점을 두고 있습니다. 이 모델은 강력한 범용 언어 및 코딩 기능을 유지하면서 테이블 데이터 관련 작업을 잘 수행할 수 있도록 사전 학습 및 미세 조정되었습니다....
1 년 전
054.7K
Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容

컨텍스트: 다양한 데이터 소스의 원활한 통합, 다양한 작업 시나리오 콘텐츠를 완성하기 위한 다중 역할 에이전트 자동화

일반 소개 컨텍스트 오토파일럿은 심층적인 통합과 사무 자동화를 통해 팀 생산성을 향상시키도록 설계된 Context의 지능형 AI 생산성 도구입니다. 이 도구는 세계 최초의 컨텍스트 엔진인 Context-1...을 활용합니다.
1 년 전
054.7K
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。

곧 출시될 Kling 1.5: '커스텀 모델'은 자신만의 비디오 영상으로 캐릭터를 훈련시킵니다.

기존의 동영상 생성 방식을 뒤집다 Kling AI의 '맞춤형 모델' 기능을 사용하면 10~30개의 동영상(각각 최소 10초 길이)을 업로드하여 캐릭터를 훈련시킬 수 있습니다. 이 과정은 기존의 이미지 트레이닝 모델과는 매우 다른데, Kling AI는 캐릭터에 비디오 영상을 사용하기 때문입니다.
1 년 전
055.5K
EyeLevel(GroundX):多模态企业文档数据处理平台,从RAG源头消除LLMs幻觉

EyeLevel(GroundX): RAG 소스에서 LLM의 착각을 없애는 멀티모달 엔터프라이즈 문서 데이터 처리 플랫폼입니다.

종합 소개 EyeLevel은 복잡한 엔터프라이즈 콘텐츠를 대규모 언어 모델링(LLM) 처리에 적합한 데이터로 변환하여 데이터 착시를 방지하는 데 중점을 두고 있습니다. 고유한 데이터 변환 엔진과 멀티모달 처리 기술을 통해 복잡한 표, 차트를 변환할 수 있는 EyeLevel은 ...
1 년 전
056.1K
WebSpy:网站SEO指标分析和测试网站请求,优化网站性能

WebSpy: 웹사이트 요청을 분석 및 테스트하고 웹사이트 성능을 최적화하는 웹사이트 SEO 지표

일반 소개 WebSpy는 개발자와 테스터를 위해 설계된 강력한 웹사이트 분석 및 테스트 도구입니다. 사용자는 웹 사이트의 HTTP 요청과 응답을 모니터링하고 편집할 수 있으며, 여러 요청 유형(예: GET, POST, PUT, PATCH, DE...)을 지원합니다.
1 년 전
052.2K
fal:为开发者提供富媒体类生成式大模型API服务

fal: 리치 미디어 클래스 개발자를 위한 제너레이티브 매크로 모델링 API

일반 소개 fal은 사용자가 이미지, 비디오, 오디오 등 고품질 생성 미디어 모델을 사용하여 실시간 AI 애플리케이션을 구축할 수 있도록 지원하는 온라인 AI 추론 플랫폼입니다. 콜드 스타트가 필요 없는 종량제 방식이며, Stable Dif...와 같은 다양한 사전 학습된 생성 모델을 제공합니다.
1 년 전
075.3K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

비디오챗: 사용자 지정 이미지 및 톤 복제가 가능한 실시간 음성 대화형 디지털 사람, 엔드투엔드 음성 솔루션 및 캐스케이딩 솔루션 지원

일반 소개 비디오챗은 오픈 소스 기술을 기반으로 하는 실시간 음성 상호작용 디지털 사람 프로젝트로, 엔드투엔드 음성 체계(GLM-4-Voice - THG)와 캐스케이드 체계(ASR-LLM-TTS-THG)를 모두 지원합니다. 이 프로젝트를 통해 사용자는 디지털 ...
1 년 전
062.7K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo(llama3-s): 로컬 실시간 음성 AI 비서, Siri의 오픈 소스 버전

일반 소개 Ichigo는 텍스트 기반 언어 모델을 네이티브 '듣기' 기능으로 확장하는 것을 목표로 하는 오픈 소스 실시간 음성 AI 프로젝트입니다. 이 프로젝트는 메타의 카멜레온 논문에서 영감을 얻은 초기 융합 기술을 사용하며, Ichigo의 목표는 다음과 같습니다.
1 년 전
062.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-데이터 빌더: 무료 빅 모델 API를 사용하여 AI 학습 데이터 생성, 0 비용 빅 모델 학습 데이터 생성

종합 소개 SFT 데이터 빌더는 사용자의 비공개 도메인 데이터와 결합된 무료 빅 모델 API를 사용해 고품질의 SFT 학습 데이터를 생성하도록 설계된 오픈 소스 프로젝트입니다. 이 도구는 여러 AI 모델 형식을 지원하며 원클릭 생성, 일괄 생성, 유연한 편집 및 로컬...
1 년 전
056.6K