시드 확산은 코드 생성 작업을 처리하기 위해 ByteHop에서 도입한 실험적인 확산 언어 모델입니다. 이 모델은 2단계 확산 훈련, 제약된 순차 학습, 향상된 효율적인 병렬 디코딩과 같은 기술을 기반으로 하며, 추론 속도를 2,146 토큰/초로 크게 개선하여... 보다 빠른 2,146 토큰/초로 향상시킵니다.
샤오싱슈는 징동건강이 출시한 AI 감정 만화 생성 제품으로 현재 테스트 단계에 있으며, 이 제품은 감정 중심의 만화 스토리 생성이 핵심 기능으로, 사용자가 음성이나 텍스트 입력을 통해 감정을 표현하거나 이야기를 전달하면 AI가 입력에 따라 그에 맞는 4컷 만화와 스토리 해석을 생성해줍니다.
1688 AI 버전은 알리바바의 1688 플랫폼에서 출시한 지능형 비즈니스 비서 애플리케이션으로, 소규모 B 구매자와 판매자를 위해 설계되었습니다. 1688 플랫폼의 방대한 데이터를 기반으로 비즈니스 기회 푸시, 제품 추천, 아이디어 생성, 기업 쿼리 등과 같은 기능을 제공하여 사용자가 시장 역학을 정확하게 파악하고 신속하게 ...
스텝스 딥 리서치는 스텝스 스타에서 출시한 효율적인 인공지능 리서치 도구로, 복잡한 이슈에 대한 리서치를 자율적으로 완료하고 단기간에 전문적인 보고서를 생성할 수 있습니다. 이 도구는 금융, 컨설팅, 의료, 법률 및 기타 분야를 위해 설계되었으며 심층적인 검색 및 정보 통합 기능으로 업계에서 뛰어난 평가를 받고 있습니다.
런웨이 알레프는 런웨이에서 출시한 고급 AI 동영상 편집 모델로, 간단한 텍스트 명령을 기반으로 동영상 콘텐츠 추가 및 삭제, 스타일 변경, 환경 조정 및 카메라 움직임 최적화를 빠르게 수행할 수 있습니다. 사용자는 복잡한 작업 없이도 중복 요소를 쉽게 제거하고 장면을 변경할 수 있으며...
웹쉐이퍼는 알리바바의 통이 연구소에서 출시한 AI 학습 데이터 합성 시스템으로, 공식 모델링 및 지능 확장 메커니즘을 기반으로 고품질의 확장 가능한 학습 데이터를 생성하여 AI 지능이 복잡한 정보 검색 기능을 향상시킬 수 있도록 지원합니다. 이 시스템은 "지식 투영"의 개념을 도입합니다 ...
스카이워크 유니픽은 이미지 이해, 텍스트 생성 이미지, 이미지 편집이라는 세 가지 핵심 기능을 갖춘 쿤룬완웨이의 오픈 소스 멀티모달 사전 훈련 모델입니다. 이 모델은 자동 회귀 아키텍처를 기반으로 하며, MAR 인코더와 SigLIP2 백본을 통합하고 15억 개의 파라미터 게이지를 지원합니다.
통이 완상 완2.2는 알리바바에서 오픈소스로 제공하는 고급 AI 동영상 생성 모델로, 총 270억 건의 레퍼런스를 보유하고 있습니다. 이 모델에는 텍스트 생성 비디오, 그래프 생성 비디오, 통합 비디오 생성의 세 가지 모드가 포함되어 있으며, 텍스트 설명, 이미지 또는 두 가지를 조합하여 고품질 비디오를 생성할 수 있습니다.
GLM-4.5는 추론, 코드 생성 및 지능형 신체 기능을 통합하여 지능형 신체 애플리케이션을 위해 설계된 Smart Spectrum의 오픈 소스 SOTA 모델입니다. 이 모델은 혼합 전문가(MoE) 아키텍처를 기반으로 하며 3,550억 개의 파라미터가 포함된 GLM-4.5와 1,600억 개의 파라미터가 포함된 두 가지 버전이 있습니다.
코즈 루프는 바이트댄스의 코즈 플랫폼의 오픈 소스 AI 인텔리전스 개발 및 운영, 유지보수 관리 플랫폼입니다. 이 플랫폼은 개발자에게 개발, 디버깅, 평가 및 모니터링에 이르는 전체 수명 주기 관리를 제공하며, 큐 워드 엔지니어링, 에이전트 효과 평가, 성능 모니터링 및 튜닝을 포괄합니다.
인턴-S1은 상하이 인공 지능 연구소에서 출시한 과학 멀티모달 그랜드 모델입니다. 이 모델은 언어 및 다중 모드 기능을 심층적으로 통합하여 교차 모드 과학 구문 분석, 언어 및 시각 융합, 과학 데이터 처리, 과학적 질문 답변, 실험 설계 및 최적화와 같은 강력한 기능을 제공합니다.
훈위안 3D 월드 모델 1.0(훈위안 월드 1.0)은 텐센트의 오픈 소스 업계 최초의 몰입형 로밍, 인터랙티브, 시뮬레이션 월드 생성 모델입니다. 이 모델은 파노라마 시각 생성 및 계층적 3D 재구성 기술을 통합하여 텍스트 또는 이미지 입력을 지원하여 36개의 세계를 빠르게 생성합니다.
Agentar-Fin-R1은 Anthem에서 도입한 금융 분야를 위한 최첨단 대규모 언어 모델입니다. 강력한 Qwen3 아키텍처를 기반으로 개발된 이 모델은 8B와 32B의 두 가지 파라미터 스케일 버전을 제공하며 다단계 분석, 위험 평가, 전쟁 등 복잡한 재무 추론 작업을 정확하게 처리할 수 있습니다.
개인 정보 보호 및 보안에 민감한 개발 팀을 위해 설계된 오픈 소스 엔터프라이즈급 네이티브 AI 프로그래밍 도우미입니다.MonkeyCode는 코드 데이터 보안을 보장하기 위해 비공개 배포 및 오프라인 사용을 지원합니다. MonkeyCode는 코드 데이터의 보안을 보장하기 위해 비공개 배포 및 오프라인 사용을 지원합니다 ...
ChatFlow는 복잡한 요구사항을 효율적인 워크플로로 전환할 수 있도록 지원하는 오픈 소스 AI 워크플로 자동화 도구입니다. 사용자가 코드 프레임워크, 테스트 케이스를 빠르게 생성할 수 있도록 지원하는 AI 기술 기반 도구는 소프트웨어 아키텍처를 작성하고 설계하는 데 도움을 줄 수 있습니다.
Seed GR-3는 새로운 환경과 복잡한 명령에 적응할 수 있는 강력한 일반화 기능을 갖춘 바이트댄스에서 개발한 범용 로봇 모델입니다. 이 모델은 시각, 언어 및 동작 정보를 융합하고 로봇 데이터, VR 인체 궤적 데이터 및 공개 그래픽 데이터의 3-in-1 학습 방법을 기반으로 새로운 물체에 대한 반응 능력을 향상시킵니다....
Qwen3-Coder는 알리 통이 첸첸 팀이 도입한 최첨단 코드 생성 모델입니다. 이 모델은 480억 개의 매개 변수와 35억 개의 활성화 매개 변수를 가지고 있으며 기본 256K 토큰 컨텍스트를 지원하며 100만 개의 토큰으로 확장할 수 있으며, 하이브리드 전문가 아키텍처를 기반으로 합니다.
OpenReasoning-Nemotron은 수학, 과학 및 코드에서 추론 작업의 처리를 지원하기 위해 NVIDIA에서 오픈 소스화한 일련의 대규모 언어 모델입니다. 이 모델은 15억 개의 매개변수 스케일을 가진 DeepSeek R1 0528 모델을 기반으로 증류되었습니다....
Seed-X는 70억 개의 파라미터로 28개 언어의 양방향 번역을 지원하는 ByteDance의 Seed 팀이 출시한 다국어 번역 모델입니다. 이 모델은 다국어 데이터 사전 학습, 명령 미세 조정 및 강화 학습 기술을 결합하여 복잡한 언어 패턴을 효율적으로 처리하고 번역 품질을 개선합니다.
TRAE SOLO는 바이트댄스에서 출시한 인공지능 프로그래밍 어시스턴트인 TRAE가 인공지능 기술로 소프트웨어 개발 과정을 간소화하기 위해 선보인 인공지능 자동 개발 도우미로, 사용자의 요구 사항을 이해하고 텍스트 설명, 음성 명령, 파일 업로드 등을 지원하여 요구 사항을 입력하면 자동으로 계획을 세우고...
Goedel-Prover-V2는 프린스턴 대학교, 칭화 대학교, NVIDIA와 같은 주요 기관의 오픈 소스 정리 증명 모델입니다. 이 모델은 계층적 데이터 합성, 검증자 가이드 자체 수정 및 모델 평균화와 같은 혁신적인 기술을 기반으로 자동화된 형식 증명의 성능을 크게 향상시킵니다....
바이트플러스는 바이트플러스가 해외에서 다양한 서비스를 제공하기 위해 출시한 엔터프라이즈급 지능형 서비스 플랫폼입니다. 이 플랫폼은 콘텐츠 배포 및 가속(CDN), 개인화 추천, 증강 현실, 데이터 처리 및 분석, 실시간 오디오 및 비디오 통신, 인공지능 및 머신 러닝과 같은 강력한 기능을 포괄합니다.
플라잉북 미아오후는 플라잉북에서 출시한 엔터프라이즈급 AI 네이티브 시스템 구축 플랫폼입니다. 이 플랫폼은 멀티 에이전트 아키텍처를 통해 엔터프라이즈 비즈니스 요구 사항을 실제 애플리케이션으로 신속하게 변환하여 요구 사항 분석부터 기능 설계, 애플리케이션 개발 및 문제 해결에 이르는 전체 프로세스를 지원합니다. 사용자는 대화를 사용하여 경량화된 애플리케이션을 쉽게 구축할 수 있습니다.
GLM-Experimental은 위즈덤 스펙트럼 AI에서 출시한 실험적인 대규모 언어 모델로, 현재 Z.ai 플랫폼에서 사용할 수 있습니다. 이 모델에는 PPT를 자동으로 생성하는 기능이 있습니다. 사용자가 주제나 요점을 입력하면 모델이 명확하게 구조화되고 형식이 지정된 프레젠테이션을 빠르게 생성하여...
PromptForge는 사용자가 AI 큐를 효율적으로 생성, 테스트 및 최적화할 수 있도록 지원하는 강력한 AI 큐 엔지니어링 워크벤치이며, 다중 모델 비교 및 동적 파라미터 튜닝을 지원하는 지능형 생성 기능을 통해 최적화 제안을 제공하여 사용자에게 비교하지 않고도 유연하게...
VikingDB는 대규모 고차원 벡터 데이터 처리를 위해 설계된 Volcano Engine에서 출시한 고성능 클라우드 네이티브 벡터 데이터베이스로, 다양한 시나리오의 데이터 처리 요구를 충족하기 위해 실시간 동기식, 비동기식 쓰기 등 다양한 데이터 쓰기 방법을 제공합니다.VikingDB는 ...
RoboOS 2.0은 로봇이 단일 지능에서 그룹 협업 지능으로 전환하는 것을 촉진하는 교차 온톨로지 두뇌-두뇌 협업을 위한 오픈 소스 프레임워크입니다. 이 프레임워크는 '빅 브레인' 아키텍처를 사용하여 클라우드 브레인은 복잡한 의사 결정과 협업을 담당하고 스몰 브레인 모듈은 특정 기술을 실행하는 데 집중하는 효율적인 분업을 달성합니다.
Tizzy.ai는 바이두에서 출시 한 AI 지능형 검색 애플리케이션으로, 강력한 지능형 검색 기능을 갖춘 바이두의 빅 모델 기술을 기반으로하며 질문에 빠르게 답하고 깊이 생각하고 의사 결정을 지원할 수 있습니다.Tizzy.ai는 인터페이스가 간단하고 광고와 팝업이 없으며 가이드 하단에 ...
Grok 4는 xAI의 최신 대형 AI 모델로, 이전 모델에 비해 10배 향상된 추론 능력을 제공합니다. 이 모델의 뛰어난 추론 능력 덕분에 SAT 및 GRE와 같은 어려운 시험에서 만점에 가까운 점수를 받을 수 있으며, 여러 벤치마크 테스트에서 다른 최첨단 모델보다 뛰어난 성능을 발휘합니다....
젠플로우 슈퍼 히치하이커는 바이두 문헌 라이브러리에서 출시한 범용 AI 에이전트로, 사용자는 자연어 명령만 입력하면 작업을 독립적으로 분해하고 바이두 문헌 라이브러리의 14억 개 문서 라이브러리와 온라인 리소스를 호출하여 PPT, 보고서, 차트, 포스터 및 기타 전체 모달 콘텐츠를 매우 빠른 방식으로 생성할 수 있습니다.
Pet TA는 징동에서 출시한 AIGC 반려동물 인터랙티브 제품으로, 반려동물 애호가들에게 재미있고 따뜻한 온라인 인터랙티브 플랫폼을 제공할 수 있습니다. 사용자가 반려동물을 위한 다양하고 귀여운 옷과 액세서리를 선택하고, 맞춤형으로 꾸밀 수 있도록 지원하며, 반려동물의 디지털 이미지를 만들어 반려동물과 풍부한 상호작용을 할 수 있습니다. 이 플랫폼은 다음을 제공합니다.
채팅 힐링 소우주는 징동건강에서 출시한 인공지능 정신 건강 동반자 제품입니다. 징댜오첸신의 대형 의료 모델을 기반으로 출시된 채팅 힐링 작은 우주는 인간의 의사소통 과정과 공감을 시뮬레이션하고 사용자에게 7×24시간 정신 건강 지원을 제공할 수 있습니다. 사용자는 텍스트, 이모티콘 또는 음성을 기반으로 AI 캐릭터 리틀 피쉬와 상호 작용하여 이모티콘을 공유할 수 있습니다.
스타플로우 에이전트는 Liblib에서 중국 사용자를 위해 설계한 원스톱 크리에이티브 디자인 에이전트로, Lovart의 풀스택 지능형 디자인 기능을 이어받아 중국어 의미론, 동양적 미학 및 현지 시나리오에 완벽하게 적응합니다. 사용자는 문장을 입력하기만 하면 스타플로우 에이전트...
Step-Audio-AQAA는 StepFun 팀의 오디오 쿼리-오디오 응답(AQAA) 작업을 위한 엔드투엔드 대규모 오디오 언어 모델입니다. 기존의 자동 음성 인식(AQAA)에 의존하지 않고 오디오 입력을 직접 처리하여 자연스럽고 정확한 음성 응답을 생성할 수 있습니다.
뮤즈스팀은 바이두에서 출시한 멀티모달 동영상 생성을 위한 대형 모델입니다. 이 모델은 사용자가 제공한 텍스트 설명이나 이미지를 기반으로 고품질의 동적 동영상 콘텐츠를 빠르게 생성할 수 있으며, 다양한 시나리오의 제작 요구 사항을 충족하기 위해 다양한 선명도 및 기능 버전을 지원합니다.
페인팅은 사용자가 개인화된 동영상을 쉽게 제작할 수 있도록 AI 기술을 기반으로 바이두에서 출시한 AI 동영상 생성 플랫폼입니다. 직관적인 인터페이스, 강력한 도구, 영감 추천 기능을 갖춘 페인팅은 크리에이터에게 창의적인 영감을 제공하고, 동일한 작업의 핵심을 지원하며, 유사한 동영상을 빠르게 생성하고, 창작 과정을 간소화할 수 있습니다.
앤털로프는 징동에서 출시한 지능형 디자인 도구로, 전자상거래 판매자와 개인에게 효율적이고 편리한 디자인 솔루션을 제공합니다. 지능형 키잉, 지능형 레이아웃, 지능형 컬러 매칭 및 기타 기능을 통해 사용자가 제품, 광고 배너, 상점 페이지 및 기타 종류의 전자 상거래 상점의 주요 그림을 충족하는 고품질 디자인 작품을 신속하게 생성 할 수 있습니다....
텐센트 광고 미아오시는 텐센트 광고에서 출시한 원스톱 AI 광고 크리에이티브 플랫폼으로, 텐센트 광고의 하이브리드 빅 모델을 기반으로 광고주에게 효율적이고 지능적인 크리에이티브 생성 및 최적화 서비스를 제공합니다. 텍스트 투 맵, 지도 투 맵, 텍스트 투 비디오 등 다양한 크리에이티브 도구를 지원합니다. 사용자는 간단한 자연어 설명을 입력하거나 자료를 업로드하기만 하면 됩니다 ...
서클 저니는 사용자가 효율적이고 편리하게 여행 일정을 계획할 수 있도록 도와주는 AI 여행 계획 앱입니다. 사용자는 목적지와 시간 등의 정보를 빠르게 입력하여 합리적이고 개인화된 여정을 자동으로 생성할 수 있습니다. 소셜 미디어 플랫폼에서 링크, 텍스트 또는 이미지를 한 번의 클릭으로 가져와 동일한 여정을 빠르게 생성할 수 있습니다.
ML-Master는 상하이교통대학교 인공지능 학교의 에이전트 팀이 출시한 AI 전문 지능입니다. OpenAI의 권위 있는 벤치마크 테스트인 MLE 벤치에서 평균 29.3%의 메달 비율로 1위를 차지하며 Microsoft의 RD-Agent...를 능가하는 우수한 성적을 거두었습니다.
Paperpal은 학술 글쓰기에 초점을 맞춘 AI 보조 도구로, 연구자, 학생, 전문가들이 글쓰기의 품질과 효율성을 향상시킬 수 있도록 도와줍니다. 강력한 언어 수정 기능을 통해 문법 검사, 맞춤법 교정, 단어 선택 제안 기능을 제공하여 정확하고 유창한 텍스트를 작성할 수 있도록 도와줍니다.
GLM-4.1V-Thinking은 스마트 스펙트럼 AI에서 도입한 오픈 소스 시각 언어 모델로, 복잡한 인지 작업을 위해 설계되었으며 이미지, 비디오 및 문서를 포괄하는 멀티모달 입력을 지원합니다. GLM-4V 아키텍처를 기반으로 하는 이 모델은 사고의 사슬을 도입합니다 ...
씽크사운드는 알리 통이 스피치 팀이 도입한 최초의 CoT(연쇄적 사고) 오디오 생성 모델입니다. 이 모델은 CoT 추론의 도입을 기반으로 비디오 이미지에 정확하게 일치하는 음향 효과를 생성하여 기존 기술이 화면의 동적 세부 사항과 공간 관계를 포착하기 어렵다는 문제를 해결할 수 있습니다.
Qwen-TTS는 알리 통이가 도입한 고급 음성 합성 모델입니다. 이 모델은 텍스트를 자연스럽고 부드러운 음성으로 효율적으로 변환하여 중국어, 영어, 베이징 방언 등 여러 언어와 방언을 지원하여 다양한 지역과 장면의 요구를 충족할 수 있습니다. 대규모 말뭉치 학습에 의존하는 이 모델의 음성 출력은 고품질의 운율이 있는 고품질입니다.
Ovis-U1은 알리바바 그룹의 Ovis 팀이 30억 개의 매개변수 규모로 도입한 멀티모달 통합 모델입니다. 이 모델은 멀티모달 이해, 텍스트-이미지 생성, 이미지 편집의 세 가지 핵심 기능을 갖추고 있으며 고급 아키텍처 설계와 협업 및 통합 교육 방법을 통해 고충실도 이미지 구현을 지원합니다.
캥거루 스태프는 메이투안에서 출시한 판매자 중심의 AI 지능형 의사결정 애플리케이션으로, 판매자가 매장을 개설하고 운영할 때 발생하는 문제를 해결하는 데 도움을 줍니다. 메이퇀의 방대한 케이터링 데이터와 10년 이상의 온라인 운영 경험을 바탕으로 대화 상호 작용을 통해 판매자에게 트랙 선택, 매장 오픈 위치, 요리 개발, 매장 운영 및 기타 시나리오에 대한 정확한 정보를 제공합니다....
AI Jitterbug는 사용자에게 보다 효율적이고 지능적인 콘텐츠 수집 경험을 제공하기 위해 Jitterbug에서 출시한 지능형 딥씽킹 및 검색 애플리케이션입니다. Jitterbug의 강력한 콘텐츠 에코시스템과 AI 기술을 기반으로 연결된 검색 및 추론 기능을 통해 사용자에게 보다 포괄적이고 상세한 답변을 제공합니다.
Qwen VLo는 통이 첸첸 팀이 도입한 멀티모달 통합 이해 및 생성 모델입니다. Qwen VLo는 세계를 '이해'하고 그 이해를 바탕으로 고품질로 재창조하여 인식에서 생성으로의 도약을 실현할 수 있습니다. VLo는 이미지의 내용을 정확하게 이해할 수 있으며, 이를 바탕으로 일관되고 고품질의 생성을 수행할 수 있습니다.
아이비아오는 자연어 상호작용을 통해 사용자가 데이터 처리 및 분석 작업을 효율적으로 완료할 수 있도록 도와주는 인공지능 차트 처리 도구입니다. 복잡한 수식이나 코드 없이도 대화를 통해 데이터를 쿼리, 정리, 병합, 계산, 분석할 수 있어 데이터 처리의 문턱을 낮춰줍니다.
도플은 구글의 AI 가상 피팅 앱입니다. 사용자가 전신 사진을 업로드하면 애플리케이션은 자신의 신체 디지털 버전에 옷 사진이나 스크린샷을 '착용'하고, 정적인 사진에서 AI가 생성한 동영상으로 변환하여 사용자가 옷이 신체에 미치는 효과를 더욱 실감나게 느낄 수 있도록 지원합니다.
쉰레이 MCP는 AI 기술을 기반으로 한 자동 다운로드 서비스인 쉰레이가 출시한 서비스입니다. 서비스를 지원하는 AI 애플리케이션의 사용자가 음성 또는 텍스트 입력으로 다운로드 요청을 하면 AI가 자동으로 네트워크 리소스를 검색하고 다운로드를 시작합니다. 쉰레이 MCP는 기존의 다운로드 방식을 탈피하여 PC 버전의 쉰레이와 NAS 쉰레이를 지원하며, 이를 통해 ...
틱노트는 에이전틱 AI 소프트웨어와 하드웨어 제품이 결합된 틱노트에서 출시한 AI 음성 녹음기로, '휴대용 AI 사고 파트너'를 표방하고 있습니다. 얇고 휴대가 간편한 카드형 디자인을 채택하고 자석 보호 케이스가 장착되어 있어 휴대하거나 휴대폰 뒷면에 쉽게 부착할 수 있습니다.
완싱 캐노피는 완싱 테크놀로지가 출시한 AIGC 동영상 제작 플랫폼으로, 동영상, 사진, 오디오 생성의 3대 창작 분야를 다루며 미디어 및 문화 산업 종사자, 영화 및 텔레비전/포스트 프로덕션 종사자, 예술 및 디자인 종사자, 광고 및 마케팅 실무자 등을 위해 특별히 설계되어 원스톱 전문 창작 솔루션을 제공합니다.
카피 부기는 샹탕 테크놀로지에서 출시한 지능형 AI 부기 애플리케이션입니다. 이 애플리케이션은 자동 부기 기능을 핵심 기능으로 삼아 금액과 카테고리를 자동으로 식별하고 음성 입력을 지원하여 쉽고 편리하게 부기를 할 수 있습니다. 카피 부기는 청구 데이터를 지능적으로 분석하고 정기적으로 개인화된 소비 요약 및 재정 조언을 푸시하여 사용자가 더 나은 ...
Gemini CLI는 개발자에게 강력한 AI 기능을 제공하기 위해 Gemini 빅 모델을 개발자의 엔드포인트에 통합한 Google의 오픈 소스 AI 프로그래밍 도구입니다. 이 도구는 코드를 이해하고, 파일을 조작하고, 명령을 실행하고, 동적으로 문제를 해결하여 개발자가 효율적으로 생성 코드를 작성할 수 있도록 도와줍니다.
11ai는 일레븐랩스에서 출시한 인공지능 음성비서로, 자연스럽고 부드러운 대화를 통해 사용자의 업무 효율성을 높여주는 음성 상호작용을 핵심으로 하며, 5,000개 이상의 음성을 지원하고 사용자가 전용 음성을 커스터마이징할 수 있어 더욱 개인화된 어시스턴트입니다. 지연 시간이 짧은 음성 인터랙션으로 ...
잉크블레이드 AIPPT는 지능형 기술을 기반으로 한 잉크블레이드가 출시한 AI PPT 제작 도구로, PPT 제작 과정을 간소화합니다. 사용자는 테마를 입력하거나 문서를 가져 오기 만하면 AI가 완전한 구조, 디자인 통일성 및 콘텐츠가 풍부한 PPT를 신속하게 생성 할 수 있습니다. 지능형 일치 복사, 차트 및 다이어그램 생성 키가있는 도구, 자체 ...
Mu는 3억 3천만 개의 매개변수만 있는 Microsoft의 소규모 매개변수 언어 모델로, NPU와 에지 디바이스에서 효율적으로 실행되도록 설계되었습니다. 이 모델은 인코더-디코더 아키텍처를 기반으로 하며 하드웨어 인식 최적화, 모델 양자화 및 작업별 미세 조정을 통해 초당 100개 이상의 토큰 응답 속도를 달성합니다.Mu...
탄라이스는 바이트댄스의 자회사인 지터버그가 출시한 인공지능 음식 추천 도구로, 빈백 빅 모델을 기반으로 사용자에게 개인화된 음식 추천, 상점 검색 비교, 음식 팁 및 기타 서비스를 제공합니다. 탄라이스는 사용자의 취향과 위치를 기반으로 주변 레스토랑과 요리를 정확하게 추천하고, 주문 보조를 지원하며, 단체 구매 및 테이크아웃 서비스를 제공합니다....
Confucius3-Math는 넷이즈유다오가 오픈소스로 공개한 국내 최초의 수학 교육용 오픈소스 추론 모델입니다. 초중고 수학 교육 시나리오에 최적화된 140억 개의 매개 변수를 사용하여 단일 소비자용 GPU(예: RTX 4090D)에서 효율적으로 실행할 수 있으며, 추론 성능은 약...
Comate AI IDE는 바이두 웬신 익스프레스 코드에서 출시한 업계 최초의 멀티 모달, 다중 지능체 협업 AI 네이티브 IDE로, 강력한 멀티 모달 기능, 프런트엔드 개발 시나리오에서 키 투 코드(F2C), 이미지 투 코드, 자연어 투 코드의 설계 초안 지원, 뛰어난 성능으로 뛰어난 ...
딥피아노는 Zhiqu Technology에서 출시한 빅 모델을 핵심으로 하는 지능형 피아노 앱입니다. 고급 인공 지능 기술을 통해 피아노 연주자와 학습자를위한 다양한 편리한 기능을 제공합니다.DeepPiano는 지능형 악보 페이지 넘기기, 연주 진행 상황 자동 인식, 수동 조작이 필요없는 ...
옴니토커는 알리바바의 실시간 텍스트 기반 대화형 아바타 생성 프레임워크입니다. 이 프레임워크는 텍스트, 이미지, 오디오 및 비디오와 같은 여러 모달 입력을 동시에 처리하고 스트리밍 방식을 기반으로 자연스러운 음성 응답을 생성할 수 있습니다. 핵심은 씽커-토커 아키텍처를 기반으로 하며, 씬...
Skywork-SWE-32B는 쿤룬 월드와이드웹에서 도입한 오픈 소스 32B 규모의 소프트웨어 엔지니어링(SWE) 자율 코드 인텔리전스 기본 모델입니다. 이 모델은 소프트웨어 엔지니어링 작업에 초점을 맞추고 강력한 저장소 수준의 코드 복구 기능을 갖추고 있으며 다단계 상호 작용 및 긴 텍스트 처리가 있는 복잡한 시나리오에서 수행할 수 있습니다.
하이뤄 비디오 에이전트는 미니막스에서 출시한 문턱 없는 AI 비디오 제작 에이전트로, 오픈 베타 버전입니다. 간단한 텍스트 입력 또는 이미지 업로드를 통해 클릭 한 번으로 고품질의 창의적인 동영상을 생성할 수 있으며, 다음과 같은 다양한 응용 시나리오를 다룰 수 있습니다.
AQ는 앤트그룹에서 출시한 인공지능 의료 건강 도구입니다. 첨단 AI 기술을 기반으로 사용자에게 편리한 의료 건강 서비스를 제공합니다. 이 도구는 건강 상담, AI 지능형 Q&A 서비스 액세스, 보고서 해석을 위한 사진 업로드 지원, 사례 등 AQ를 기반으로 개인 및 가족 건강 기록 관리 지원...