AI 도구를 찾을 수 없나요? 여기에서 찾아보세요!

키워드를 입력하기만 하면 됩니다. 접근성 Bing 검색이 사이트의 AI 도구 섹션에서는 이 사이트의 모든 AI 도구를 빠르고 쉽게 찾을 수 있습니다.

向量数据库深度对比:Weaviate、Milvus 与 Qdrant

벡터 데이터베이스 깊이 비교: 위아베이트, 밀버스, 큐드런트

인공지능과 머신 러닝 분야, 특히 검색 증강 생성(RAG) 시스템이나 시맨틱 검색과 같은 애플리케이션을 구축할 때 방대한 양의 비정형 데이터를 효율적으로 처리하고 검색하는 것은 매우 중요한 문제입니다. 벡터 데이터베이스는 이러한 과제를 해결하기 위한 핵심 기술로 부상했습니다. 벡터 데이터베이스는 고차원 데이터를 저장할 뿐만 아니라 ...
7개월 전
015.7K
aiCoder:使用AST(抽象语法树)自动编写JavaScript代码

aiCoder: AST(추상 구문 트리)를 사용하여 자바스크립트 코드 작성 자동화

일반 소개 aiCoder는 인공 지능 기술을 사용하여 자바스크립트 라이브러리 개발을 간소화하는 도구입니다. 지능형 코드 제안과 자동화된 코드 병합을 통해 개발자가 시간을 절약하고 코드 품질을 개선할 수 있도록 도와줍니다. aiCoder는 추상 구문 트리를 사용한다는 점에서 독특합니다...
7개월 전
014.7K
解锁小红书营销密码:海外用户运营增长指南 (附PDF下载)

리틀 레드북 마케팅 코드 풀기: 성장하는 해외 사용자 운영을 위한 가이드(PDF 다운로드 포함)

중국은 물론 아시아에서 가장 인기 있는 소셜 이커머스 플랫폼인 샤오홍슈는 단순한 쇼핑 앱을 넘어 젊은이들의 라이프스타일을 대변하고 브랜드 마케팅의 새로운 지위를 차지한 지 오래입니다. 중국 시장에 진출하거나 젊은 소비자에게 다가가고자 하는 해외 브랜드와 개인에게 샤오홍슈를 마스터하는 것은 ...
7개월 전
09.9K
LiveKit:构建实时音视频应用的开源工具

LiveKit: 실시간 오디오 및 비디오 애플리케이션을 구축하기 위한 오픈 소스 도구

포괄적인 소개 LiveKit은 개발자가 실시간 오디오 및 비디오 애플리케이션을 구축하는 데 중점을 둔 오픈 소스 프로젝트입니다. WebRTC 기술을 기반으로 하며 미디어 서버와 다양한 클라이언트 SDK를 포함한 완벽한 솔루션을 제공합니다.LiveKit의 핵심은 확장 가능한 ...
6개월 전
018.6K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: 네이티브 AI 모델 대화 및 문서 검색을 위한 웹 어시스턴트 플러그인

일반 소개 페이지 어시스트는 사용자가 로컬 AI 모델과 쉽게 상호작용할 수 있도록 설계된 오픈 소스 브라우저 확장 프로그램입니다. 이 확장 프로그램을 사용하면 모든 웹 페이지에서 사이드바를 열어 로컬에서 실행 중인 AI 모델과 상호 작용할 수 있습니다.Page Assi...
5개월 전
020.6K
Decagon:企业级客户服务智能体解决方案

Decagon: 엔터프라이즈 고객 서비스 인텔리전스 바디 솔루션

일반 소개 Decagon은 엔터프라이즈급 생성형 AI 고객 지원 솔루션을 제공하는 데 주력하는 회사입니다. 핵심 제품은 복잡한 문제를 처리하고 기존 시스템과 원활하게 통합하며 데이터를 통해 지속적으로 학습할 수 있는 지능형 AI 고객 서비스 인텔리전스이며, Decagon의 솔루션은 다음과 같이 설계되었습니다.
7개월 전
017K
Operator 系统技术文档

운영자 시스템 기술 문서

원본 기사: https://cdn.openai.com/operator_system_card.pdf 설명: OpenAI, 최초의 L3급 인텔리전스 오퍼레이터 출시: 인간과 컴퓨터 상호작용의 새로운 시대를 열다 1 소개 Ope...
8개월 전
09.8K
OpenAI 推出首个L3级智能体Operator:开启人机交互新时代

OpenAI, 최초의 L3급 인텔리전스 오퍼레이터 출시: 인간과 컴퓨터 상호작용의 새로운 시대 개막

컴퓨터 사용 트랙은 스타트업, 다크호스, 거대 대기업으로 붐비고 있으며, 이제 OpenAI가 이 트랙을 죽이고 있습니다. 데스크톱 자동화 인텔리전스 , 우리는 수십 개의 관련 제품을 수집했습니다. 인공 지능 분야는 점점 더 경쟁이 치열 해지고 있으며 신생 신생 기업뿐만 아니라 ...
8개월 전
011.2K
OpenAI发布GPT-4b Micro模型,一款可能让你延长寿命的模型!

OpenAI, 더 오래 살 수 있는 GPT-4b 마이크로 모델 출시!

OpenAI는 이번에는 생명 과학에 주목하여 수명 연장 전문 회사인 Retro Biosciences와 제휴하여 새로운 AI 모델인 GPT-4b Micro를 출시했습니다. 이 획기적인 기술은 단백질 설계의 규칙을 재구성할 수 있으며, 그 목표는 다음과 같습니다.
8개월 전
012.6K
FramePainter:AI驱动的涂鸦式图像编辑工具

프레임페인터: AI 기반 낙서 스타일의 이미지 편집 도구

일반 소개 프레임페인터는 고급 동영상 확산 기술과 직관적인 스케치 컨트롤을 활용하여 사용자가 복잡한 이미지 편집을 쉽게 할 수 있도록 도와주는 혁신적인 AI 기반 이미지 편집 도구입니다. 간단한 조정이든 복잡한 창의적 변형이든, 프레임페인터는 ...
8개월 전
014.3K
[转]从零拆解一款火爆的浏览器自动化智能体,4步学会设计自主决策Agent

[이전] 핫 브라우저 자동화 인텔리전스를 처음부터 분해하고, 4단계로 자율 의사 결정 에이전트를 설계하는 방법 배우기

과거에 개발했던 대부분의 인공지능은 고정된 워크플로 패턴이었으며, 아래 프레임워크를 따라 자율적인 의사 결정과 자율적인 도구 사용 기능을 갖춘 인공지능을 개발한 경우는 거의 없었습니다. 이틀 전에는 브라우저를 사용하여 간단한 작업을 자동화할 수 있는 오픈 소스 에이전트인 browse를 공유했습니다....
8개월 전
010.7K
Fey: 金融市场研究工具,提升投资决策的智能助手

Fey: 금융 시장 조사 도구이자 투자 결정을 개선하는 지능형 비서

일반 소개 Fey는 현대 투자자를 위해 설계된 지능형 비서로, 실시간 시장 데이터와 개인화된 투자 조언을 제공합니다. 간단하고 직관적인 인터페이스를 통해 사용자는 중요한 금융 정보와 시장 동향에 쉽게 액세스할 수 있습니다.Fey의 핵심 기능에는 주식 추적, 재무 분석, 개인화된 신규 ...
7개월 전
013.3K
Needle:接入私人数据源的AI搜索与工作自动化平台

Needle: 비공개 데이터 소스에 액세스할 수 있는 AI 검색 및 작업 자동화 플랫폼

일반 소개 Needle은 기업이 효율적인 정보 검색과 자동화된 워크플로우를 통해 생산성을 향상시킬 수 있도록 설계된 인공지능 플랫폼입니다. 이 플랫폼은 조직 내의 다양한 데이터 소스를 연결하여 통합 검색 및 데이터 관리 기능을 제공할 수 있습니다. 사용자는 간단히...
8개월 전
014K
Rapport Cloud:创建和部署AI驱动的数字动画角色

Rapport Cloud: AI 기반 디지털 애니메이션 캐릭터 제작 및 배포

일반 소개 래포트 클라우드는 인공 지능으로 구동되는 인터랙티브 디지털 캐릭터를 제작하고 배포하는 데 중점을 둔 클라우드 기반 플랫폼입니다. 스피치 그래픽 팀이 개발한 이 플랫폼은 수상 경력에 빛나는 오디오 기반 얼굴 애니메이션 기술을 활용하며, AAA급 영화에서 널리 사용됩니다.
8개월 전
014.8K
Jogg AI:快速生成高质量视频广告,生成社交媒体头像

Jogg AI: 고품질 동영상 광고를 빠르게 생성하고, 소셜 미디어 아바타를 생성하세요.

일반 설명 Jogg AI는 동영상 광고를 빠르고 효율적으로 생성하도록 설계된 고급 AI 기반 플랫폼입니다. 사용자는 URL을 입력하기만 하면 몇 분 안에 멋진 동영상 광고로 변환할 수 있습니다. 이 플랫폼은 사용자 정의 가능한 다양한 템플릿과 AI 아바타를 제공하며, 간단하게 ...
8개월 전
015.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: 음성과 텍스트를 통해 컴퓨터를 작동하고 실시간 음성 피드백을 제공하는 지능형 신체

일반 소개 TankWork는 컴퓨터 비전과 시스템 수준의 상호 작용을 통해 AI가 컴퓨터를 인식하고 제어할 수 있도록 설계된 오픈 소스 데스크톱 에이전트 프레임워크입니다. 이 프레임워크를 사용하면 에이전트가 음성 및 텍스트 명령을 통해 컴퓨터를 직접 제어하고, 실시간 화면 콘텐츠를 처리하며, 지속적인 시청각 정보를 제공할 수 있습니다.
8개월 전
013.9K
Quantum Swarm:多智能体集群协作框架

퀀텀 스웜: 다중 인텔리전스 클러스터 협업을 위한 프레임워크

퀀텀 스웜은 AI 집단 지능 개발 및 연구에 중점을 둔 오픈 소스 인공 지능 프레임워크입니다. 이 프로젝트는 깃허브의 퀀텀 AI 팀에서 관리하며 다중 지능 시스템을 구축하고 테스트할 수 있는 유연하고 효율적인 플랫폼을 제공하는 것을 목표로 합니다.
8개월 전
014K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: 검색 향상 생성 시스템 최적화를 위한 시각적 평가 도구

종합 소개 XRAG(eXamining the Core)는 고급 검색 증강 생성(RAG) 시스템의 기본 구성 요소를 평가하기 위해 고안된 벤치마킹 프레임워크입니다. 각 핵심 모듈을 프로파일링하고 분석함으로써 XRAG는 다양한 구성과 구성 요소가 RAG에 어떤 영향을 미치는지에 대한 정보를 제공합니다.
8개월 전
014.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: 원클릭으로 마크다운 문서 미화, 여러 셀프 미디어 플랫폼 형식(오픈 소스 로컬 클라이언트)에 적응하기

종합 소개 WenYan은 마크다운 기사 조판 및 미화를 위해 설계된 도구로, 편집된 마크다운 기사를 WeChat, Zhihu, 오늘의 헤드라인 및 기타 플랫폼에 적합한 형식으로 변환할 수 있도록 지원합니다. 사용자는 클릭 한 번으로 기사를 직접 복사할 수 있습니다...
8개월 전
011.7K
告别本地开发环境!腾讯、微软、谷歌免费在线 AI IDE 助你快速上手开发

이제 로컬 개발 환경과 작별하세요! 텐센트, 마이크로소프트, 구글의 무료 온라인 AI IDE로 시작하세요!

배경 클라우드 컴퓨팅과 인공지능(AI) 기술의 급속한 발전으로 온라인 통합 개발 환경(IDE)은 최신 개발 작업의 중요한 도구가 되었습니다. 특히 오늘날 점점 더 대중화되고 있는 AI 및 클라우드 개발에서 온라인 IDE는 지루한 로컬 환경 구성을 제거할 뿐만 아니라 강력한 기능을 제공할 수 있습니다.
8개월 전
011.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

크로노스: 뉴스 검색 및 타임라인 생성 효율성을 개선하는 뉴스 타임라인 요약 도구

일반 소개 CHRONOS는 Alibaba NLP 팀에서 개발한 뉴스 타임라인 요약 도구입니다. 이 도구는 반복적 인 자체 질문을 통해 뉴스 이벤트의 타임 라인 요약을 생성합니다.CHRONOS는 오픈 도메인 타임 라인 요약 작업을 처리 할 수있을뿐만 아니라 효율성과 확장 성 측면에서도 ...
8개월 전
013.3K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

흐름에 따라 이동: 동영상에서 움직이는 물체를 더하거나 빼는 등 동영상 속 물체의 움직임을 제어합니다.

일반 소개 Go-with-the-Flow는 넷플릭스 아이라인 스튜디오 연구팀에서 노이즈를 왜곡하여 동영상 확산 모델의 움직임 패턴을 제어하기 위해 개발한 오픈 소스 프로젝트입니다. 이 프로젝트를 통해 사용자는 장면의 카메라와 ...
8개월 전
013.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: 미시의 사진을 춤추게 만드는 스틸 인물 레퍼런스 비디오 포즈 생성 비디오

일반 소개 X-Dyna는 제로 샘플 확산 기법을 사용하여 역동적인 인물 애니메이션을 생성하기 위해 ByteDance에서 개발한 오픈 소스 프로젝트입니다. 이 프로젝트는 드라이브 비디오의 얼굴 표정과 신체 움직임을 사용하여 개별 인물 이미지에 애니메이션을 적용하여 사실적이고 상황에 맞는 모션 효과를 생성합니다.X-D...
8개월 전
014.5K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

텐센트 하이브리드 3D(Hunyuan3D): 고해상도 3D 에셋 생성, 다양한 3D 머티리얼 생성 워크플로

종합 소개 Tencent Hunyuan3D(Hunyuan3D 2.0)는 고해상도 텍스처 3D 에셋을 생성하도록 설계된 Tencent의 고급 대규모 3D 합성 시스템입니다. 이 시스템은 대규모 형상 생성 모델인 훈위안3D-DiT와 대규모 텍스처 생성 모델인 훈위안3D-DiT의 두 가지 핵심 구성 요소로 이루어져 있습니다.
8개월 전
016.8K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG 웹 UI: 지능형 문서 Q&A 시스템 구축 및 비공개 웹 사이드 지식창고 간편하게 구축하기

종합 소개 RAG 웹 UI는 RAG(검색 증강 생성) 기술을 기반으로 한 지능형 대화 시스템입니다. 기업과 개인이 자체 지식 베이스를 기반으로 지능형 Q&A 시스템을 구축할 수 있도록 도와줍니다. 문서 검색과 대규모 언어 모델을 결합하여 정확하고 신뢰할 수 있는 ...
8개월 전
014.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS 데스크톱: 자연어를 사용하여 컴퓨터를 제어하는 데스크톱 인텔리전스 애플리케이션

일반 소개 UI-TARS 데스크톱은 바이트댄스에서 개발한 UI-TARS(시각 언어 모델)를 기반으로 한 그래픽 인터페이스 에이전트 애플리케이션입니다. 이 애플리케이션을 통해 사용자는 자연어를 통해 컴퓨터를 제어하여 보다 직관적이고 효율적인 인간-컴퓨터 상호 작용을 할 수 있습니다.UI-TAR...
8개월 전
023.8K
免费使用 Cursor/Windsur 生成各类实用信息图

커서/윈드서어로 모든 종류의 유용한 인포그래픽을 무료로 생성하세요!

옛날 옛적에 우리는 재미있는 카드 도표 프롬프트 단어 예제를 많이 공유했지만 실제로는 새를 사용하지 않는 것을 발견했습니다. 그 이유는 매우 간단합니다. 이러한 카드 다이어그램 프롬프트 단어 템플릿 샘플 스타일 코드는 일반적으로 고정되어 있으며 사용자의 실제 의도와 샘플 스타일이 일치하지 않습니다. 어떤 사람들은 더 일반적인 프롬프트 단어 적응을 수행했습니다 : 카드 맵 ...
8개월 전
011.5K
使用 Phidata AI 快速构建股票分析智能体智能体

Phidata AI를 통한 신속한 재고 분석 인텔리전스 구축

주식 리서치의 정보 과부하 현실 주식의 가치를 평가할 때 흔히 겪는 어려움은 정보에 입각한 투자 결정을 내리기 위해 여러 출처의 대량의 정보를 처리해야 한다는 점입니다. 전통적인 방법은 다음과 같습니다. 다양한 플랫폼에서 재무 데이터를 수집하는 것입니다. 여러 보고서, 뉴스 및 기타 기사 읽기. ...
8개월 전
09.6K
Narrify:将书籍转化为音频摘要,随时随地聆听精华

Narrify: 책을 오디오 요약본으로 바꾸고 언제 어디서나 최고의 명언을 들어보세요!

일반 소개 Narrify는 책을 간결하고 매력적인 오디오 요약본으로 변환하도록 설계된 혁신적인 플랫폼입니다. Narrify를 통해 사용자는 책의 핵심 콘텐츠와 인사이트에 빠르게 액세스할 수 있으므로 출퇴근길이나 여가 시간에 책의 하이라이트를 쉽게 들을 수 있습니다.
8개월 전
014.1K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git 리포지토리 텍스트 파일을 읽고 대형 모델을 위해 빠르게 청크 처리하기

일반 소개 Yek은 저장소나 디렉터리에서 텍스트 파일을 읽고, 청크화하여 대규모 언어 모델(LLM)에서 사용하기 위해 직렬화하기 위한 빠른 Rust 기반 도구입니다. 이 도구는 기본적으로 .gitignore 규칙을 사용하여 불필요한 파일을 건너뛰고, ...
8개월 전
014.4K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 고품질 결과를 생성하기 위해 출력을 검토, 검증 및 서식 지정하는 다중 역할 인텔리전스

종합 소개 Kheish는 구조화된 단계별 협업이 필요한 대규모 언어 모델링(LLM) 작업을 위해 설계된 오픈 소스 다중 역할 에이전트로, 단순한 코디네이터를 넘어 필요에 따라 모듈을 요청하고 사용자 반전 기능을 통합하는 그 자체로 지능적인 에이전트입니다.
8개월 전
013.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: 단편 스토리, 대화 스크립트, 보이스오버, 그래픽을 생성하는 다목적 AI 콘텐츠 제작 툴입니다.

일반 설명 AI ContentCraft는 텍스트 생성, 음성 합성, 이미지 생성 등을 통합하는 다목적 콘텐츠 제작 도구입니다. 크리에이터가 스토리, 팟캐스트 스크립트, 함께 제공되는 오디오 및 비디오 콘텐츠를 빠르게 생성할 수 있도록 도와줍니다. 이 도구는 여러 언어 변환을 지원하며 일괄적으로 ...
8개월 전
014.3K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: 로컬에서 실행되는 지식 그래프 및 개인용 검색 엔진 구축하기

일반 소개 Unigraph는 사용자에게 개인 생활의 다양한 데이터를 관리하고 검색할 수 있는 통합 작업 공간을 제공하도록 설계된 국내 최초의 범용 지식 그래프 및 개인용 검색 엔진입니다. Unigraph를 통해 사용자는 다양한 소스의 데이터를 통합하여 ...
8개월 전
014.4K
对标 Cursor 的 AI编辑器 Trae 上手体验

Cursor를 벤치마킹한 AI 편집기 Trae 체험하기

중국어 딥 커스터마이징 Trae는 인터페이스나 상호작용, 콘텐츠 등 많은 딥 커스터마이징을 위해 중국 환경을 기반으로 하며, 완전히 중국 문화입니다. VScode 또는 커서 가져오기 구성에서 직접 어려움 없이 사용하고 시작하세요...
3 개월 전
015.5K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

컴피유 디스티 플로우: 워크플로우를 간소화하는 컴피유 사용자 친화적 인터페이스

일반 소개 ComfyUI-disty-Flow는 ComfyUI에 사용자 친화적인 인터페이스를 제공하는 사용자 정의 노드입니다. 이 노드는 워크플로우 생성을 위한 대체 사용자 인터페이스를 제공하여 워크플로우 실행을 단순화하기 위한 것입니다.ComfyUI-disty...
8개월 전
014.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

가장 짧은: 엔드투엔드 테스트에 자연어를 사용하는 AI 자동화 테스트 도구

일반 소개 쇼티스트는 안티워크 팀에서 개발한 AI 기반 자연어 엔드투엔드 테스트 프레임워크입니다. Playwright를 기반으로 구축되었으며 GitHub 통합 및 2단계 인증(2FA)을 지원합니다.Shortest의 주요 기능은 다음과 같습니다.
8개월 전
015.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: AI로 브라우저 자동화 테스트를 구동하는 오픈 소스 플러그인

일반 소개 Midscene.js는 자연어 명령을 통해 웹 페이지를 제어하고, 어설션을 수행하고, 데이터를 추출하는 AI 기반 브라우저 자동화 도구입니다. 이 도구는 Chrome 확장 프로그램, JavaScript SDK 및 YAML 스크립트를 지원하여 UI 측정을 간소화합니다.
8개월 전
019.6K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)

ReadKidz: 캐릭터가 일관된 동화 그림책 만들기, 풍부한 그림책 스타일 템플릿(유료)

일반 소개 ReadKidz는 인공 지능 기술을 사용하여 사용자가 맞춤형 동화책과 애니메이션을 만들 수 있도록 도와주는 혁신적인 플랫폼입니다. 부모, 교사 또는 동화책을 만드는 작가 지망생이든 ReadKidz를 사용하면 고품질의 스토리 콘텐츠를 쉽게 생성할 수 있습니다.
8개월 전
015.3K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

동영상 분석기: 동영상 콘텐츠를 분석하고 자세한 설명을 생성합니다.

종합 소개 비디오 분석기는 컴퓨터 비전, 오디오 트랜스크립션 및 자연어 처리 기술을 결합하여 자세한 비디오 콘텐츠 설명을 생성하는 종합적인 비디오 분석 도구입니다. 이 도구는 비디오에서 주요 프레임을 추출하여 오디오 콘텐츠를 트랜스크립션합니다.
7개월 전
019K
实现 LLM 记忆系统的五种方式

LLM 메모리 시스템을 구현하는 5가지 방법

대규모 언어 모델(LLM) 애플리케이션을 구축할 때 메모리 시스템은 대화 문맥 관리, 장기 정보 저장, 의미 이해를 향상시키는 핵심 기술 중 하나입니다. 효율적인 메모리 시스템은 모델이 긴 대화에서 일관성을 유지하고, 핵심 정보를 추출하며, 과거 대화를 검색할 수 있는 기능까지 갖추는 데 도움이 됩니다.
8개월 전
010K
海螺语音国内上线,可能是最好的中文语音配音产品

콘치 보이스 국내 출시, 최고의 중국어 음성 더빙 제품이 될 수 있습니다.

중국에는 콘텐츠 제작을위한 좋은 더빙 제품이 하나도 없었고, API 만 사용할 수 있거나 제품이 괜찮은 사운드 모델이 괜찮지 않습니다. 예를 들어 해외 ElevenLabs는 영어는 괜찮지 만 중국어는 정말 당기고 있지만 오픈 소스 모델의 주요 문제점은 모델의 품질이 상대적으로 좋지 않다는 것입니다.
8개월 전
010.7K
豆包端到端实时语音大模型上线!智商情商双在线,中文语音对话断崖式领先

빈백 엔드투엔드 실시간 음성 그랜드 모델이 온라인 상태입니다! IQ와 EQ가 모두 온라인 상태이며 중국어 음성 대화가 절벽에서 벗어나고 있습니다!

오늘 빈백 앱은 새로운 종단 간 실시간 음성 통화 기능이 모든 사용자의 테스트를 충족하기 위해 "사전 출시"없이 모든 사람이 무료로 사용할 수있는 전체 볼륨으로 직접 공개되어 공식적으로 온라인에 있다고 발표했습니다. 빈백 실시간 음성 빅 모델 웹 사이트 : https://team.doubao.com ...
8개월 전
011K
为写作话题匹配合适的作家和写作风格

글쓰기 주제에 적합한 작가와 글쓰기 스타일 맞추기

배경 영어권 세계에는 매우 다양한 스타일과 대규모 학습 말뭉치를 갖춘 웹용 글쓰기에 능숙한 작가들로 가득하며, AI는 이들을 모방하는 데 매우 능숙합니다. 이러한 사람들의 글쓰기 스타일을 사용하면 콘텐츠가 더 이해하기 쉽거나 논리적 인 프레임 워크가 있으며 폭발적인 텍스트를 작성하기가 더 쉽습니다. 특징 글쓰기 주제를 입력하면 AI가 가장 일치하는 주제를 자동으로 분석합니다.
6개월 전
011.1K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 대규모 언어 모델의 효율적인 미세 조정 및 학습을 위한 오픈 소스 도구

종합 소개 Unsloth는 대규모 언어 모델(LLM)을 미세 조정하고 학습하기 위한 효율적인 도구를 제공하기 위해 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 라마, 미스트랄, 파이, 젬마 등 잘 알려진 다양한 모델을 지원합니다.Unsloth의...
7개월 전
016.9K
学习:用自然语言执行工作流“状态变更”(状态机)

학습: 자연어(상태 머신)로 워크플로 '상태 변경' 수행하기

배경 고객 서비스 관련 대화 디자인에서는 사용자가 다음 작업을 실행하기 전에 현재 작업의 완료를 확인하도록 해야 하는 경우가 많은데, 이를 위한 두 가지 방법이 있습니다. 1.라우팅 2.프롬프트 1.라우팅 일반적으로 큰 모델에서 사용자의 상태를 파악한 후 해당 노드 서비스를 실행하는데, 이는 '스마트...'를 오케스트레이션하는 것과 동일합니다.
8개월 전
012.4K
Traycer:开发者专用的AI编程助手,具有任务规划与实时代码审查功能

트레이서: 작업 계획 및 실시간 코드 검토 기능을 갖춘 개발자 전용 AI 프로그래밍 도우미

일반 소개 트레이서는 상황에 맞는 코드를 분석하고 실시간으로 검토하여 소프트웨어 개발의 효율성과 품질을 크게 개선하도록 설계된 개발자용 AI 프로그래밍 도우미입니다. Visual Studio Code에 통합되어 있으며 자동으로 작업을 계획할 수 있습니다...
8개월 전
015.8K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: 스마트한 고객 서비스 및 사내 지식창고를 위한 즉시 사용 가능한 AI 지식창고 Q&A 시스템

종합 소개 MaxKB(Max Knowledge Base)는 대규모 언어 모델과 RAG(검색 증강 생성)를 기반으로 하는 오픈 소스 지식 기반 Q&A 시스템입니다. 이 시스템은 지능형 고객 서비스, 기업 내부 지식 기반, 학술 연구 및 교육 및 기타 시나리오에서 널리 사용됩니다.MaxKB...
8개월 전
021.7K
UnDatas.IO:精准解析各类非结构化数据的API服务(付费)

UnDatas.IO: 다양한 유형의 비정형 데이터를 정확하게 파싱하기 위한 API 서비스(유료)

종합 소개 UnDatas.IO는 비정형 데이터 구문 분석 및 처리에 중점을 둔 플랫폼입니다. 고급 기술을 활용하여 문서 레이아웃을 자동으로 인식하고 표, 이미지, 수식, 텍스트를 분류하여 데이터 처리 프로세스를 크게 간소화합니다. 이 플랫폼은 데이터 정렬에 많은 시간을 절약해줄 뿐만 아니라...
8개월 전
012.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: 고품질의 긴 글을 작성하고, 외부 지식을 검색한 다음 이를 반영하여 단계별로 지식 트리를 구축하기 위한 글쓰기 프레임워크입니다.

포괄적인 소개 OmniThink는 인간의 인지 과정의 반복적인 확장과 반영을 모방하여 고품질의 긴 형식의 에세이를 생성하도록 설계된 혁신적인 기계 글쓰기 프레임워크입니다. 이 프레임워크는 지식의 경계를 확장하고 풍부하고 깊이 있는 정보를 생성하는 데 중점을 두며, 이를 위해 다음과 같이 구성됩니다.
8개월 전
013.7K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI 실시간 에이전트: 다중 지능형 신체 음성 인터랙션 애플리케이션(OpenAI 예제)

일반 소개 OpenAI 실시간 에이전트는 OpenAI의 실시간 API를 사용하여 다중 지능형 신체 음성 애플리케이션을 구축하는 방법을 보여주는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 프로젝트는 높은 수준의 지능형 신체 모델(OpenAI Swarm에서 차용)을 제공하여 다음을 수행할 수 있습니다.
7개월 전
012K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: 인물 이미지의 자연광 렌더링(미공개)

일반 설명 SynthLight는 확산 모델에 기반한 인물 사진 재조명 도구입니다. 합성 얼굴 이미지를 다시 렌더링하여 실제 인물 사진에 조명 효과를 조정하는 방법을 학습합니다. 이 도구는 물리적 렌더링 엔진을 사용하여 다양한 조명 조건에서 조명 변환을 시뮬레이션하는 데이터 세트를 생성합니다....
8개월 전
014.6K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, 마크다운으로 이미지 변환, 시각적 모델 고정밀 OCR

일반 소개 Zerox는 시각적 모델을 통해 PDF, DOCX, 이미지 및 기타 문서를 마크다운 형식으로 변환하도록 설계된 오픈 소스 프로젝트입니다. 이 프로젝트는 getomni-ai 팀에 의해 개발되었으며 간단하고 효율적인 OCR(광학 문자 인식) 솔루션을 제공합니다.Ze ...
8개월 전
018.5K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: 동영상 하이라이트를 자동으로 편집하고 전문적인 브이로그를 손쉽게 제작하세요.

종합 소개 AIVLOG는 브이로그 제작자를 위해 설계된 AI 동영상 편집 도구입니다. 동영상 콘텐츠를 자동으로 분석하고 하이라이트를 지능적으로 편집하여 사용자의 편집 시간을 95% 절약할 수 있습니다. 일상 생활, 여행 기록, 대화 등 어떤 영상이든 AIVLOG는 쉽게...
8개월 전
014.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollama 백엔드에 기본적으로 통합되는 미니멀한 엔드포인트 기반 AI 채팅 도구

일반 설명 Charla는 모국어 모델과 대화할 수 있도록 설계된 엔드포인트 기반 채팅 애플리케이션입니다. 이 애플리케이션은 Ollama 백엔드와 통합되어 문맥 인식 대화를 지원하며 채팅 세션을 마크다운 파일로 저장합니다. 사용자는 간단히...
8개월 전
014.3K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: 간소화된 검색 강화 생성 프레임워크, 엔티티 그래프 인덱스 관련 텍스트 블록 리콜

포괄적인 소개 MiniRAG는 이기종 그래프 인덱싱과 경량 토폴로지 강화 검색을 통해 작은 모델에서도 우수한 RAG 성능을 구현하는 것을 목표로 하는 매우 간단한 검색 증강 생성(RAG) 프레임워크입니다. 홍콩대학교 데이터 과학 연구소(HKUDS)에서 개발한 이 프레임워크는 ...
8개월 전
014.7K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: 시각 콘텐츠 분석을 개선하기 위한 이미지 및 비디오 영역 수준 이해를 위한 멀티모달 그랜드 모델

종합 소개 Omni-RGPT는 이미지와 동영상에 대한 영역 수준의 이해를 가능하게 하도록 설계된 멀티모달 대규모 언어 모델입니다. 토큰 마크 기술을 도입함으로써 Omni-RGPT는 시각적 특징 공간에서 영역 단서(예: 상자 또는...)로 대상 영역을 강조 표시할 수 있습니다.
8개월 전
013.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

베일링: 자연스러운 대화와 커뮤니케이션을 위한 저지연 오픈 소스 음성 대화 도우미

개요 Bailing(베일링)은 음성을 통해 사용자와 자연스럽게 대화할 수 있도록 설계된 오픈 소스 음성 대화 어시스턴트입니다. 이 프로젝트는 음성 인식(ASR), 음성 활동 감지(VAD), 대규모 언어 모델링(LLM) 및 음성 합성(TTS) 기술을 결합하여 다음과 같은 목표를 달성합니다.
8개월 전
015.6K
元界AI:开源版AI数字人克隆与短视频生成工具

메타버스 AI: AI 디지털 인간 복제 및 짧은 동영상 생성 도구의 오픈 소스 버전

종합 소개 메타버스 AI(오픈소스 버전)는 libn-net 팀에서 개발한 GitHub에서 호스팅되는 프로젝트입니다. AI 기술을 통해 디지털 사람의 이미지와 음성을 복제하여 짧은 동영상을 생성할 수 있으며, 더빙과 자막도 지원합니다. 이 도구는 Windo...
6개월 전
013.8K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: Wikipedia 데이터를 사용하여 지식을 검색할 수 있는 채팅 도구

일반 소개 위키챗은 스탠포드 대학교에서 개발한 실험적인 챗봇으로, 위키백과에서 데이터를 검색하여 대규모 언어 모델의 사실성을 개선하는 것을 목표로 합니다. 대규모 언어 모델(예: ChatGPT 및 GPT-4)은 최신 정보나 덜 인기 있는 주제를 처리하는 경향이 있습니다.
8개월 전
013.6K
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型

알리바바 AI 연구소, 향상된 스트리밍 음성 합성 모델인 CosyVoice 2 출시

1.개요 최근 몇 년 동안 음성 합성 기술은 특히 자연스럽고 부드러운 실시간 음성 생성을 달성하는 데 있어 상당한 발전을 이루었습니다. 그러나 실제 애플리케이션에서는 지연 시간, 발음 정확도, 화자 일관성 등의 문제가 여전히 업계를 괴롭히고 있으며, 특히 반응성이 매우 중요한 스트리밍 애플리케이션에서는 더욱 그렇습니다.
8개월 전
010K