AIシェアリングサークル

ポーンをアーチにしてキングをシェアするデイ!
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)

1-2-1-MNVTON:効率的な映像、映像の中の人によるバーチャル試着(開設予定)

概論 1-2-1-MNVTON はGitHubベースのオープンソースプロジェクトで、「Modality-specific Normalization for Virtual Try-On」(MNVTON)技術を提供することを目的としています。
1年前
048.9K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介 ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。
1年前
0103K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。
1年前
074.6K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: ハイライトビデオを自動的に編集し、簡単にプロフェッショナルなVlogを作成します。

総合紹介 AIVLOGはVlogクリエーターのために設計されたAIビデオ編集ツールです。自動的にビデオコンテンツを分析し、インテリジェントにハイライトを編集することができ、ユーザーは95%編集時間を節約できます。日常生活のビデオ、旅行記録、会話など、AIVLOGは簡単に...
1年前
063.6K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
1年前
059.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

ウィンドサーフ・ウェーブ2メジャー・アップデート:エンタープライズ・ハイブリッド展開版にウェブ検索と自動メモリーを導入

Codeiumは最近、Windsurf Wave 2アップデートを展開し、ウェブ検索、自動メモリ、コード実行の最適化など、いくつかの重要な機能アップグレードを開発者に提供した。トップ2のAIコーディングツールとして、これらのアップデートは20...
1年前
050.1K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

GoogleがVertex AI RAGエンジンをリリース:信頼性の高い検索機能付きジェネレーティブ・アプリケーションを構築するためのワンストップ・ショップ

生成AIと大規模言語モデリング(LLM)は産業を変革しているが、2つの重要な課題が企業の採用を妨げている:幻滅(不正確または無意味な情報の生成)と学習データ以外の限られた知識。検索補強型生成(RAG)と接地...
1年前
050.7K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは、極めてシンプルなRAG(Retrieval Augmented Generation)フレームワークであり、ヘテロジニアスグラフインデキシングと軽量なトポロジー拡張検索によって、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究室(HKUDS)によって開発され、...
1年前
061.4K
Perplexity AI 提出与美国 TikTok 合并(收购)的竞标方案

Perplexity AI、米TikTokとの合併(買収)に名乗り

要旨:Perplexity AIは土曜日にTikTokの親会社であるByteDanceに、PerplexityがTikTokの米国事業と合併することを提案する入札書を提出した。 事情に詳しい関係者が明らかにした。
1年前
040.8K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによるビジュアルコンテンツ分析の強化

包括的な紹介 Omni-RGPTは、画像や動画の領域レベルでの理解を可能にするために設計されたマルチモーダルな大規模言語モデルである。トークンマークテクニックを導入することで、Omni-RGPTは、視覚特徴空間内のターゲット領域を領域キュー(例えば、ボックスや...
1年前
061.9K