AIシェアリングサークル

AIは世界を変えようとしている!
UnifiedTTS - 一站式TTS API服务平台,实时性能监控

UnifiedTTS - ワンストップTTS APIサービスプラットフォーム、リアルタイムパフォーマンス監視

UnifiedTTSは音声合成(TTS)サービスのワンストッププラットフォームです。中国語、英語、日本語、韓国語を含む多言語をサポートし、グローバルビジネスのニーズに応えます。統一されたAPIインターフェイスを通じて、Micro...
1ヶ月前
014.5K
MiniCPM 4.1 - 面壁智能推出的超高效端侧大模型

MiniCPM 4.1 - Facing Face Intelligenceによる超高効率エンドサイドマクロモデリング

MiniCPM4.1は、Facade Intelligenceが導入した超高効率エンドサイド大規模言語モデルです。InfLLM v2スパース・アテンション・アーキテクチャにより、各辞素は5%個以下の語彙との相関を計算するだけでよく、長文の処理オーバーヘッドを大幅に削減します。128K長文のシナリオでは...
1ヶ月前
013.7K
WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - Tencent WeChatオープンソースドキュメント理解と意味検索フレームワーク

WeKnoraはTencent WeChatチームのオープンソースで、Large Language Model (LLM)文書理解と意味検索フレームワークに基づいており、複雑な異種文書コンテンツシナリオの構造のために設計され、モジュラーアーキテクチャを使用するように設計されており、マルチモーダル前処理、セマンティックベクターインデキシング、インテリジェントリコールと大規模なモデルの生成推論の統合...
1ヶ月前
017.7K
XTuner V1 - 上海AI Lab开源的大模型训练引擎

XTuner V1 - Shanghai AI Lab オープンソース大規模モデルトレーニングエンジン

XTuner V1は、上海人工知能研究所によってオープンソース化された新世代の大規模モデル学習エンジンであり、超大規模スパース混合エキスパート(MoE)モデル学習用に設計されている。PyTorch FSDPをベースに開発され、メモリ、通信、負荷の多次元最適化により高性能を実現しています。
1ヶ月前
013.4K
Qwen3-ASR-Flash - 阿里通义千问推出的系列语音识别模型

Qwen3-ASR-Flash - Ali Tongyi Qianqianが発表した一連の音声認識モデル。

Qwen3-ASR-Flashは、Qwen3のベースモデルをベースに、膨大なマルチモーダルデータで学習させたアリババの最新の高精度音声認識モデルです。北京語、四川語、閩南語、呉語、広東語、その他の方言を含む11の言語と複数のアクセントをサポートしています。
1ヶ月前
016.1K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Tongyi Qianqianのフラッグシップ・ビッグ言語モデル

Qwen3-Max-Previewは、Tongyi Qianwenがリリースした最新のフラッグシップ大規模言語モデルです。Qwen3ファミリーの中で最大のパラメータ数を持つモデルであり、パラメータサイズは1兆を超える。推論、命令追従、多言語サポート、ロングテール知識カバレッジが大幅に改善されています。
1ヶ月前
016.9K
OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - Meituanと上海交通大学のオープンソース・マルチモーダルモデル

OneCATは、Meituanが上海交通大学と共同で発表した新しい統一マルチモーダルモデルで、マルチモーダル理解、テキスト画像生成、画像編集機能をシームレスに統合した純粋なデコーダーアーキテクチャを採用している。このモデルは、外部の視覚コーダーや曖昧性解消器に依存する従来のマルチモーダルモデルの設計を放棄し、モダリティに特化した...
1ヶ月前
013.3K
Claudable - 开源AI Web应用构建器,自然语言生成代码

Claudable - オープンソースAIウェブアプリケーションビルダー、自然言語生成コード

Claudableは、Next.jsをベースにしたオープンソースのウェブアプリビルダーです。Claude CodeとCursor CLIの高度なAIエージェント機能と、Lovableのシンプルで直感的なアプリ構築体験を組み合わせています。
1ヶ月前
015K
FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - Hugging Faceがオープンソースの視覚言語データセットを発表

FineVisionは、高度な視覚言語モデルをトレーニングするためのHugging Faceのオープンソースの視覚言語データセットです。1,730万枚の画像、2,430万個のサンプル、8,890万ラウンドの対話、95億個のアンサートークンが含まれています。このデータセットは...
1ヶ月前
013.3K
HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager-テンセントオープンソースの超長距離ローミングワールドモデル

HunyuanWorld-Voyager(略してHunyuan Voyager)は、テンセントがリリースした業界初のネイティブ3D再構成をサポートする超長距離ローミングワールドモデルである。1枚の画像からユーザーが定義したカメラパスの3D点群シーケンスを生成する新しいビデオ拡散フレームワークであり、...
1ヶ月前
016K