AIシェアリングサークル

最新のAI製品、プロジェクト、フレームワーク、論文解釈などを毎日共有〜。
星流Agent - Liblib推出的AI一站式设计Agent

Starstreamエージェント - LiblibのAIワンストップデザインエージェント

StarFlowエージェントは、Liblibによって中国ユーザーのために設計されたワンストップのクリエイティブデザインエージェントです。StarFlowエージェントは、Lovartのフルスタックインテリジェントデザイン機能を継承し、中国語の意味論、東洋の美学、ローカルシナリオに完全に適応します。ユーザーは文章を入力するだけで、Agen...
7ヶ月前
043.5K
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度、動画生成のビッグモデルを発表

MuseSteamerは、百度が発表したマルチモーダル動画生成のための大型モデルである。このモデルは、ユーザーから提供されたテキスト説明や画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することができ、さまざまなシナリオでの作成のニーズを満たすために、様々な透明性と機能のバージョンをサポートしています。
7ヶ月前
035.3K
绘想 - 百度推出的AI视频生成平台

絵画思考 - 百度がAI動画生成プラットフォームを発表

Paintingは百度が発表したAI動画生成プラットフォームで、AI技術に基づいて、ユーザーが簡単にパーソナライズされた動画を作成できるようにする。直感的なインターフェイス、強力なツール、インスピレーションの推薦機能を備えたペインティングは、クリエイターに創造的なインスピレーションを提供することができ、同じ操作のキーをサポートし、迅速に類似したビデオを生成することができ、創造的なプロセスを簡素化します。
7ヶ月前
036.4K
GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列

GLM-4.1V-Thinking - Smart Spectrum AIによるオープンソース視覚言語モデルシリーズ

GLM-4.1V-Thinkingは、Smart Spectrum AIによって導入されたオープンソースの視覚言語モデルであり、複雑な認知タスクのために設計されている。GLM-4Vアーキテクチャに基づき、このモデルは思考の連鎖を導入...
7ヶ月前
037.3K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - オーディオ・ジェネレーション・モデリング from Ali Tongyi

ThinkSoundは、アリ・トンイのスピーチチームが初めて導入したCoT(連鎖思考)音声生成モデルです。このモデルは、CoT推論の導入に基づいて、従来の技術では画面の動的な詳細や空間的な関係をキャプチャすることが困難であるという問題を解決するために、ビデオ画像に正確に一致する効果音を生成することができます。
7ヶ月前
034.3K
Qwen-TTS - 阿里通义千问推出的语音合成模型

Qwen-TTS - Ali Tongyi Qianqianによる音声合成モデル

Qwen-TTSはAli Tongyiによって導入された先進的な音声合成モデルである。テキストを自然で滑らかな音声に効率的に変換することができ、北京語、英語、北京方言など複数の言語や方言をサポートし、異なる地域やシーンのニーズに応えます。膨大なコーパスの訓練に基づき、このモデルの音声出力は高品質で、韻を踏...
7ヶ月前
038.8K
MultiAgentPPT - 开源的AI演示文稿生成系统

MultiAgentPPT - オープンソースのAIプレゼンテーション生成システム

MultiAgentPPTは、オープンソースのマルチインテリジェントAIプレゼンテーション生成システムです。ユーザーは主題を入力するだけで、システムはマルチインテリジェントなコラボレーションに基づいており、自動的にアウトラインの生成、主題の分割、並列調査とコンテンツの要約と他のステップを完了し、迅速に高品質のPPTを生成します。
7ヶ月前
038.1K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1-アリが発表したマルチモーダル統一AIモデル

Ovis-U1は、アリババグループのOvisチームによって導入されたマルチモーダル統一モデルで、パラメータ規模は30億である。このモデルは、マルチモーダル理解、テキストから画像への生成、画像編集の3つのコア機能を持ち、先進的なアーキテクチャ設計と協調的かつ統一的なトレーニングメソッドにより、忠実度の高い画像の実現をサポートする。
7ヶ月前
034.1K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。
7ヶ月前
036.1K
迅雷MCP - 迅雷推出的AI自动下载服务

迅雷MCP - 迅雷がAI自動ダウンロードサービスを開始

Xunlei MCPは、Xunleiが開始した、AI技術に基づく自動ダウンロードサービスです。このサービスをサポートするAIアプリケーションのユーザーは、音声またはテキスト入力でダウンロードを要求すると、AIが自動的にネットワークリソースを検索し、ダウンロードを開始することができます。Xunlei MCPはPC版XunleiとNAS版Xunleiをサポートし、従来のダウンロードモードを打破する。
7ヶ月前
040.5K