AIシェアリングサークル

最新のAI製品、プロジェクト、フレームワーク、論文解釈などを毎日共有〜。

文285 ウェブアドレス49 書籍0 ハードウェア0 解説0

出版285

gpt-oss - OpenAIによるオープンソースの推論モデルファミリー

gpt-ossはOpenAIのオープンソース推論モデルファミリーで、開発者向けに効率的で柔軟かつ容易に導入できるAIソリューションを可能にします。

最新のAIリソース

12ヶ月前

062.4K

MiDashengLM - シャオミのオープンソース音理解モデル

MiDashengLMは、Xiaomiのオープンソースの効率的なサウンド理解のための大規模なモデルであり、特定のパラメータバージョンMiDashengLM-7Bは、オーディオ処理と理解に焦点を当てています。このモデルは、Xiaomi DashengオーディオエンコーダとQwen2.5-オム...

最新のAIリソース

12ヶ月前

067.8K

MOSS-TTSD - 清華研究所のオープンソース二ヶ国語対話音声生成モデル

MOSS-TTSDは清華大学のSpeech and Language Labによって開発されたオープンソースの音声対話モデルです。MOSS-TTSDはテキスト対話スクリプトを自然で滑らかな表現力豊かな対話音声に変換することができ、英語と中国語のバイリンガル生成に対応しています。

最新のAIリソース

12ヶ月前

068.7K

AudioGen-Omni - Racerのマルチモーダル音声生成モデル

AudioGen-Omniは、Racerのマルチモーダルオーディオ生成モデルで、ビデオやテキストなどの入力に基づいて高品質のオーディオ、スピーチ、歌を生成します。AudioGen-Omniは、マルチモーダル拡散トランスフォーマーや位相整合トランスフォーマーなどの高度な技術に基づいています。

最新のAIリソース

12ヶ月前

067K

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。

最新のAIリソース

12ヶ月前

060.6K

FastDeploy - Baiduの高性能大規模モデル推論・展開ツール

FastDeployはFlying Paddle (PaddlePaddle)フレームワークに基づいて開発され、様々なハードウェアプラットフォームをサポートしています。

最新のAIリソース

12ヶ月前

065.6K

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。

最新のAIリソース

12ヶ月前

066.1K

DragonV2.1 - マイクロソフトのゼロサンプル音声合成モデル

DragonV2.1は、マイクロソフト社の先進的なゼロサンプル音声合成（TTS）モデルです。Transformerアーキテクチャをベースとしたこのモデルは、多言語およびゼロサンプル音声クローンをサポートし、わずか5～90秒の音声プロンプトで自然で表現力豊かな音声を生成します。

最新のAIリソース

12ヶ月前

060.9K

ScreenCoder - オープンソースUIスクリーンショット生成フロントエンドコードツール

ScreenCoderは、UIデザインのスクリーンショットを高品質のHTML/CSSコードに素早く変換できるオープンソースのスマートツールです。モジュラー・マルチ・インテリジェンス・アーキテクチャをベースに、ビジュアル理解、レイアウト・プランニング、コード合成技術を組み合わせたツールで、高精度でセマンティックなフロントエンド・コードの生成をサポートします。

最新のAIリソース

12ヶ月前

075.7K

キミ K2 ハイスピード・エディション - ダークサイド・オブ・ムーン・キミがリリースした言語モデルのハイスピード・エディション。

君K2高速版（きみK2-turbo-preview）は、月の裏側君によって導入された高性能言語モデルである。Kimi K2をベースに最適化されたモデルで、出力速度が大幅に向上し、1秒間に40トークンを生成することができます...

最新のAIリソース

1年前

078.2K