AIシェアリングサークル

最新のAI製品、プロジェクト、フレームワーク、論文解釈などを毎日共有〜。
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Racerのマルチモーダル音声生成モデル

AudioGen-Omniは、Racerのマルチモーダルオーディオ生成モデルで、ビデオやテキストなどの入力に基づいて高品質のオーディオ、スピーチ、歌を生成します。AudioGen-Omniは、マルチモーダル拡散トランスフォーマーや位相整合トランスフォーマーなどの高度な技術に基づいています。
8ヶ月前
047.6K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
8ヶ月前
044.7K
FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - Baiduの高性能大規模モデル推論・展開ツール

FastDeployはFlying Paddle (PaddlePaddle)フレームワークに基づいて開発され、様々なハードウェアプラットフォームをサポートしています。
8ヶ月前
045.7K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
8ヶ月前
045K
DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - マイクロソフトのゼロサンプル音声合成モデル

DragonV2.1は、マイクロソフト社の先進的なゼロサンプル音声合成(TTS)モデルです。Transformerアーキテクチャをベースとしたこのモデルは、多言語およびゼロサンプル音声クローンをサポートし、わずか5~90秒の音声プロンプトで自然で表現力豊かな音声を生成します。
8ヶ月前
043.1K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - オープンソースUIスクリーンショット生成フロントエンドコードツール

ScreenCoderは、UIデザインのスクリーンショットを高品質のHTML/CSSコードに素早く変換できるオープンソースのスマートツールです。モジュラー・マルチ・インテリジェンス・アーキテクチャをベースに、ビジュアル理解、レイアウト・プランニング、コード合成技術を組み合わせたツールで、高精度でセマンティックなフロントエンド・コードの生成をサポートします。
8ヶ月前
054.6K
Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型

キミ K2 ハイスピード・エディション - ダークサイド・オブ・ムーン・キミがリリースした言語モデルのハイスピード・エディション。

君K2高速版(きみK2-turbo-preview)は、月の裏側君によって導入された高性能言語モデルである。Kimi K2をベースに最適化されたモデルで、出力速度が大幅に向上し、1秒間に40トークンを生成することができます...
8ヶ月前
060.7K
dots.ocr - 小红书hi lab推出的开源多语言文档解析模型

dots.ocr - Little Red Book hi lab によるオープンソースの多言語文書解析モデル

dots.ocrは、Xiaohongshu hi研究室によってオープンソース化された多言語文書解析モデルで、17億パラメータの視覚言語モデル(VLM)に基づいており、読み順を維持しながら文書のレイアウト検出と内容認識を効率的に行うことができます。
8ヶ月前
066.7K
HYPIR - 中国科学院团队推出的新型图像复原大模型

HYPIR - 中国科学院のチームが導入した画像復元のための新しい大規模モデル

HYPIRは、中国科学院深圳先端技術研究所のDong Chaoのチームによって導入された、画像復元のための大規模なモデルである。HYPIRは、テキストを明瞭に保ちながら、古い写真を素早く復元し、解像度を向上させることができる。
8ヶ月前
055.8K
FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型

FLUX.1 Krea [dev] - 黒い森とKrea AIジョイント・ベンチャリング・グラフ・モデル

FLUX.1 Krea [dev]は、Black Forest LabsとKrea AIによるテキスト生成グラフィカルモデルです。このモデルは、入力されたテキスト記述に基づいて、高品質でリアルな画像を生成し、従来のA...
8ヶ月前
050.8K