AIシェアリングサークル

最新のAI製品、プロジェクト、フレームワーク、論文解釈などを毎日共有〜。
通义DeepResearch - 阿里通义开源的深度研究智能体

Tongyi DeepResearch - アリ・トンイ オープンソース・ディープリサーチ インテリジェンス機関

Tongyi DeepResearch(同義ディープリサーチ)は、アリババが立ち上げたオープンソースのインテリジェントボディで、深い情報検索と複雑なタスクの推論のために設計され、300億のパラメータを持ち、ReActモードと深度モードを含む複数の推論モードをサポートする...
2ヶ月前
024.2K
OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

OpenAIの「AI時代を先取りするためのPDFガイド」 - ダウンロードリンク付き

AIの時代に先んじる」は、ビジネスリーダーがAIの時代において競争力を維持するためのOpenAIのAIリーダーシップガイドである。このガイドでは、AIの急速な成長を指摘し、より速いモデルリリース、より低いコスト、より速い企業導入...
2ヶ月前
020.8K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

浙江大学から大型モデルの基礎の無料PDF - ダウンロードリンク付き

ファンダメンタルズ・オブ・ラージ・モデルは、ラージ・ランゲージ・モデル(LLM)のコア技術と実用的な道筋を詳細に分析する。言語モデリングの基礎理論から始まり、統計的、リカレントニューラルネットワーク(RNN)、トランスフォーマーアーキテクチャに基づくモデル設計の原理を、3つの主要な大規模言語モデルに焦点を当てて体系的に解説しています。
2ヶ月前
021.5K
LLaSO - 逻辑智能推出的业界首个全面开源的语音模型

LLaSO - ロジックインテリジェンスによる業界初の完全オープンソース音声モデル

LLaSOは、北京深層論理知能科技有限公司によって発表されたオープンソースの音声モデルで、音声データとテキストデータを統合し、アライメントデータセット、コマンド微調整データセット、評価ベンチマークを提供することで、大規模音声言語モデリングの分野におけるデータの分散と不十分なタスクカバレッジの問題を解決します。
2ヶ月前
014K
混元3D 3.0 - 腾讯推出的3D生成模型,支持超高清建模

Hybrid 3D 3.0 - UHDモデリングに対応したTencentの3D生成モデル

ハイブリッド3D 3.0は、3D-DiT階層造形技術に基づくテンセントの先進的な3D生成モデルで、最大1536³の幾何学的解像度を持ち、超高精細でディテールに富んだ3Dモデルを生成でき、五感や体型を正確に造形できるなど、キャラクターモデリングに優れている。
2ヶ月前
024.3K
Mini-o3 - 字节、港大联合开源的视觉推理模型

Mini-o3 - バイト、HKU共同オープンソース視覚推論モデル

Mini-o3は、ByteDanceと香港大学が共同で立ち上げたオープンソースモデルで、複雑な視覚探索問題の解決に焦点を当てている。このモデルは、強力な多ラウンド対話型推論機能を持ち、深い探索と試行錯誤を通じてターゲットを見つけることができる。
2ヶ月前
018.1K
GPT-5-Codex - OpenAI推出的最强编程模型

GPT-5-Codex-OpenAIが導入した最強のプログラミングモデル

GPT-5-Codexは、OpenAIの強力なプログラミング最適化モデルで、GPT-5によってさらに強化され、ソフトウェアエンジニアのために設計されています。このモデルは、高品質なコードを迅速に生成し、複数のプログラミング言語をサポートし、パフォーマンスを向上させるために既存のコードを最適化します。
2ヶ月前
015.8K
MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 - MiniMaxの最新AI音楽生成モデル!

MiniMax Music 1.5は、ユーザーの自然言語による記述に基づいて最大4分の音楽を生成する、高度なAI音楽生成ツールです。このモデルは、幅広い音楽スタイルとムードのカスタマイズをサポートし、自然で完全なボーカルトーン、スムーズなトランジション、豊かなレイヤーアレンジを生成します...
2ヶ月前
019.3K
AnyI2V - 复旦联合阿里达摩院等开源的智能图像动画生成框架

AnyI2V - FudanとAli Dharma Instituteとその他のオープンソースインテリジェント画像アニメーション生成フレームワーク

AnyI2Vは復旦大学、Alibaba Darmo Academyなどが共同で立ち上げた画像アニメーション生成フレームワークで、複雑な学習プロセスや大量のデータを必要とせずに、静的な条件画像(グリッド、点群など)を動的な動画に変換することをサポートする。
2ヶ月前
016.9K
SRPO - 腾讯混元推出的文本到图像生成模型

SRPO - テンセントハイブリッドがテキスト画像生成モデルを発表

SRPO(Semantic Relative Preference Optimization)は、Tencent Mixed Metaによって導入されたテキストから画像への生成モデルであり、報酬のオンライン調整を達成し、オフラインの微調整依存性を低減するために、テキスト条件信号を通じて報酬メカニズムを最適化する。
2ヶ月前
028.7K