
中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート
包括的な紹介 中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究を支援するために設計された、110Kのデータ項目を含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的データだけでなく、論理的推論などの一般的なデータも多数含まれている。
包括的な紹介 中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究を支援するために設計された、110Kのデータ項目を含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的データだけでなく、論理的推論などの一般的なデータも多数含まれている。
包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIはモデルの学習と推論を大幅に削減することができます...
中国でのカーソル! バイトジャンプ、クロード3.5ソネットやGPT-4oのような強力なAIモデルを組み込んだTraeを発表! ワンクリックで画像に透かしを入れたいですか? エクセルの自動化スクリプトをカスタマイズしたいですか? オンライン履歴書ウェブサイトを10分で構築したいですか? Trae AIは、これらすべてを無料でお手伝いします! プログラミングの基礎がなくても、今すぐTrae AIを体験し、AIがあなたのユーティリティ開発を10倍の効率でお手伝いします! 無料トライアルをクリックして、重複労働に別れを告げ、爆発的な効率化を歓迎し、あなたの能力を即座に現金化しましょう!
概要 One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データを保存することなく、動画から高品質なLoRAモデルを迅速かつ簡単にトレーニングすることができます。このプラットフォームは、Hunyuan Video、FLUX、SDXLをサポートしています。
包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxに対応した直感的なデスクトップアプリケーションを提供し、Llama、GPT4o、Mixtralなどのモデルをゼロコードで実装することができます。
包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化・高速化し、誰もが独自の視覚マクロモデルをトレーニングできるようにします。Florence-2、PaliGemma ...などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
概要 LlamaEdgeは、ローカルまたはエッジデバイス上で大規模な言語モデル(LLM)を実行し、微調整するプロセスを簡素化するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama2ファミリーのモデルをサポートし、ユーザーが簡単にLLM推論アプリケーションを作成し、実行できるようにするOpenAI互換のAPIサービスを提供します。
包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルを幅広くサポートしています。Unslothの主な特徴は、メモリ使用量を大幅に削減し、学習を高速化できることです。
概要 Bakeryは、AIスタートアップ、機械学習エンジニア、研究者向けに設計されたプラットフォームで、シンプルで効率的なAIモデルの微調整と収益化サービスを提供します。Bakeryを利用することで、ユーザーはコミュニティ主導のデータセットにアクセスしたり、独自のデータセットを作成またはアップロードしたり、モデルの設定を微調整したり、マーケティングしたりすることができます。
包括的な紹介 NVIDIA Garakは、大規模言語モデル(LLM)の脆弱性を検出するために特別に設計されたオープンソースツールです。Garakは、静的、動的、適応的なプロービングを通じて、イリュージョン、データ漏洩、ヒントインジェクション、エラーメッセージの生成、有害なコンテンツの生成など、複数の弱点についてモデルをチェックします。
包括的な紹介 ModelScope Swift(略してMS-Swift)は、大規模モデル(LLM)とマルチモーダル大規模モデル(MLLM)の微調整、推論、評価、およびデプロイのために設計された効率的な軽量インフラストラクチャです。このフレームワークは、400以上のLLMと100以上のMLLMをサポートし、モデルのトレーニングから評価まですべてを提供します。
概要 LLaMA-Factoryは、100以上の大規模言語モデル(LLM)の柔軟なカスタマイズと効率的な学習をサポートする、統一された効率的なファインチューニングフレームワークです。組み込みのLLaMA Boardウェブインターフェースを介して、ユーザーはコードを書くことなくモデルを微調整することができます。このフレームワークには、さまざまな高度なトレーニング...
一般的な紹介 Petalsは、BigScienceワークショップによって開発されたオープンソースプロジェクトで、分散コンピューティングアプローチによって大規模言語モデル(LLM)を実行します。ユーザーは、Llama 3.1、Mixtral、F...などのコンシューマーグレードのGPUやGoogle Colabを使って、自宅でLLMを実行し、微調整することができます。