AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1
全27記事

Tags: ビッグモデル微調整

MiniMind-V:1小时训练26M参数视觉语言模型-首席AI分享圈

MiniMind-V:26Mパラメトリック視覚言語モデルの1時間トレーニング

概要 MiniMind-V は、GitHub でホストされているオープンソースプロジェクトで、わずか 2600 万のパラメータを持つ軽量な視覚言語モデル(VLM)を 1 時間以内に学習できるように設計されています。MiniMind 言語モデル、新しいビジュアルコーダーと特徴投影モジュール、画像とテキストの関連付けのサポート...をベースにしています。

DeepCoder-14B-Preview:擅长代码生成的的开源模型-首席AI分享圈

DeepCoder-14B-Preview:コード生成に優れたオープンソースモデル

概要 DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qwen-14Bをベースに、分散強化学習(RL)技術によって最適化されており、最大64Kトークンの超...

WeClone:用微信聊天记录和语音训练数字分身-首席AI分享圈

WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャットログと音声メッセージを大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使用して、リアルな声クローンを生成することができます...

Search-R1:强化学习训练大模型搜索与推理的工具-首席AI分享圈

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)のテクニックを使って大規模言語モデル(LLM)を学習し、モデルが自律的に推論を学習し、問題を解決するために検索エンジンを呼び出すことを可能にします。このプロジェクトはQwen2.5をサポートしています。

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するためにAIを訓練することです。このプロジェクトには、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリが含まれており、ユーザは...

Bonsai:适合边缘设备运行的三值权重语言模型-首席AI分享圈

Bonsai: エッジデバイスでの操作に適した3値重み付き言語モデル

一般的な紹介 Bonsaiはdeepgrove-aiによって開発されたオープンソースの言語モデルで、3項重みを使用し、パラメータサイズは5億である。LlamaアーキテクチャとMistral分類器をベースにしており、3値重みをサポートするように線形レイヤーが調整されています。このモデルは主にDCLM...

Second Me:本地训练拥有个人记忆和习惯的AI分身-首席AI分享圈

セカンド・ミー:個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するスマート・アシスタントに変えることができる。その最大の特徴は、すべての数字...

Easy Dataset:创建大模型微调数据集的简易工具-首席AI分享圈

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル(LLM)のファインチューニングのために特別に設計されたオープンソースツールで、GitHubでホストされています。ユーザーがファイルをアップロードし、コンテンツを自動的に分割し、質問と回答を生成し、最終的にファインチューニングに適した構造化データセットを出力できる、使いやすいインターフェースを提供します。オープン ...

MM-EUREKA:探索视觉推理的多模态强化学习工具-首席AI分享圈

MM-EUREKA:視覚的推論を探求するマルチモーダル強化学習ツール

MM-EUREKAは、上海交通大学の上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルによる画像とテキスト情報の処理を支援する。このツールの主な目的は、画像やテキスト情報を処理するモデルを改善することである。

AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包-首席AI分享圈

オストリスによるAIツールキット:FLUX.1モデルトレーニングツールキットによる安定した拡散

概 要 AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに特化したオープンソースのAIツールセットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者に柔軟なモデルマイクロ...

X-R1:在普通设备中低成本训练0.5B模型-首席AI分享圈

X-R1:一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づくモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトは、DeepSeek-R1とopen-r1にインスパイアされ、...

OpenManus-RL:微调大模型强化智能体推理与决策能力-首席AI分享圈

OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化

一般的な紹介 OpenManus-RLは、UIUC-UlabとMetaGPTコミュニティのOpenManusチームによって共同開発されたオープンソースプロジェクトで、GitHubでホストされています。このプロジェクトは、強化学習(RL)技術を通じて、Deepseek-R1、QwQ-32Bに基づく大規模言語モデル(LLM)知能の推論および意思決定能力を強化します。...

TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架-首席AI分享圈

TPO-LLM-WebUI:質問を入力してリアルタイムにモデルを学習し、結果を出力できるAIフレームワーク。

包括的な紹介 TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル(LLM)のリアルタイム最適化を可能にします。TPO (Test-Time Prompt Optimisation)フレームワークを使用し、従来の微調整の退屈なプロセスに完全に別れを告げます...

Open-Reasoner-Zero:开源大规模推理强化学习训练平台-首席AI分享圈

Open-Reasoner-Zero:オープンソースの大規模推論強化学習トレーニングプラットフォーム

概論 Open-Reasoner-Zeroは強化学習(RL)研究に焦点を当てたオープンソースプロジェクトで、GitHub上のOpen-Reasoner-Zeroチームによって開発されています。効率的でスケーラブル、かつ使いやすい学習フレームワークを提供することで、人工知能分野の研究プロセスを加速させることを目的としており、特にパス...

中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集-首席AI分享圈

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究を支援するために設計された、110Kのデータ項目を含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的データだけでなく、論理的推論などの一般的なデータも多数含まれている。

ColossalAI:提供高效大规模AI模型训练解决方案-首席AI分享圈

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIはモデルの学習と推論を大幅に削減することができます...

One Shot LoRA:快速生成视频 LoRA 模型的全能平台-首席AI分享圈

ワンショットLoRA:迅速なビデオLoRAモデル生成のためのオールインワンプラットフォーム

概要 One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データを保存することなく、動画から高品質なLoRAモデルを迅速かつ簡単にトレーニングすることができます。このプラットフォームは、Hunyuan Video、FLUX、SDXLをサポートしています。

Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型-首席AI分享圈

Kiln: シンプルなLLMモデルの微調整とデータ合成ツール!

包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxに対応した直感的なデスクトップアプリケーションを提供し、Llama、GPT4o、Mixtralなどのモデルをゼロコードで実装することができます。

Maestro:简化主流开源视觉语言模型微调过程的工具-首席AI分享圈

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化・高速化し、誰もが独自の視覚マクロモデルをトレーニングできるようにします。Florence-2、PaliGemma ...などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。

ja日本語