AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計928記事

タグ: AIのオープンソースプロジェクト 8ページ

Story-Flicks:输入主题自动生成儿童短故事视频-首席AI分享圈

Story-Flicks:トピックを入力することで、子供向けのショートストーリービデオが自動生成される。

包括的な紹介 Story-Flicksは、ユーザーがHDストーリービデオを素早く生成することに焦点を当てたオープンソースのAIツールです。ユーザーはストーリーのトピックを入力するだけで、システムは大規模な言語モデルを通してストーリーコンテンツを生成し、AIが生成した画像、音声、字幕を組み合わせて完全なビデオ作品を出力します。プロジェクト終了後

基于Qdrant向量搜索引擎构建的MCP服务-首席AI分享圈

Qdrantベクトル検索エンジン上に構築されたMCPサービス

包括的な紹介 mcp-server-qdrant は、Qdrant ベクトル検索エンジン上に構築されたモデルコンテキストプロトコル (MCP) サーバーです。主にAIシステムが記憶を保存したり検索したりするのに使われ、特にセマンティック検索を必要とするシナリオに適しています。このツールは、情報をベクトルに変換する...

R1-Omni:通过视频和音频分析情感的开源模型-首席AI分享圈

R1-Omni: ビデオと音声による感情分析のためのオープンソースモデル

はじめに R1-Omniは、HumanMLLMチームによってGitHubで立ち上げられたオープンソースプロジェクトです。これは、検証可能な報酬による強化学習(RLVR)技術を、感情認識に焦点を当てたマルチモーダル大規模言語モデルに適用した最初のプロジェクトです。このプロジェクトでは、動画と音声データを解析して、怒りや早口言葉などの登場人物の感情を識別する。

飞桨 PP-TableMagic:复杂表格结构化信息提取神器-首席AI分享圈

フライング・パドル PP-TableMagic: 複雑なテーブルの構造化情報抽出

表認識の目的は、画像中の表を解析し、表の構造やセルの位置を正確に特定し、構造化された表形式(HTMLなど)に変換することである。今日の情報化時代において、大量の重要な表データが、構造化されていない状態で存在している。

BlenderMCP:依赖Blender生成3D模型的MCP服务-首席AI分享圈

BlenderMCP:3Dモデルの生成にBlenderを使用するMCPサービス

一般的な紹介 BlenderMCPは、モデルコンテキストプロトコル(MCP)プロトコルを介してBlenderとClaude AIを接続するオープンソースツールです。ユーザーはテキストコマンドでBlenderを直接操作し、3Dモデル、シーン、マテリアルを素早く作成・編集することができます。このツールは3D...

Cloudflare Agents:在边缘网络上构建实时交互的智能体-首席AI分享圈

Cloudflare Agents: エッジネットワーク上にリアルタイムの対話型インテリジェンスを構築

概論 Cloudflare AgentsはCloudflareのオープンソース開発フレームワークで、開発者がグローバルエッジネットワーク上にインテリジェントなAIエージェントを構築できるように設計されています。Cloudflare Agentsは、エージェントが状態を永続化し、リアルタイムで通信し、自律的に実行する機能を提供します。コア機能パッケージ...

codemcp:Claude Desktop专用的编码助手MCP-首席AI分享圈

codemcp: コーディング・アシスタント MCP for Claude Desktop

概要 codemcp は、Edward Z. Yang 氏が GitHub で開発した、Claude Desktop ユーザーのためのオープンソースツールです。Claudeデスクトップを便利なペアプログラミングアシスタントにします。ユーザは、ダイアログを通して、Claudeにローカルのコードベースを直接実装させることができます...

OpenAI Agents SDK:搭建多智能体协作工作流的Python框架-首席AI分享圈

OpenAIエージェントSDK:協調的マルチインテリジェンスワークフロー構築のためのPythonフレームワーク

概論 OpenAI Agents SDKは、マルチインテリジェントなボディワークフローを構築するために設計されたOpenAIの軽量な開発ツールです。Pythonをベースとしており、使いやすく、エージェント、ハンドオフ、ガードレール、その他のタスクを設定することができます。

AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包-首席AI分享圈

オストリスによるAIツールキット:FLUX.1モデルトレーニングツールキットによる安定した拡散

概 要 AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに特化したオープンソースのAIツールセットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者に柔軟なモデルマイクロ...

混元Turbo S:腾讯推出的快思考大模型(开放申请)-首席AI分享圈

ハイブリッド・ターボS:テンセントの「速く考える」ビッグモデル(募集中)

総合紹介 テンセントターボSは、テンセントが自社開発した次世代高速思考モデルで、テンセントクラウドの公式サイトで発表され、2025年2月27日に正式リリースされる。従来の頭の回転が遅いモデル(例:Deepseek R1、Hybrid T1)とは異なり、「秒速返信」を実現し、スピートのスピードを2倍にし、第一声の遅れを短縮することができる。

HippoRAG:基于长时记忆的多跳知识检索框架-首席AI分享圈

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。HippoRAGは、RAG(Retrieval Augmented Generation)、KG(Knowledge Graph)、PageRank(Personalized PageRank)の技術を組み合わせ、大規模言語モデル(LLM)が外部文書からの知識を継続的に統合できるようにします。

ANP:实现智能代理间安全高效通信的开源协议-首席AI分享圈

ANP: インテリジェントエージェント間の安全で効率的な通信のためのオープンソースプロトコル

一般的な紹介 AgentNetworkProtocol (ANP)は、GitHubでホストされているオープンソースのプロトコルプロジェクトで、インテリジェントエージェント(AIエージェント)に安全で効率的な通信ソリューションを提供することに焦点を当てています。IDおよび暗号化通信レイヤー、メタプロトコルレイヤー、アプリケーションプロトコルレイヤーの3レイヤーアーキテクチャによりエージェントを解決します。

Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣-首席AI分享圈

Open-LLM-VTuber:リアルタイム音声対話のためのLive2DアニメーションAIバーチャルコンパニオン

概論 Open-LLM-VTuberは、音声とテキストを通してユーザーが大規模言語モデル(LLM)と対話することを可能にするオープンソースプロジェクトであり、ダイナミックなバーチャルキャラクターを提示するためにLive2D技術を組み込んでいます。Windows、macOS、Linuxをサポートし、完全にオフラインで動作し、ウェブとデスクトップクライアントモデルがあります。

Ovis:视觉与文本对齐模型,精准反推图像提示词-首席AI分享圈

Ovis:画像手がかり語の正確なバックプロパゲーションのための視覚的・テキスト的アライメントモデル

包括的な紹介 Ovis(Open VISion)は、アリババの国際デジタル商取引グループのAIDC-AIチームによって開発され、GitHubでホストされているオープンソースのマルチモーダル大規模言語モデル(MLLM)です。このモデルは、視覚データとテキストデータを効率的にマージする革新的な構造埋め込みアライメント技術を使用しており、画像、...

X-R1:在普通设备中低成本训练0.5B模型-首席AI分享圈

X-R1:一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づくモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトは、DeepSeek-R1とopen-r1にインスパイアされ、...

Eino:字节跳动开源的Golang大模型应用开发框架-首席AI分享圈

Eino: ByteDanceのオープンソースGolangビッグモデル・アプリケーション開発フレームワーク

包括的な紹介 EinoはCloudWeGoチームによって立ち上げられたGolangベースのオープンソースフレームワークで、大規模モデル(LLM)アプリケーションのための究極の開発ツールとなることを目指しています。LangChainやLlamaIndexなどのオープンソースフレームワークの優れた設計を生かし、最先端の研究成果とByteDance社内の実践を融合させ、LLMアプリケーションの究極の開発ツールとなるよう設計されています。

OpenManus-RL:微调大模型强化智能体推理与决策能力-首席AI分享圈

OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化

一般的な紹介 OpenManus-RLは、UIUC-UlabとMetaGPTコミュニティのOpenManusチームによって共同開発されたオープンソースプロジェクトで、GitHubでホストされています。このプロジェクトは、強化学習(RL)技術を通じて、Deepseek-R1、QwQ-32Bに基づく大規模言語モデル(LLM)知能の推論および意思決定能力を強化します。...

ANUS:任务自动化与多代理协作的开源 AI 框架-首席AI分享圈

ANUS:タスク自動化とマルチエージェント・コラボレーションのためのオープンソースAIフレームワーク

概論 ANUS(Advanced Neural Understanding System)は、GitHubでホストされているオープンソースのAIエージェントフレームワークであり、ユーザーのnikmcflyによってManus AIに促されて生成された。開発者、研究者、AI愛好家に...

Long-VITA:支持超长上下文输出的视觉语言模型-首席AI分享圈

Long-VITA:非常に長い文脈出力をサポートする視覚言語モデル

包括的な紹介 Long-VITAは、VITA-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロモデルであり、非常に長い文脈を扱う視覚的・言語的タスクに焦点を当てている。画像、動画、テキストを同時に分析でき、最大100万トークンの入力をサポートし、動画理解、高解像度画像解...

ja日本語