AIパーソナル・ラーニング
と実践的なガイダンス
讯飞绘镜
合計839記事

タグ: AIのオープンソースプロジェクト

StarVector:从图像和文字生成SVG矢量图的基础模型-首席AI分享圈

StarVector: 画像とテキストからSVGベクターグラフィックスを生成するための基本モデル

一般的な紹介 StarVectorは、画像やテキストをScalable Vector Graphics(SVG)に変換するために、Juan A. Rodriguezなどの開発者によって作成されたオープンソースプロジェクトです。このツールは、画像コンテンツとテキスト命令を理解する視覚言語モデルを使用して、高品質のSVGコードを生成します。

CortexON:开源多代理AI工具,支持复杂任务自动化-首席AI分享圈

CortexON:複雑なタスクの自動化をサポートするオープンソースのマルチエージェントAIツール

概論 CortexONは、GitHub(https://github.com/TheAgenticAI/CortexOn)でホストされているオープンソースのマルチエージェントAIシステムである。TheAgenticAIチームによって開発され、ManusとOpenAI DeepResearchに触発された。その目的は、システムを複数の...

MarkPDFDown:基于多模态模型将PDF转为Markdown文件-首席AI分享圈

MarkPDFDown: マルチモーダルモデルに基づくPDFからMarkdownへの変換

概要 MarkPDFDownはオープンソースのツールです。マルチモーダルな大きな言語モデルを利用して、PDFファイルをMarkdown形式に変換します。開発者はGitHubユーザーのjorben氏です。 このツールの目的はシンプルで、PDFドキュメントを編集・共有しやすくすることです。見出し、...

Easy Dataset:创建大模型微调数据集的简易工具-首席AI分享圈

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル(LLM)のファインチューニングのために特別に設計されたオープンソースツールで、GitHubでホストされています。ユーザーがファイルをアップロードし、コンテンツを自動的に分割し、質問と回答を生成し、最終的にファインチューニングに適した構造化データセットを出力できる、使いやすいインターフェースを提供します。オープン ...

Skywork-R1V:昆仑万文开源的图文混合多模态推理模型-首席AI分享圈

Skywork-R1V: グラフィカルハイブリッドマルチモーダル推論モデル オープンソース by Kunlun Wanwen

一般的な紹介 Skywork-R1Vは、SkyworkAI(Kunlun Wanwei)チームによって開発され、GitHubで公開されているオープンソースのマルチモーダル推論モデルです。画像とテキストを同時に処理することができ、多段階の論理的推論を実行し、特に複雑な画像問題の分析に優れています。このモデルは2025年3月18日に正式に発表された。

AI Logo:AI快速生成定制化品牌Logo-首席AI分享圈

AIロゴ:AIがカスタマイズされたブランドロゴを素早く生成

概論 AI Logoは、人工知能によってパーソナライズされたブランドロゴを素早く生成することを目的とした、オープンソースのAIアプリケーションプロジェクトです。Stable DiffusionやDeepAIのような強力なAI技術を組み合わせ、ユーザーが簡単なブランド情報を入力するだけで、高品質のロゴデザインを得ることができます。この...

Docs:开源的协作笔记和文档管理工具-首席AI分享圈

Docs: オープンソースの共同ノート・文書管理ツール

概要 Docs は、suitenumerique チームによって開発されたオープンソースの共同ノート作成・文書管理プラットフォームです。DjangoとReact技術を使って構築されており、ユーザーがメモを取ったり、ドキュメントを管理したり、知識を共有したりするのに役立つ使いやすいツールを提供することを目標としています。このプラットフォームは複数人でのリアル...

SmartRead:自动标注技术PDF文档并提供相关引用源-首席AI分享圈

SmartRead: PDF技術文書に自動的に注釈を付け、関連する引用を提供

包括的な紹介 SmartReadは、技術文書向けに設計されたAIベースのオープンソースツールです。PDFファイルを自動的に分析し、重要な用語や見出し、核となる考え方など、重要なコンテンツに注釈を付け、複雑な文書を素早く理解できるようにします。同時に、文書のトピックに関連する記事やビデオを提供することもできます。

Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具-首席AI分享圈

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成することを目的としている。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D-Paint)の2つのコアコンポーネントから構成される。ユーザーは、テキストの説明や画像を入力することができます。

LangManus:支持多智能体协作的开源AI自动化框架-首席AI分享圈

LangManus: マルチインテリジェンス・コラボレーションをサポートするオープンソースのAI自動化フレームワーク

一般的な紹介 LangManusはGitHubでホストされているオープンソースのAI自動化フレームワークです。元同僚のグループが余暇を利用して開発したもので、言語モデルと専門ツールを組み合わせてウェブ検索、データクローリング、コード実行などのタスクを実行することを目的とした学術主導のプロジェクトである。このフレームワークは、マルチエージェント...

闲鱼卖家全天自动值守的AI客服机器人-首席AI分享圈

アイドル・フィッシュの販売員が24時間体制で自動対応するAIカスタマーサービスボット

包括的な紹介 XianyuAutoAgentは、GitHubで開発者shaxiuによってオープンソース化されたIdlefishプラットフォーム専用に設計されたインテリジェントな顧客サービスロボットシステムです。AI技術により、7×24時間の自動業務を実現し、アイドルフィッシュの販売者がメッセージに返信したり、交渉や技術的なアドバイスに対応したりする。主な機能は以下の通り。

Seed-VC:支持少样本实时转换语音和歌声-首席AI分享圈

Seed-VC:少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。1秒から30秒までのリファレンス音声を使用し、追加トレーニングなしで音声や曲の変換を素早く行うことができます。このプロジェクトはリアルタイムの音声変換をサポートしており、レイテンシは400ミリ秒程度と低く、オンライン会議に適しています。

PilottAI:构建企业级多智能体应用的开源项目-首席AI分享圈

PilottAI: エンタープライズグレードのマルチインテリジェンス・アプリケーションを構築するオープンソース・プロジェクト

一般的な紹介 PilottAIはGitHubでホストされているオープンソースのPythonフレームワークで、開発者のanuj0456によって作成されました。大規模言語モデル(LLM)の統合をサポートし、タスクスケジューリング、動的拡張、フォールトトレラントメカニズムやその他の機能を提供します。

HumanOmni:分析人类视频情感和动作的多模态大模型-首席AI分享圈

HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル

一般的な紹介 HumanOmniは、HumanMLLMチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルです。HumanOmniは人間の映像の分析に特化しており、画像と音声の両方を処理することで、感情、行動、対話の内容を理解するのに役立ちます。このプロジェクトでは、240万件の人間中心のビデオクリップと...

TxAgent:帮医生分析药物作用和治疗方案的AI工具-首席AI分享圈

TxAgent:医師が薬効や治療法を分析するためのAIツール

包括的な紹介 TxAgentは、ハーバード大学の医学・科学人工知能チーム(MIMS)によって開発されたオープンソースのAIツールで、医師が薬物相互作用を分析し、個人に合った治療計画を立てるのを支援する。多段階の推論と生物医学的知識のリアルタイム検索により、患者固有の情報(年齢、...

SmolDocling:小体积高效处理文档的视觉语言模型-首席AI分享圈

SmolDocling:少量で効率的な文書処理のための視覚言語モデル

SmolDoclingは、ds4sdチームがIBMと共同で開発したビジュアル言語モデル(VLM)で、SmolVLM-256Mをベースにしており、Hugging Faceプラットフォームでホストされています。SmolDoclingは、SmolVLM-256Mをベースにした視覚言語モデル(VLM)で、Hugging Faceプラットフォーム上でホストされています。 パラメータが256Mしかない世界最小のVLMで、その中核機能は...

ja日本語