AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計928記事

タグ: AIのオープンソースプロジェクト 13ページ

DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)-首席AI分享圈

DeepGEMM: FP8行列演算を効率的にサポートするオープンソースライブラリ (DeepSeek Open Source Week 3日目)

概要 DeepGEMMは、DeepSeekチームによって開発されたオープンソースのFP8 GEMM (Generalised Matrix Multiplication)ライブラリで、行列演算の効率的なサポートを提供することに重点を置いています。NVIDIA HopperアーキテクチャのTensor Core向けに特別に設計されており、一般的な行列演算と混合エキスパートモデル(MoE)の両方をサポートしています...

olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别-首席AI分享圈

olmOCR: PDF 文書のテキスト変換、表、数式、手書き内容の認識のサポート

包括的な紹介 olmOCRは、アレン人工知能研究所(AI2)のAllenNLPチームによって開発されたオープンソースツールで、PDFファイルを線形化されたテキストに変換することに特化しており、特に大規模言語モデル(LLM)のデータセット準備と学習に適しています。これは ...

Coding-Tutor:提供个性化编程指导的智能教学助手-首席AI分享圈

Coding-Tutor: 個別のプログラミング指導を提供するインテリジェントなティーチング・アシスタント

一般的な紹介 Coding-Tutorは、GitHubでホストされているオープンソースプロジェクトで、開発者のiwangjianによって作成され、学習者にパーソナライズされたプログラミング教育体験を提供します。会話型AI技術を使って、ユーザーの知識背景や学習の進捗状況に基づいて教育内容を動的に調整し、...

Flock:低代码工作流编排快速构建聊天机器人-首席AI分享圈

Flock:迅速なチャットボット構築のためのローコードワークフローオーケストレーション

概要 Flockはオープンソースのワークフロー用ローコードプラットフォームで、GitHubでホストされており、Onelevenvyチームによって開発されています。LangChainとLangGraphの技術をベースにしており、チャットボットや検索拡張世代(RAG)アプリケーションの迅速な構築や、マルチエージェントグループのオーケストレーションを支援することに重点を置いています。

TableGPT Agent:专为分析复杂表格数据设计的智能工具-首席AI分享圈

TableGPTエージェント:複雑な表形式データを分析するために設計されたインテリジェントツール

概要 TableGPT エージェントは、GitHub オープンソースプロジェクトに基づくインテリジェントなツールで、表形式データの処理と分析のために設計されています。TableGPT2 Big Language Model に依存しており、自然言語インタラクションを使用して、ユーザが複雑なテーブルの内容を簡単に照会、操作、理解できるようにします。このモデルによって、ユーザは複雑な表コンテンツを簡単に照会し、操作し、理解することができる。

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频-首席AI分享圈

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVは、GitHubにホストされているオープンソースのツールで、スライドや講義ノートをナレーション付きのビデオに素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画を自動生成します。

gibberlink:两个AI智能体间高效音频通信的演示项目-首席AI分享圈

gibberlink:2つのAI知能間の効率的な音声通信のための実証プロジェクト

概論 gibberlinkは開発者PennyroyalTeaによるGitHub上のオープンソースプロジェクトで、2つの会話AI知能間のコミュニケーション最適化を可能にすることに焦点を当てている。2つのAI知能が電話で会話し、お互いをAIとして認識すると、人間の言語(英語)から切り離されます...

LazyLLM:商汤开源构建多智能体应用的低代码开发工具-首席AI分享圈

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。開発者が複雑なAIアプリケーションを素早く構築し、ワンクリックのデプロイメントと軽量のゲートウェイ機構によって、面倒なエンジニアリングの設定にかかる時間を節約することを支援します。あなたが初心者であろうとなかろうと...

DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人-首席AI分享圈

DeepSeek-RAG-Chatbot: ローカルで動作する DeepSeek RAG チャットボット

概要 DeepSeek-RAG-Chatbotは、DeepSeek R1モデルに基づいて構築されたオープンソースのチャットボットプロジェクトで、GitHubでホストされており、開発者のSaiAkhil066によって作成されました。Retrieval Augmented Generation(RAG)技術と、ユーザーがドキュメント(PDF、DOCX、TXTなど)をアップロードするためのサポートを組み合わせています。

MagicArticulate:将静态3D模型生成骨骼结构动画资产-首席AI分享圈

MagicArticulate:静的な3Dモデルから骨格構造のアニメーション資産を生成する

包括的な紹介 MagicArticulateは、ByteDanceが南洋理工大学(NTU)と共同で開発したAIフレームワークで、静的な3Dモデルをアニメーション可能なデジタル資産に迅速に変換することに焦点を当てています。高度な自己回帰トランスフォーマーと関数拡散モデルによって、モデルの骨格構造とスキニング権を自動的に生成します。

AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)-首席AI分享圈

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskは簡単なステップでワンクリックのデプロイを可能にします。このソフトウェアは、Windows、Linux...

CapsWriter-Offline:PC端的语音输入和字幕转录工具-首席AI分享圈

CapsWriter-Offline:PC用音声入力・字幕書き起こしツール

一般的な紹介 CapsWriter-Offlineは、GitHubでホストされ、開発者HaujetZhaoによって構築されたPC用の音声入力および字幕書き起こしツールです。完全にオフラインで動作し、インターネット接続を必要とせず、音声をテキストに変換し、オーディオ/ビデオファイルを字幕に変換します。

PDF-Extract-Kit:提取复杂结构PDF内容的开源工具-首席AI分享圈

PDF-Extract-Kit:オープンソースツールのPDFコンテンツの複雑な構造を抽出する

包括的な紹介 PDF-Extract-KitはOpenDataLabチームによって開発されたオープンソースプロジェクトで、複雑で多様なPDF文書から高品質なコンテンツを効率的に抽出することに重点を置いています。先進的な文書解析技術、レイアウト検出、数式認識、表抽出、OCRなどの機能を統合し、PDF文書から高品質なコンテンツを抽出します。

FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)-首席AI分享圈

FlashMLA:HopperGPU向けMLAデコード・カーネルの最適化(DeepSeek Open Source Week 1日目)

一般的な紹介 FlashMLAは、DeepSeek AIによって開発された効率的なMLA(Multi-head Latent Attention)デコーディングカーネルで、NVIDIA Hopper Architecture GPU用に最適化されており、可変長シーケンス処理のパフォーマンスを向上させるように設計されています。このプロジェクトはGitHubでオープンソース化されており、開発者は無料で...

TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架-首席AI分享圈

TPO-LLM-WebUI:質問を入力してリアルタイムにモデルを学習し、結果を出力できるAIフレームワーク。

包括的な紹介 TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル(LLM)のリアルタイム最適化を可能にします。TPO (Test-Time Prompt Optimisation)フレームワークを使用し、従来の微調整の退屈なプロセスに完全に別れを告げます...

Neural4D:生成高分辨率3D建模数字资产的AI平台-首席AI分享圈

Neural4D:高解像度3Dモデリングデジタル資産を生成するAIプラットフォーム

包括的な紹介 Neural4Dは革新的なAIベースのプラットフォームで、ユーザーが簡単なテキストや画像を入力するだけで、高品質な3Dモデルやアニメーションを素早く生成できるようにすることに重点を置いています。DreamTech社によって開発されたNeural4Dは、世界をリードするエンドツーエンドの大規模な3Dモデル生成に依存しており、ユーザーは説明を入力するだけです...

InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型-首席AI分享圈

InternLM-XComposer:非常に長いテキストと画像・動画理解を出力するためのマルチモーダル・マクロモデル

包括的な紹介 InternLM-XComposerは、InternLMチームによって開発されたオープンソースのグラフィカルなマルチモーダルビッグモデルプロジェクトで、GitHubでホストされています。InternLM言語モデルをベースにしており、テキスト、画像、ビデオ、その他のマルチモーダルデータを扱うことができ、グラフィック作成、画像理解、ビデオサブで広く使用されています。

MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率-首席AI分享圈

MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール

概要 Make Senseは、コンピュータ・ビジョン・プロジェクト用のデータセットを素早く準備できるように設計された、無料のオンライン画像注釈ツールです。複雑なインストールは不要で、ブラウザからアクセスするだけで使用でき、複数のオペレーティングシステムをサポートし、小規模なディープラーニングプロジェクトに最適です。ユーザはこのツールを使って...

ja日本語