AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計970記事

タグ: AIのオープンソースプロジェクト 27ページ

MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块-首席AI分享圈

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは非常にシンプルな検索拡張生成(RAG)フレームワークであり、異種グラフインデックスと軽量トポロジー拡張検索により、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究所(HKUDS)によって開発され、スモール・ランゲージ・モデル(SLM...

Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力-首席AI分享圈

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによるビジュアルコンテンツ分析の強化

包括的な紹介 Omni-RGPTは、画像や動画の領域レベルでの理解を可能にするために設計されたマルチモーダルな大規模言語モデルである。トークン・マーク(Token Mark)技術を導入することで、Omni-RGPTは、視覚特徴空間内のターゲット領域をハイライトし、これらのトークンを領域キュー(ボックスやマスクなど)を介して直接埋め込むことができる。

百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流-首席AI分享圈

Bailing:自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

総合紹介 ベーリング(Bailing)は、音声を通じてユーザーと自然な会話をするために設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)、音声合成(TTS)技術を組み合わせて、GPT-4oのような音声...

元界AI:开源版AI数字人克隆与短视频生成工具-首席AI分享圈

メタバースAI:AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

総合紹介 Metaverse AI(オープンソース版)はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成することができ、吹き替えや字幕にも対応しています。このツールは、Windows、Web、H5、small...

WikiChat:使用维基百科数据检索知识的聊天工具-首席AI分享圈

WikiChat:ウィキペディアのデータを使って知識を検索するためのチャットツール

概要 ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模な言語モデルの事実性を改善することを目的としています。大規模な言語モデル(ChatGPTやGPT-4など)は、最新の情報や人気のないトピックを扱うときにエラーを起こす傾向があります。

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式-首席AI分享圈

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。

AIEvo:创建多智能体协作应用的高效框架-首席AI分享圈

AIEvo:マルチインテリジェントな協調アプリケーションを作成するための効率的なフレームワーク

概要 AIEvoは、Ant Groupのオープンソースマルチエージェントフレームワークで、マルチエージェントアプリケーションを効率的に作成するために設計されています。AIEvoは、SOPタスクグラフに厳密に従うことで、複雑なタスクの実行成功率を向上させ、 フィードバックと監視メカニズムにより、高い柔軟性とスケーラビリティを保証します。

PPTAgent:自动生成和评估PPT演示文稿,文档转PPT-首席AI分享圈

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを使用して、プレゼンテーションを作成する人間のアプローチを採用しています。さらに、PPTAgentは、文書からプレゼンテーションを生成するための包括的な評価フレームワークであるPPTEvalを導入しています。

FlowiseAI:构建自定义LLM应用的节点拖放界面-首席AI分享圈

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

概論 FlowiseAIは、カスタムLLM(大規模言語モデル)アプリケーションやAIエージェントの開発を支援するために設計された、オープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。

RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别-首席AI分享圈

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

はじめに RealtimeSTT は効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。音声アシスタントをする場合でも、音声をテキストに変換する必要がある場合でも、...

SemHash: データクリーニング効率を向上させるセマンティックテキスト重複排除の高速実装

一般的な紹介 SemHashは、意味的類似性によるデータセットの重複排除のための軽量で柔軟なツールである。Model2Vecの高速な埋め込み生成とVicinityの効率的なANN(近似最近傍)類似性検索を組み合わせている。SemHashは単一データセットの重複排除(例えば、トレーニング...

Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略-首席AI分享圈

Cognita:モジュラーRAGアプリケーションを構築し、多様なRAG戦略を迅速にテストするためのオープンソースフレームワーク

包括的な紹介 Cognitaは、RAG(Retrieval-Augmented Generation)ベースのアプリケーションの開発を簡素化するためにTrueFoundryによって開発されたオープンソースのフレームワークです。このフレームワークは、RAGテクノロジーをプロトタイプの段階から製品化するのを容易にする、構造化されたモジュール式のソリューションを提供します。

BotSharp:基于.NET的多智能体AI应开发与管理平台-首席AI分享圈

BotSharp:.NETベースのマルチインテリジェンスAI開発・管理プラットフォーム

包括的な紹介 BotSharpは、包括的なAIチャットボットプラットフォーム構築ツールを提供することを目的とした、.NET Coreベースのオープンソースプロジェクトです。C#プログラミングを採用し、クロスプラットフォームでの動作をサポートし、機械学習アルゴリズムの適用を簡素化することで、エンタープライズレベルの開発者がAIをビジネスシステムに効率的に統合できるようにすることを目的としています。

Weebo: 自然言語での対話体験を提供するリアルタイム音声チャットボット

はじめに Weeboは、音声認識にWhisper Small、自然言語生成にLlama 3.2、音声合成にKokoro-82Mを利用したオープンソースのリアルタイム音声チャットボットである。このプロジェクトは、Amanvir Parhar氏によって開発されました。

OmAgent:构建多模态智能设备的智能体框架-首席AI分享圈

OmAgent:マルチモーダル・スマートデバイス構築のための知的身体フレームワーク

包括的な紹介 OmAgentはOm AI Labによって開発されたマルチモーダルインテリジェントボディフレームワークであり、スマートデバイスにAIを搭載した強力な機能を提供することを目的としている。このプロジェクトにより、開発者は最先端のマルチモーダルベースモデルとインテリジェントボディアルゴリズムを統合することで、様々なスマートデバイス上で効率的でリアルタイムのインタラクティブ体験を作成することができます...

RAIN:实时捕捉真人表情生成动漫形象视频流-首席AI分享圈

RAIN:アニメ映像のビデオストリームを生成するためのリアルタイムの人間の表情のキャプチャ

概論 RAIN(Real-time Animation Of Infinite Video Stream)は、無限のビデオストリームのアニメーション効果をリアルタイムで生成することを目的としたオープンソースプロジェクトである。Pscgylottiによって開発されたこのプロジェクトは、一般的なユーザー・デバイス上でのビデオ生成のためのソリューションを提供します。最新の...

Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集-首席AI分享圈

エージェント・サービス・ツールキット:LangGraphに基づくAIインテリジェンス構築のための完全なツールセット

包括的な紹介 AIエージェント・サービス・ツールキットは、LangGraph、FastAPI、Streamlit上に構築された完全なツールセットで、開発者がAIエージェント・サービスを迅速に構築し、実行できるように設計されています。このツールキットは、ユーザ定義のエージェント機能とインタラクションをサポートする柔軟なフレームワークを提供します。

Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息-首席AI分享圈

Memora:人間との相互作用に関する情報を保存・更新するための、人間化されたAIメモリモジュールの構築

一般的な紹介 Memoraは、パーソナライズされたAIのために人間の記憶を複製するように設計されたエージェントである。Memoraは、タイムスタンプ付きの記憶、感情マーカー、マルチモーダル記憶などの機能を通じて、AIが人間のように過去の交流、感情、共有した経験の詳細を記憶することを支援する。

ja日本語