AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1
合計749記事

タグ: AIのオープンソースプロジェクト 15ページ

Unsloth:大規模言語モデルの微調整と学習を効率的に行うオープンソースツール - Chief AI Sharing Circle

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルを幅広くサポートしています。Unslothの主な特徴は、メモリ使用量を大幅に削減し、学習を高速化できることです。

MaxKB:スマートな接客と社内ナレッジベースを実現する、すぐに使えるAIナレッジベースQ&Aシステム - Chief AI Sharing Circle

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業内の知識ベース、学術研究、教育、およびその他のシナリオで広く使用されています。

OmniThink:質の高い長文記事を生成するライティングフレームワーク、検索後に外部知識を反映し、段階的にナレッジツリーを構築 - Chief AI Sharing Circle

OmniThink:質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは、人間の認知プロセスの反復的な拡張と反映を模倣することによって、高品質の長文記事を生成するように設計された革新的なマシンライティングフレームワークです。このフレームワークは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。OmniThinkは、アウトラインと...

OpenAIリアルタイムエージェント:マルチインテリジェント身体発話対話アプリケーション(OpenAIの例) - チーフAIシェアリングサークル

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)ハイレベルなインテリジェントボディモデルを提供することで、開発者は複雑なマルチインテリジェントボディスピーチシステムを短時間で構築することができます...

SynthLight:ポートレート画像の自然光レンダリング(未発表) - Chief AI Sharing Circle

SynthLight:ポートレート画像の自然光レンダリング(未発表)

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します。

1-2-1-MNVTON:効率的な画像、動画内のキャラクターでバーチャル試着(公開予定) - チーフAIシェアリングサークル

1-2-1-MNVTON:効率的な映像、映像の中の人によるバーチャル試着(開設予定)

概論 1-2-1-MNVTON は GitHub ベースのオープンソース・プロジェクトで、"Modality-specific Normalization for Virtual Try-On" (MNVTON) 技術により効率的な仮想トライオンを実現することを目的としています。このプロジェクトは、従来のバーチャル・トライオン技術における高い計算コストの問題を、...

Zerox:PDF、DOCX、画像からMarkdownへの変換、ビジュアルモデル高精度OCR-チーフAIシェアリングサークル

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

包括的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。ZeroxはNodeとPythonプログラミング言語をサポートし、...

Charla:Ollamaバックエンドをネイティブ統合したエンドポイントベースのミニマルなAIチャットツール - Chief AI Sharing Circle

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは簡単なコマンドライン操作で起動し、有効にすることができます...

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスが関連テキストブロックを想起-チーフAIシェアリングサークル

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは非常にシンプルな検索拡張生成(RAG)フレームワークであり、異種グラフインデックスと軽量トポロジー拡張検索により、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究所(HKUDS)によって開発され、スモール・ランゲージ・モデル(SLM...

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによる映像コンテンツ分析の強化 - Chief AI Sharing Circle

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによるビジュアルコンテンツ分析の強化

包括的な紹介 Omni-RGPTは、画像や動画の領域レベルでの理解を可能にするために設計されたマルチモーダルな大規模言語モデルである。トークン・マーク(Token Mark)技術を導入することで、Omni-RGPTは、視覚特徴空間内のターゲット領域をハイライトし、これらのトークンを領域キュー(ボックスやマスクなど)を介して直接埋め込むことができる。

Bailing:自然な会話とコミュニケーションを簡単に実現する低遅延オープンソース音声対話アシスタント - Chief AI Sharing Circle

Bailing:自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

総合紹介 ベーリング(Bailing)は、音声を通じてユーザーと自然な会話をするために設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)、音声合成(TTS)技術を組み合わせて、GPT-4oのような音声...

WikiChat:ウィキペディアのデータを使って知識を検索するチャットツール - Chief AI Sharing Circle

WikiChat:ウィキペディアのデータを使って知識を検索するためのチャットツール

概要 ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模な言語モデルの事実性を改善することを目的としています。大規模な言語モデル(ChatGPTやGPT-4など)は、最新の情報や人気のないトピックを扱うときにエラーを起こす傾向があります。

OpenAI Edge TTS:OpenAI Formatと互換性のあるEdge TTSを使ったフリーの音声合成API - Chief AI Sharing Circle

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質の音声出力を生成できるようにします。

AIEvo:マルチインテリジェンス協調アプリケーションを作成するための効率的なフレームワーク - Chief AI Sharing Circle

AIEvo:マルチインテリジェントな協調アプリケーションを作成するための効率的なフレームワーク

概要 AIEvoは、Ant Groupのオープンソースマルチエージェントフレームワークで、マルチエージェントアプリケーションを効率的に作成するために設計されています。AIEvoは、SOPタスクグラフに厳密に従うことで、複雑なタスクの実行成功率を向上させ、 フィードバックと監視メカニズムにより、高い柔軟性とスケーラビリティを保証します。

PPTAgent:PPTプレゼンテーションの自動生成と評価、ドキュメントからPPTへ - チーフAIシェアリングサークル

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを使用して、プレゼンテーションを作成する人間のアプローチを採用しています。さらに、PPTAgentは、文書からプレゼンテーションを生成するための包括的な評価フレームワークであるPPTEvalを導入しています。

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築 - Chief AI Sharing Circle

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

概論 FlowiseAIは、カスタムLLM(大規模言語モデル)アプリケーションやAIエージェントの開発を支援するために設計された、オープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。

RealtimeSTT: Whisperベースの低遅延ストリーミング音声認識のためのリアルタイム音声テキスト化ツール - Chief AI Sharing Circle

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

はじめに RealtimeSTT は効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。音声アシスタントをする場合でも、音声をテキストに変換する必要がある場合でも、...

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語