AIパーソナル・ラーニング
と実践的なガイダンス
アリが描いたカエル
全764記事

タグ: AIのオープンソースプロジェクト 19ページ

Thin-Plate-Spline-Motion-Model:静止画ポートレートマップ参考動画 ポートレートモーション生成動画 - チーフAI共有サークル

薄板-スプライン-モーションモデル:静的ポートレートマップ参考動画 ポートレートモーション生成動画

概論 Thin-Plate-Spline-Motion-Model は、CVPR 2022 で発表された画期的な画像アニメーション生成プロジェクトである。このプロジェクトは、薄板スプライン変換の理論に基づき、ドライブビデオに基づく静止画像の高品質なアニメーションを実現する。このプロジェクトでは、教師なし学習フレームワークをエンド・ツー・エンドで用いて...

DUIX:ワンクリックでマルチプラットフォーム展開が可能なリアルタイム対話型インテリジェント・デジタル・ピープル - Chief AI Sharing Circle

DUIX: リアルタイムのインタラクションを実現するインテリジェントなデジタルピープル、マルチプラットフォームのワンクリック導入をサポート

概論 DUIX(Dialogue User Interface System)は、シリコン・インテリジェンスが開発したAI主導のデジタル・ヒューマン・インタラクション・プラットフォームです。オープンソースのデジタル・ヒューマン・インタラクション機能により、開発者は大規模なモデリング、自動音声認識(ASR)、音声合成(TTS)機能を簡単に統合し、デジタル・ヒューマン・インタラクションを実現することができます。

Fayデジタルヒューマンフレームワーク:言語モデルと3Dデジタルキャラクターを統合し、多様なアプリケーションシナリオをサポート-チーフAIシェアリングサークル

Fayデジタルヒューマンフレームワーク:言語モデルと3Dデジタルキャラクターを統合し、様々なアプリケーションシナリオをサポート。

包括的な紹介 Fayはオープンソースの3Dバーチャルデジタルヒューマンフレームワークであり、バーチャルショッピングガイド、バーチャルキャスター、アシスタント、ウェイター、教師、音声またはテキストベースのモバイルアシスタントなど、様々なアプリケーションシナリオのための言語モデルとデジタルキャラクタを統合している。

MOFA動画:静止画を動画に変換するモーションフィールド適応技術 - Chief AI Sharing Circle

MOFAビデオ:静止画を動画に変換するモーション・フィールド・アダプテーション技術

一般的な紹介 MOFA-Videoは、生成的な動き場適応技術を用いて静止画像を動的な動画に変換する先進的な画像アニメーション生成ツールです。東京大学とTencent AI Labと共同で開発され、European Conference on Computer Vision (ECCV) 2024で発表される。

Amurex:オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成 - Chief AI Sharing Circle

Amurex:オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成

一般的な紹介 AmurexはThe Personal AI Companyによって開発されたオープンソースのAIミーティングアシスタントで、インテリジェントな機能によってミーティングの効率を向上させることを目的としています。Amurexはリアルタイムのアドバイスの提供、インテリジェントな要約の生成、ミーティング内容の記録、フォローアップメールの自動送信が可能です。そのデザインは、透明性、安全性、...

E2Bオープンコンピュータ利用:E2BサンドボックスでAIオペレーティングシステムを安全に稼働させる - チーフAIシェアリングサークル

E2Bオープンコンピュータの使用:E2BサンドボックスでAIオペレーティングシステムを安全に実行する

概要 E2B Open Computer Useは、E2B Desktop Sandboxを通じて、安全なクラウドベースのLinuxコンピュータ利用体験を提供することを目的としたオープンソースプロジェクトです。E2B Sandboxは、ユーザが任意のLarge Language Model (LLM)に接続してコンピュータを制御できるデスクトップグラフィカル環境を提供し、...

Agent Laboratory:研究者のための自動コード・研究報告書作成アシスタント - Chief AI Sharing Circle

エージェントラボラトリー:研究者のための自動化されたコードとスタディライティングアシスタント

包括的な紹介 エージェントラボラトリーは、研究者の研究アイデアの実現を支援するために設計された、エンドツーエンドの自律的な研究ワークフローです。このシステムは大規模な言語モデルによって駆動される専用エージェントで構成され、文献レビューや研究計画の策定から、実験の実行や統合論文の執筆に至るまで、研究ワークフロー全体をサポートします。

ココロTTS API:高速音声合成のためのDocker化FastAPIラッパー(ココロ-82Mモデル) - チーフAIシェアリングサークル

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

包括的な紹介 Kokoro-FastAPIは、Kokoro-82M音声合成モデルのサポートを提供するために設計されたDockerベースのFastAPIパッケージです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、生の成長したテキストの音声出力をより効率的で首尾一貫したものにするためのキュー処理と自動スプライシングを提供します。このプロジェクトは ...

CoolCline: ClineRoo ClineとBao Clineの利点を組み合わせた、もう一つの強化されたCline Intelligent Coding Assistant - チーフAIシェアリングサークル

クールクライン:クラインのインテリジェント・コーディング・アシスタントの改良版で、クラインルー・クラインとバオ・クラインの利点を組み合わせたもの。

概要 CoolClineは、Cline、Roo Cline、Bao Clineの最高の機能を組み合わせた強力なコーディングアシスタントです。CoolClineはオープンソースプロジェクトです。

J.A.R.V.I.S.:コンテキストを考慮したインテリジェント・コード・アシスタント、コードの生成と修正、マルチIDE対応 - チーフAIシェアリングサークル

J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

一般的な紹介 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的な議論を支援するように設計されたインテリジェントなコードアシスタントです。プロジェクトはDanilo Falcaoによって作成され、GitHub.J.R.V.I.S.でホストされている。

AI投資システム:A株投資の自動意思決定システム、マルチインテリジェンスシステムで市場データを分析-チーフAIシェアリングサークル

AI投資システム:市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の算出、市場センチメントの分析、ファンダメンタルズデータの分析など、複数のインテリジェンスが連携して売買シグナルを生成するように設計されています。このアプローチは...

カンパニーリサーチャー:企業リサーチツール、企業URLを入力すると詳細なリサーチ情報が得られる - Chief AI Sharing Circle

企業リサーチャー:企業リサーチツールで、企業のウェブアドレスを入力すると詳細なリサーチ情報が得られます。

概要 Company Researcher (カンパニーリサーチャー)は、ユーザーがあらゆる企業の概要を迅速かつ包括的に把握できるように設計された、フリーでオープンソースのツールです。企業のURLを入力するだけで、ツールはウェブから包括的な情報を収集し、組織、製品、資金調達、社会的存在...に関する情報を提示します。

GitPodcast:GitHubのリポジトリをポッドキャストに、いつでもどこでもコードの更新を聴ける - Chief AI Sharing Circle

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

一般的な紹介 GitPodcastは、GitHubのリポジトリをポッドキャストに変え、開発者がいつでもどこでもコードの更新を聞けるように設計された革新的なツールです。OpenAIとAzure Speech SDKを使って、GitPodcastはGitHubリポジトリをコミットログ、プルリクエスト、マイレージのポッドキャストに変えることができます。

Paperless-AI: Paperless-ngx ドキュメント管理システムのためのAIによるドキュメントの自動分析とタグ付け - Chief AI Sharing Circle

Paperless-AI: Paperless-NGX文書管理システムのためのAIを使った文書の自動分析とタグ付け

概要 Paperless-AIは、Paperless-ngx文書管理システム専用に設計された革新的な文書自動化分析ツールです。OpenAI APIと、Ollama(Mistral、LLaMA、PHI-3、Gemma 2を含む)、...といった様々な先進AIモデルを巧みに組み合わせています。

Cosmos:ワールドベースモデル、物理世界のAIベースモデルを構築するプラットフォーム - Chief AI Sharing Circle

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計された、開発者向けのワールドベースモデルプラットフォームです。このプラットフォームは、拡散や自己回帰をベースとしたワールドベースモデルを含む、様々な訓練済みモデルを提供します。

ミニLLMフロー:100行のコードで「有向グラフ構造」のLLMミニチュア知性を構築-チーフAIシェアリングサークル

ミニLLMフロー:100行のコードで「有向グラフ構造」を持つLLMミニインテリジェントを構築する

概論 miniLLMFlowは、「道は単純である」という設計哲学を強調した、わずか100行のコアコードからなる最小主義の大規模言語モデル(LLM)開発フレームワークです。このフレームワークは、AIアシスタント(ChatGPT、Claudeなど)を自律的にプログラムできるようにするために特別に設計されており、マルチインテリジェンス、タスク分解、...

Xiaozhi AIチャットボット:AIチャットコンパニオンを構築し、音声対話とインテリジェントな対話を簡単に実現-Chief AI Sharing Circle

Xiaozhi AIチャットボット:AIチャットコンパニオンを構築、簡単な音声対話とインテリジェントな対話

包括的な紹介 Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人がAIハードウェア開発を始め、大きな言語モデルを実際のハードウェアデバイスに適用する方法を理解するための教育目的で主に使用されています...

OpenAI Realtime API Next.js:リアルタイム音声対話AIアプリケーションを構築するためのNext.jsテンプレート - Chief AI Sharing Circle

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

包括的な紹介 OpenAI Realtime API Next.jsはNext.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合し、モダンなUIコンポーネントとツールコールを提供します。このプロジェクトを使用することで ...

ココロ:自然で滑らかな音声を生成する効率的な音声合成モデル - チーフAIシェアリングサークル

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0ライセンスの下で配布され、幅広い音声パック(Voicepacks)をサポートしています。

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語