AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計992記事

タグ: AIのオープンソースプロジェクト 49ページ

GFPGAN:腾讯开源的人脸修复算法-首席AI分享圈

GFPGAN:テンセントのオープンソース顔修復アルゴリズム

包括的な紹介 GFPGAN (Generative Facial Prior GAN) は、Tencent ARC (Applied Research Center) によって開発されたオープンソースの顔修復アルゴリズムです。このアルゴリズムは、事前に訓練された顔GAN(StyleGAN2など)にカプセル化された豊富で多様な事前要素を利用して、ブラインド顔修復を行う。

Curiosity:使用LangGraph构建类似 Perplexity 的AI搜索工具-首席AI分享圈

好奇心:LangGraphを使ったパープレクシティのようなAI検索ツールの構築

一般的な紹介 Curiosityは、主にLangGraphとFastHTMLの技術スタックを使用し、PerplexityのようなAI検索製品を構築することを目標に、探求と実験を目的としたプロジェクトです。プロジェクトの中心は、Tavily検索を使ってテキスト生成を強化するシンプルなReActエージェントです。

Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型-首席AI分享圈

Moshi: 複数言語とアクセントをサポートするリアルタイム音声対話フレームワーク。

総合紹介 Moshi Chatは、フランスの非営利AI研究所Kyutaiが立ち上げたエンドツーエンドのリアルタイムAI音声アシスタントです。リアルタイムで話を聞くだけでなく、自然な会話に参加し、見る、聞く、話すといったマルチモーダルなインタラクションをサポートします。Moshi Chatはユーザーのイントネーションを理解し、...

QAnything:高度集成RAG处理流程的本地知识库问答系统-首席AI分享圈

QAnything: RAG処理フローを高度に統合したローカル知識ベースQ&Aシステム

QAnything 概要 QAnything(Question and Answer based on Anything)は、NetEaseが発表したローカルナレッジベースQ&Aシステムで、あらゆる種類のファイル形式とデータベースをサポートし、オフラインでインストールして使用することができます。QAnythingはPDF、Word、PPT、XLSやその他の形式のドキュメントを扱うことができ、クロス検索をサポートしています。

StickerBaker:用AI制作个性贴纸图片-首席AI分享圈

ステッカーベイカー:AIでパーソナライズされたステッカー画像を作る

概要 stickerbakerは、人工知能技術を使って様々な面白いステッカーを作成するオープンソースのステッカーメーカーです。シンプルな猫のステッカーが欲しい人も、様々な種類のステッカーを作りたい人も、stickerbakerにお任せください。欲しいステッカーを記述するだけです...

ALog:便携AI语音日记应用,支持语音转文字。-首席AI分享圈

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されています。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換し、インテリジェントに分析します...

OpenSPG:开源知识图谱引擎-首席AI分享圈

OpenSPG: オープンソース知識グラフエンジン

包括的な紹介 OpenSPGは、SPG (Semantic Augmented Programmable Graph)フレームワークに基づいて、Ant GroupがOpenKGと共同で開発したオープンソースの知識グラフエンジンです。このエンジンは、ドメイン知識グラフの構築と管理をサポートするために、 明示的な意味表現、論理ルール定義、運用フレームワークなどの機能を提供するように設計されています。

Mem0:为AI助手和代理提供智能记忆层的开源项目-首席AI分享圈

Mem0: AIアシスタントやエージェントにインテリジェントなメモリレイヤーを提供するオープンソースプロジェクト

概論 Mem0(「メムゼロ」と発音)は、AIアシスタントやエージェントにインテリジェントなメモリーレイヤーを提供するオープンソースプロジェクトである。ユーザーの好みを記憶し、個人のニーズに適応し、時間の経過とともに改善されるため、顧客サポートのチャットボット、AIアシスタント、自律型システムに最適です。

Void: VSCode ベースのオープンソース Cursor 代替品

概要 Void は、vscode リポジトリのブランチをベースとしたオープンソースの Cursor 代替ソフトウェアです。Voidの目標は、コミュニティへの貢献と迅速な反復によって、機能性と安定性を継続的に改善することです。Voidの目標は、コミュニティへの貢献と迅速な更新によって、機能と安定性を継続的に向上させることです。

GaiaNetノード:独自のローカルモデル・オンラインプロキシサービスをインストールし、実行します。

概要 GaiaNet-AI/gaianet-nodeは、Mac、Linux、Windows WSL上でコマンド1つでデフォルトのノードソフトウェアスタックを素早くインストールできるオープンソースプロジェクトです。ユーザーはノードを初期化し、設定をカスタマイズし、モデルファイルとベクターデータベースファイルをダウンロードし、AIエージェントを起動することができます。

LlamaCoder:使用提示词快速生成并发布小型web应用-首席AI分享圈

LlamaCoder: プロンプトワードを使って小さなウェブアプリケーションを素早く生成・公開

一般的な紹介 LlamaCoderは、Llama 3.1とTogether AIをベースにしたオープンソースのコード生成ツールです。LlamaCoderは、豊富な機能モジュールと柔軟なカスタマイズ・オプションを提供し、さまざまなアプリケーションをサポートします。

GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型-首席AI分享圈

GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく

包括的な紹介 GOT-OCR2.0は、統一されたエンドツーエンドモデルを通じて、OCR技術をOCR-2.0に向けて推進することを目的とした、StepStar共同開発オープンソース光学式文字認識(OCR)モデルです。このモデルは、通常のテキスト認識、フォーマットされたテキスト認識、きめ細かなOCR、マルチ...

TgWechat:为微信提供端到端加密的聊天插件-首席AI分享圈

TgWechat: WeChat用エンドツーエンド暗号化チャットプラグイン

一般的な紹介 tgwechatは、開発者dplusecによって開発されたオープンソースのWeChatプラグインです。エンドツーエンドの暗号化によりWeChatチャットのプライバシーを保護し、ユーザーが安全にメッセージを送信できるようにします。このプロジェクトは2019年8月31日にGPL v3ライセンスのもとGitHubで公開され、個人利用は無料です。

OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑-首席AI分享圈

OpenSumi Lite: 簡単なコード表示と編集のための純粋なフロントエンドIDEソリューション

概要 OpenSumi Liteは、OpenSumiプロジェクトに基づく純粋なフロントエンドIDEソリューションで、Node.js環境を必要とせずにコードの表示と編集機能を提供するように設計されています。このプロジェクトはAlibaba GroupとAnt Groupによって共同開発され、MITライセンスの下でオープンソース化されています。

FiveThirtyNine:基于搜索知识对未来事件发生概率预测-首席AI分享圈

FiveThirtyNine:検索知識に基づいて未来の出来事の確率を予測する

概論 Forecast AIは高度な人工知能技術に基づく優れた予測プラットフォームです。強力なデータ分析と機械学習アルゴリズムを活用し、将来の出来事について精度の高い予測をユーザーに提供します。政治選挙、経済動向、社会的出来事のいずれであっても、Forecast AIは複数のデータを組み合わせて予測することができます。

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒の音声サンプルでの音声スタイル移行をサポートします。その機能には、クロスランゲージのサポート、組み込みのトラック分割...

Fish Speech:快速且高精度使用少样本克隆中英文语音-首席AI分享圈

フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

フィッシュ・スピーチはフィッシュ・オーディオによって開発されたオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。Fish Speechは複数の言語をサポートするだけでなく、効率的な音声合成を提供します。

ja日本語