AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1
全958記事

タグ: AIのオープンソースプロジェクト 29ページ

Ollama OCR:使用Ollama中视觉模型提取图像中的文本-首席AI分享圈

Ollama OCR: Ollamaの視覚モデルを使った画像からのテキスト抽出

包括的な紹介 Ollama OCRは、Ollamaプラットフォームが提供する最先端の視覚言語モデルを使用して画像からテキストを抽出する、強力な光学式文字認識(OCR)ツールキットです。このプロジェクトは、Pythonパッケージとして利用できるほか、ユーザーフレンドリーなStreamlitウェブ・アプリケーション・インターフェースを提供しています。このツールキットは複数の...

FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性-首席AI分享圈

FitDiT:衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散変換器(Diffusion Transformers)に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。FitDiTは革新的に、衣服の詳細を表示することができる新しいアルゴリズムアーキテクチャを提案している。

Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频-首席AI分享圈

薄板-スプライン-モーションモデル:静的ポートレートマップ参考動画 ポートレートモーション生成動画

概論 Thin-Plate-Spline-Motion-Model は、CVPR 2022 で発表された画期的な画像アニメーション生成プロジェクトである。このプロジェクトは、薄板スプライン変換の理論に基づき、ドライブビデオに基づく静止画像の高品質なアニメーションを実現する。このプロジェクトでは、教師なし学習フレームワークをエンド・ツー・エンドで用いて...

DUIX:实时互动的智能数字人,支持多平台一键部署-首席AI分享圈

DUIX: リアルタイムのインタラクションを実現するインテリジェントなデジタルピープル、マルチプラットフォームのワンクリック導入をサポート

概論 DUIX(Dialogue User Interface System)は、シリコン・インテリジェンスが開発したAI主導のデジタル・ヒューマン・インタラクション・プラットフォームです。オープンソースのデジタル・ヒューマン・インタラクション機能により、開発者は大規模なモデリング、自動音声認識(ASR)、音声合成(TTS)機能を簡単に統合し、デジタル・ヒューマン・インタラクションを実現することができます。

Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景-首席AI分享圈

Fayデジタルヒューマンフレームワーク:言語モデルと3Dデジタルキャラクターを統合し、様々なアプリケーションシナリオをサポート。

包括的な紹介 Fayはオープンソースの3Dバーチャルデジタルヒューマンフレームワークであり、バーチャルショッピングガイド、バーチャルキャスター、アシスタント、ウェイター、教師、音声またはテキストベースのモバイルアシスタントなど、様々なアプリケーションシナリオのための言語モデルとデジタルキャラクタを統合している。

MOFA Video:运动场适配技术将静态图像转换为视频-首席AI分享圈

MOFAビデオ:静止画を動画に変換するモーション・フィールド・アダプテーション技術

一般的な紹介 MOFA-Videoは、生成的な動き場適応技術を用いて静止画像を動的な動画に変換する先進的な画像アニメーション生成ツールです。東京大学とTencent AI Labと共同で開発され、European Conference on Computer Vision (ECCV) 2024で発表される。

Amurex:开源AI会议记录助手,自动记录会议内容生成总结-首席AI分享圈

Amurex:オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成

一般的な紹介 AmurexはThe Personal AI Companyによって開発されたオープンソースのAIミーティングアシスタントで、インテリジェントな機能によってミーティングの効率を向上させることを目的としています。Amurexはリアルタイムのアドバイスの提供、インテリジェントな要約の生成、ミーティング内容の記録、フォローアップメールの自動送信が可能です。そのデザインは、透明性、安全性、...

E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统-首席AI分享圈

E2Bオープンコンピュータの使用:E2BサンドボックスでAIオペレーティングシステムを安全に実行する

概要 E2B Open Computer Useは、E2B Desktop Sandboxを通じて、安全なクラウドベースのLinuxコンピュータ利用体験を提供することを目的としたオープンソースプロジェクトです。E2B Sandboxは、ユーザが任意のLarge Language Model (LLM)に接続してコンピュータを制御できるデスクトップグラフィカル環境を提供し、...

Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手-首席AI分享圈

エージェントラボラトリー:研究者のための自動化されたコードとスタディライティングアシスタント

包括的な紹介 エージェントラボラトリーは、研究者の研究アイデアの実現を支援するために設計された、エンドツーエンドの自律的な研究ワークフローです。このシステムは大規模な言語モデルによって駆動される専用エージェントで構成され、文献レビューや研究計画の策定から、実験の実行や統合論文の執筆に至るまで、研究ワークフロー全体をサポートします。

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)-首席AI分享圈

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

包括的な紹介 Kokoro-FastAPIは、Kokoro-82M音声合成モデルのサポートを提供するために設計されたDockerベースのFastAPIパッケージです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、生の成長したテキストの音声出力をより効率的で首尾一貫したものにするためのキュー処理と自動スプライシングを提供します。このプロジェクトは ...

CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点-首席AI分享圈

クールクライン:クラインのインテリジェント・コーディング・アシスタントの改良版で、クラインルー・クラインとバオ・クラインの利点を組み合わせたもの。

概要 CoolClineは、Cline、Roo Cline、Bao Clineの最高の機能を組み合わせた強力なコーディングアシスタントです。CoolClineはオープンソースプロジェクトです。

J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持-首席AI分享圈

J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

一般的な紹介 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的な議論を支援するように設計されたインテリジェントなコードアシスタントです。プロジェクトはDanilo Falcaoによって作成され、GitHub.J.R.V.I.S.でホストされている。

AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据-首席AI分享圈

AI投資システム:市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の算出、市場センチメントの分析、ファンダメンタルズデータの分析など、複数のインテリジェンスが連携して売買シグナルを生成するように設計されています。このアプローチは...

Company Researcher:公司研究工具,输入公司网址以获取详细研究信息-首席AI分享圈

企業リサーチャー:企業リサーチツールで、企業のウェブアドレスを入力すると詳細なリサーチ情報が得られます。

概要 Company Researcher (カンパニーリサーチャー)は、ユーザーがあらゆる企業の概要を迅速かつ包括的に把握できるように設計された、フリーでオープンソースのツールです。企業のURLを入力するだけで、ツールはウェブから包括的な情報を収集し、組織、製品、資金調達、社会的存在...に関する情報を提示します。

GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新-首席AI分享圈

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

一般的な紹介 GitPodcastは、GitHubのリポジトリをポッドキャストに変え、開発者がいつでもどこでもコードの更新を聞けるように設計された革新的なツールです。OpenAIとAzure Speech SDKを使って、GitPodcastはGitHubリポジトリをコミットログ、プルリクエスト、マイレージのポッドキャストに変えることができます。

Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统-首席AI分享圈

Paperless-AI: Paperless-NGX文書管理システムのためのAIを使った文書の自動分析とタグ付け

概要 Paperless-AIは、Paperless-ngx文書管理システム専用に設計された革新的な文書自動化分析ツールです。OpenAI APIと、Ollama(Mistral、LLaMA、PHI-3、Gemma 2を含む)、...といった様々な先進AIモデルを巧みに組み合わせています。

Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台-首席AI分享圈

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計された、開発者向けのワールドベースモデルプラットフォームです。このプラットフォームは、拡散や自己回帰をベースとしたワールドベースモデルを含む、様々な訓練済みモデルを提供します。

Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体-首席AI分享圈

ミニLLMフロー:100行のコードで「有向グラフ構造」を持つLLMミニインテリジェントを構築する

概論 miniLLMFlowは、「道は単純である」という設計哲学を強調した、わずか100行のコアコードからなる最小主義の大規模言語モデル(LLM)開発フレームワークです。このフレームワークは、AIアシスタント(ChatGPT、Claudeなど)を自律的にプログラムできるようにするために特別に設計されており、マルチインテリジェンス、タスク分解、...

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动-首席AI分享圈

Xiaozhi AIチャットボット:AIチャットコンパニオンを構築、簡単な音声対話とインテリジェントな対話

包括的な紹介 Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人がAIハードウェア開発を始め、大きな言語モデルを実際のハードウェアデバイスに適用する方法を理解するための教育目的で主に使用されています...

ja日本語