AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
全958記事

タグ: AIのオープンソースプロジェクト 30ページ

OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板-首席AI分享圈

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

包括的な紹介 OpenAI Realtime API Next.jsはNext.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合し、モダンなUIコンポーネントとツールコールを提供します。このプロジェクトを使用することで ...

Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件-首席AI分享圈

Auto-Coder.Chat:VSCodeプラグインを備えたターミナル・コマンドライン・ベースのAI支援プログラミング・アシスタント

Auto-Coder.Chatは、インテリジェントな手段によって開発者のプログラミング効率を向上させるために設計された、端末ベースのAI支援プログラミングツールです。Auto-Coder.Chatは、複数のプログラミング言語と...

Kokoro:高效语音合成模型,生成自然流畅的语音-首席AI分享圈

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0ライセンスの下で配布され、幅広い音声パック(Voicepacks)をサポートしています。

WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表-首席AI分享圈

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得られるように特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語での対話をサポートします。この ...

Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品-首席AI分享圈

Activepieces:AIワークフロー自動化、非技術者向けタスクスケジューリングツール、Zapier代替オープンソース

概要 Activepiecesは、企業や個人ユーザーに直感的で強力な自動化ソリューションを提供することに焦点を当てた、オープンソースのオールインワン自動化ワークフロープラットフォームです。TypeScriptで開発されたこのプラットフォームは非常にスケーラブルで、200以上の統合サービスをサポートしています。このプラットフォームは、AI...

k8m:简化Kubernetes集群管理的轻量级AI控制台工具-首席AI分享圈

k8m: Kubernetesクラスタ管理を簡素化する軽量AIコンソールツール

概要 k8mは、クラスタ管理を簡素化するために設計された、軽量でクロスプラットフォームなMini Kubernetes AI Dashboardです。AMISをベースに構築されており、Kubernetes APIクライアントとしてkomを使用し、組み込みのQwen2.5-Coder-7Bモデルインタラクション機能と、プライベートAIダッシュボードへのアクセスをサポートしています。

SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中-首席AI分享圈

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行

Synthesis SHMT (Self-supervised Hierarchical Makeup Transfer)は、潜在拡散モデルに基づく自己教師ありの階層的メイクアップ転送プロジェクトであり、教師なし学習法によってメイクアップ効果の高品質な転送を実現することを目的としている。このプロジェクトでは、「デカップリングと再構築」というパラダイムを採用しており、このパラダイムでは、...

VITA:开源视觉与语音实时交互的多模态大语言模型-首席AI分享圈

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

概論 VITAは、真の完全なマルチモーダルインタラクションを実現する能力を開拓する、オープンソースの主要な対話型マルチモーダル大規模言語モデリングプロジェクトである。プロジェクトは2024年8月にVITA-1.0を立ち上げ、初のオープンソースの対話型フルモーダル大規模言語モデルの先駆者となりました。

Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策-首席AI分享圈

Trend Finder: ソーシャルメディアのトレンド、トレンドトピック、新着記事をリアルタイムで追跡し、マーケティングの意思決定に活用。

はじめに Trend Finderは、ソーシャルメディア上のトレンドトピックやトレンドをリアルタイムで追跡できるように設計された強力なツールです。主要なインフルエンサーからの投稿を収集・分析することで、Trend Finderは、新しいトレンドや製品リリースが検出されると、タイムリーにSlack通知を送信することができます。このツールは非常に...

TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具-首席AI分享圈

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルに基づいたリアルタイム音声翻訳ツールで、英語と中国語のリアルタイム音声翻訳用に設計されています。Zoomなどのビデオ会議ソフトにシームレスに統合することができ、クロスリンガルcommunication.TransRoutのリアルタイム翻訳をサポートします。

opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现-首席AI分享圈

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的なAIプロジェクトで、インテリジェントなノートテイク対話システムの実現を目指しています。Build Fast with AIチームによって開発されたこのプロジェクトは、テキストコンテンツを...

Open Deep Research:生成基于网络搜索内容的AI研究报告-首席AI分享圈

オープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成

包括的な紹介 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート生成ツールです。TypeScriptで開発され、Next.js 15フレームワーク上に構築されたこのプロジェクトは、Azure Bing Search APIとGoogle Geminiを統合している。

Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)-首席AI分享圈

必要なのは視覚だけ:視覚言語モデルを用いた知的文書検索システムの構築 (Vision RAG)

包括的な紹介 Vision-is-all-you-needは革新的なビジュアルRAG(Retrieval Augmented Generation)システム実証プロジェクトであり、文書処理領域にビジュアル言語モデリング(VLM)を適用する新境地を開くものである。従来のテキストチャンキング手法とは異なり、このシステムでは、視覚言語モデルを直接使用してPDFファイルのページを処理する...

Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能-首席AI分享圈

Scira (MiniPerplx): Perplexityを模倣したオープンソースプロジェクトで、AI対話、ウェブ検索、天気クエリなどを統合している。

概論 MiniPerplx (Sciraに改名) はミニマリストデザインのAI搭載検索エンジンであり、様々な便利な機能を統合し、ユーザーにあらゆる情報検索サービスを提供します。このプロジェクトでは、Next.js、Tailwind CSS、Vercel AI SDKなどの最新のテクノロジースタックを使用しています。

Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务-首席AI分享圈

Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス

包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最大の特徴は、リアルタイムナレッジグラフと検索拡張生成 (RAG) テクノロジーを組み合わせることで、ユニークな...

LuminaBrush:使用智能绘画工具为图像添加照明打光效果-首席AI分享圈

LuminaBrush:スマートペイントツールで画像にイルミネーションを加える

LuminaBrushは、人工知能技術を搭載した照明効果のための革新的なインタラクティブ画像編集ツールです。このプロジェクトでは、画像を処理するために2段階のフレームワークを使用している。第1段階では、入力画像を「均一な照明」ルックに変換し、第2段階では、ユーザーの落書きアクションに基づいて照明効果を生成する。これは...

MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程-首席AI分享圈

MetaGPT:自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク

包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan(アレクサンダー・ウー)によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを複雑なタスクを完了するための協調的なエンティティに結合することである。

ja日本語