AIオープンソースプロジェクト

合計1020記事

順番に並べる

Motia: コードでインテリジェンスを迅速に構築するための開発フレームワーク

一般的な紹介 Motiaは、GitHubでホストされ、MotiaDevチームによって開発された、ソフトウェアエンジニアのためのオープンソースのAIエージェントフレームワークです。開発者は使い慣れたプログラミング言語（例：Python、TypeScript、Rub...

1年前

0101.5K

ハイブリッドVincennesビデオ：高品質のビデオのリアルな映像を生成し、テンセントは、大規模なモデルのオープンソースのビデオ生成

総合紹介テンセント混元テキスト生成動画（Yuanbao APPで利用可能）は、テンセントが開始したAI技術に基づく動画生成プラットフォームです。このプラットフォームは、強力な分野横断的知識と自然言語理解力を備えた騰訊混合元ビッグモデルを活用し、ユーザーのテキスト記述に基づいて高品質の動画を生成する。

2年前

0101.4K

Spark-TTS：自然な音声を生成する音声合成ツール

概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。

1年前

0101.4K

AI投資システム：市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の計算、市場心理の分析、複数の協調知能を通じたファンダメンタルズデータの分析を行うように設計されており、...

2年前

0101.3K

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成（TTS）モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。

1年前

0101.3K

VLM-R1：自然言語による画像ターゲットの位置決定のための視覚言語モデル

包括的な紹介 VLM-R1は、Om AI Labによって開発され、GitHubでホストされているオープンソースの視覚言語モデリングプロジェクトです。このプロジェクトは、DeepSeekのR1アプローチとQwen2.5-VLモデルを強化学習によって組み合わせたものです。

1年前

0101.2K

エージェントTARS：視覚とコマンドを使ってコンピュータを操作するオープンソースのインテリジェンス

総合紹介エージェントTARSは、ByteDance社がオープンソース化したマルチモーダルAIインテリジェンスで、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えています。従来のツールのような手動操作を必要とせず、自己...

1年前

0101.2K

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

クローンボイス：Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。

一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。

2年前

0101K

InvSR: 画像解像度の質を向上させるオープンソース画像超解像プロジェクト

一般的な紹介 InvSRは、低解像度画像を高品質な高解像度画像に変換できる拡散インバージョン技術に基づいた革新的なオープンソースの画像超解像プロジェクトです。このプロジェクトは、事前に訓練された大規模拡散モデルに埋め込まれた豊富な画像事前知識を利用し、柔軟なサンプリングメカニズムを通じて、...

2年前

0100.9K

Scira（MiniPerplx）：模仿Perplexity的开源项目，集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): Perplexityを模倣したオープンソースプロジェクトで、AI対話、ウェブ検索、天気クエリなどを統合している。

概論 MiniPerplx (Sciraに改名) はミニマリストデザインのAI駆動型検索エンジンであり、様々な便利な機能を統合し、ユーザーにあらゆる情報検索サービスを提供する。このプロジェクトでは、Next.js、Tailwi...

2年前

0100.8K

OpenWebUI-Monitor：监控OpenWebUI用户活动，管理使用限额，支持一键部署。

OpenWebUI-Monitor：OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。

概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。

2年前

0100.8K

codemcp: コーディング・アシスタント MCP for Claude Desktop

概要 codemcp は、Edward Z. Yang 氏が GitHub で開発した、Claude Desktop ユーザーのためのオープンソースツールです。Claudeデスクトップを便利な...

1年前

0100.7K

SadTalker: 写真にしゃべらせる｜口パク音声｜合成口パク動画｜無料デジタルピープル

概要 SadTalkerは、1枚の静止ポートレート写真と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングアバター動画を作成するオープンソースツールです。ExpNetやPoseVAなどの3Dモデリング技術の革命的な使用...

1年前

0100.5K

スクリーンショットをコードに：スクリーンショットをクリーンなフロントエンドコードに変換するAIツール

概要 Screenshot-to-Codeは、人工知能を使用してスクリーンショット、デザインドラフト、Figmaデザインをクリーンで機能的なコードに変換するオープンソースツールです。このツールは、HTML、Tailwind CS...など、複数のフロントエンド技術スタックをサポートしています。

2年前

0100.5K

Emigo：EmacsのAIを使った複雑なプログラミング作業のアシスタント

概論 EmigoはEmacs用に設計されたオープンソースのAIプログラミング・アシスタントで、MatthewZMDによってGitHub上で開発されています。大規模言語モデル(LLM)を統合することで、プログラマがEmacs上でコード解析を完了するのを支援します...

1年前

0100.5K

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースにした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Wh...

2年前

0100.4K

multi-model-bolt.new：基于 Bolt.new 的开源修改版，AI驱动的全栈开发工具

multi-model-bolt.new：AI駆動型フルスタック開発ツールBolt.newをベースとしたオープンソース修正版

一般的な説明 multi-model-bolt.newは、TogetherAIモデルの使用を可能にするBolt.newの改良版で、展開、モバイル応答、音声入力などの機能をサポートしています。ユーザーは、ブラウザーで直接プロンプトを表示したり、...

2年前

0100.4K

BlinkShot：输入提示词实时生成图像（免费接入Flux Schnell模型）

BlinkShot：プロンプトワードを入力してリアルタイム画像生成（Flux Schnellモデルへのフリーアクセス）

概要 BlinkShotは、Together AIとFlux Schnellの技術を利用したオープンソースのリアルタイムAI画像ジェネレーターで、ユーザーがプロンプトを入力すると、高品質の画像を生成することができます。このプラットフォームは完全に無料で、ユーザーのカスタマイズや二次的なオープンソースをサポートしています。

2年前

0100.3K

Fragments：类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

フラグメント：AnthropicのClaude Artifacts、Vercel v0、GPT Engineerのようなアプリケーションのオープンソース版。

概論 Fragments by E2Bは、Next.jsをベースとした、AIのみで生成されるアプリケーションを構築するためのテンプレートを提供するオープンソースプロジェクトです。このプロジェクトは、AIアプリケーションの開発プロセスを簡素化し、高速化するためにE2Bによって開発されました。このプロジェクトには、さまざまな現在のAIが統合されています。

2年前

0100.3K

MiMo: 効率的な数学的推論とコード生成のための小さなオープンソースモデル

一般的な紹介 MiMoはXiaomiによって開発されたオープンソースの大規模言語モデリングプロジェクトであり、数学的推論とコード生成に焦点を当てている。コアプロダクトはMiMo-7Bファミリーのモデルで、ベースモデル（Base）、教師あり微調整モデル（SFT）、ベースモデルから学習された強力な化学モデル（Strong Chemical）を含んでいます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0100.3K

MathTranslate：科学論文用LaTeX翻訳ツール

一般的な紹介 MathTranslateはLaTeX文書、特に科学論文の翻訳に特化したオンラインツールです。このツールはLaTeXの式（例えば数式）を変更せずに、最終的にLaTeX文書を...

2年前

0100.3K

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR（光学式文字認識）ソリューションを提供します。

2年前

0100.3K

SemHash: データクリーニング効率を向上させるセマンティックテキスト重複排除の高速実装

包括的な紹介 SemHashは、意味的類似性によってデータセットの重複を除去するための軽量で柔軟なツールです。Model2Vecの高速な埋め込み生成と、Vicinityの効率的なANN（近似最近傍）類似検索を組み合わせています。

2年前

0100.2K

InstantIR：破損した画像の修復と画像の高解像度ズームのオープンソースプロジェクト、最低16Gのビデオメモリ

一般的な説明 InstantIRは、InstantXチームによって開発された革新的な単一画像復元モデルで、破損した画像の高品質復元を実行することができ、非常に高品質で生き生きとした細部で破損した画像を復活させるように設計されています。このツールは、画像の細部を復元するだけでなく...

2年前

0100.2K

KTransformers：大規模モデル推論パフォーマンス・エンジン：極限の加速、柔軟な権限付与

KTransformers：大規模モデル推論のボトルネックを克服するための高性能Pythonフレームワーク。 KTransformersは、単なるモデル実行ツールにとどまらず、極めて優れたパフォーマンス最適化エンジンのセットであり、柔軟なインターフェース強化プラットフォームでもあります。 KTransf...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0100.1K

Cua: AIエージェントがmacOS/Linuxサンドボックスで安全にアプリケーションを実行できるようにする

一般的な紹介 Cuaは "Computer-Use Agent "と呼ばれるオープンソースプロジェクトで、"クーア "と発音します。Apple Siliconデバイスのために設計され、高性能なmacOS OSを作成し、実行することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0100K

微信Markdown编辑器：简洁高效的微信图文排版工具，一键粘贴文章到微信公众号

WeChat Markdownエディタ：シンプルで効率的なWeChatグラフィックレイアウトツール、WeChat公開番号に記事を貼り付けるためのキー

総合紹介 WeChat Markdown Editor (WeChat Markdown Editor)は、ユーザーが簡単に美しいWeChat投稿を作成できるように設計された、非常に簡潔なWeChatグラフィックレイアウトツールです。このエディタはすべての基本的なMarkdown ...

2年前

099.8K

TRELLIS：Microsoft开发的3D资产生成模型，支持多种格式和灵活编辑

TRELLIS：複数のフォーマットをサポートし、柔軟な編集が可能なマイクロソフト開発の3Dアセット生成モデル

概要 TRELLISは、マイクロソフトが開発した大規模3Dアセット生成モデルです。テキストや画像のプロンプトを受け取り、ラジアルフィールド、3Dガウシアン、メッシュなど、さまざまな形式で高品質な3Dアセットを生成することができます。TRELLISの中核をなすのは、統一された構造化潜在...

2年前

099.8K

NarratoAI：テキスト生成映画・TVナレーション・自動編集ツール

概論 NarratoAIは、映画やビデオのナレーション、自動編集、吹き替え、字幕生成を統合した完全自動化ツールです。大規模言語モデリング(LLM)技術により、コピーを自動生成し、対応するナレーションと字幕をビデオに自動編集し、ユーザーにワンストップを提供します。

2年前

099.6K

永続的なマイクロソフトQRコードのサーバーフリー生成

概要 serverless-qrcode-hubは、WeChatのグループチャットでQRコードが頻繁に失敗する問題を解決するために設計されたオープンソースツールです。Cloudflare WorkersとD1データベースをベースにしており、従来のサーバーを必要としません。

AIハンズオンチュートリアル # AI Java オープンソースプロジェクト

1年前

099.5K

セカンド・ミー：個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や癖を学習し、あなたのことを理解する賢い人間になることができる。

1年前

099.5K

オートジェン：マイクロソフトが開発したマルチインテリジェントな身体対話フレームワーク

概要 AutoGenは、マイクロソフト社の研究者チームによって開発されたオープンソースのフレームワークであり、多知能体の対話を通じて大規模言語モデル（LLM）アプリケーションの構築を簡素化することを目的としている。このフレームワークにより、開発者は互いに対話し、協力してタスクを解決するAIエージェントを作成することができる。このアプローチは、LLMのパフォーマンスを向上させるだけでなく...

2年前

099.4K

DCT-Net：写真やビデオをスタイリッシュなアニメに変換するオープンソースツール

概説 DCT-Netは、DAMOアカデミーと北京大学王宣コンピューター技術研究所によって開発されたオープンソースプロジェクトで、画像のアニメスタイル変換を目的としている。このプロジェクトは、ディープラーニング技術を活用し、ドメインキャリブレーション翻訳（Domain-Calibrat...

2年前

099.4K

推奨されるGithubの優れたオープンソース・ダウンロードツール

今日のインターネットの急速な発展において、ユーザーが情報やリソースを入手するための重要な手段として、ダウンロードツールは欠かすことのできない役割を果たしている。この記事では、5つのオープンソース・ダウンロードツールを系統的に分析する：AB Download Manager、XDM（Xtreme Download ...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

099.3K

Fayデジタルヒューマンフレームワーク：言語モデルと3Dデジタルキャラクターを統合し、様々なアプリケーションシナリオをサポート。

包括的な紹介 Fayはオープンソースの3Dバーチャルデジタルヒューマンフレームワークであり、バーチャルショッピングガイド、バーチャルキャスター、アシスタント、ウェイター、教師、音声またはテキストベースのモバイルアシスタントなど、様々なアプリケーションシナリオのための言語モデルとデジタルキャラクタを統合しています。

2年前

099.1K

NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。

包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。

2年前

099.1K

ローカル・ディープ・リサーチ：詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...

1年前

098.9K

YOLOE: リアルタイムのビデオ検出と物体分割のためのオープンソースツール

YOLOEは清華大学ソフトウェア学院のマルチメディア・インテリジェンス・グループ（THU-MIG）が開発したオープンソースプロジェクトで、正式名称は「You Only Look Once Eye」。PyTorchフレームワークをベースにしており、YOLOシリーズの拡張機能に属している。

1年前

098.8K

Vanna: RAG技術を使ったテキストからの正確なSQLクエリの生成

包括的な紹介 VannaはMITライセンスのオープンソースPythonフレームワークで、RAG（Retrieval Augmented Generation）技術を使ってSQLクエリを生成することに重点を置いている。ユーザはRAGモデルを訓練し、自分のデータに適用し、質問をすると、Vannaは適切なSQLクエリを返す。

2年前

098.8K

TinyZero：DeepSeeK-R1ゼロのエピファニー効果を低コストで再現

一般的な紹介 TinyZeroは、カウントダウンと乗算タスクにおけるDeepSeeK-R1 Zeroのパフォーマンスを再現するために設計されたveRLベースの強化学習モデルである。驚くべきことに、このプロジェクトの実行コストはわずか30ドルです（2xH2...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

098.7K

AnkiAIUtils：メモリーカードを自動的に最適化する知的アシスタント、Ankiフラッシュカード学習AIツールセット

概要説明 AnkiAIUtilsは、フラッシュカード学習システムAnkiのために設計されたAI強化ツールのセットです。医学生によって開発されたこのツールは、AI技術により、学習中にユーザーが苦手とするカードを自動的に改善するように設計されています。ユーザーにパーソナライズされた学習をインテリジェントに提供します。

2年前

098.7K

MoneyPrinterPlus：ワンクリックで短い動画を作成するAIツール、無料のバッチミキシング

総合紹介 MoneyPrinterPlusは、AI技術によって、ワンクリックであらゆる種類の短い動画を生成・ミックスし、Jieyin、Shutterbugs、Xiaohongshu、Video Numberなどの複数の動画プラットフォームに自動的に公開することを目的としたオープンソースプロジェクトです。このツールは、ローカルおよびクラウドベースの音声モデルをサポートしており、チャット...

2年前

098.6K

DeOldify：モノクロ写真やビデオをAI技術でカラー化する定番のオープンソースツール

包括的な紹介 DeOldifyは、白黒写真やビデオのインテリジェントな着色と復元に特化した、ディープラーニング技術に基づくオープンソースプロジェクトです。このプロジェクトは、革新的なNoGAN学習方法を用いて、画像の着色プロセスにおける従来のGANネットワークの一般的な欠点を解決することに成功しています...

2年前

098.6K

Yutu：YouTube 命令行管理工具，接入AI全自动运营 YouTube 频道

Yutu：YouTubeのコマンドライン管理ツール、AIにアクセスしてYouTubeチャンネルを完全自動化

一般的な紹介 Yutuは、GitHubでホストされ、eat-pray-aiチームによって開発されたYouTubeユーザーのために設計された強力なオープンソースのコマンドラインツールです。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

098.5K

AI RSS Generator：ウェブコンテンツをAIでRSSフィードに変換するツール

概要 AI RSSは、AI技術によりウェブコンテンツをRSSフィードに変換する革新的なツールです。ブラウザ・プラグインとサーバー・サイドの2つの主要部分から構成されています。ブラウザプラグインでは、ウェブページからリストを選択し、構造化データ記述（SDD）ファイルを生成することができます。

2年前

098.5K

DiffSynth-Engine：オープンソースエンジン、FLUXの低既存デプロイメント用、Wan 2.1

一般的な紹介 DiffSynth-EngineはModelScopeによって立ち上げられたオープンソースプロジェクトで、GitHubでホストされています。拡散モデリング技術に基づいており、画像や動画を効率的に生成することに重点を置き、開発者が本番環境でAIモデルを展開するのに適しています...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

098.4K

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル（DeepSeek、Gemini、Tongyi Thousand Questionsなど）をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...

1年前

098.4K

アヌビス：作業負荷の証明を通じてAIクローラーのクローリングを妨害する

一般的な紹介 Anubisは、AIクローラーからウェブサイトを保護するためにTecharoHQチームによって開発されたオープンソースツールです。HTTPリクエストにSHA256 Proof-of...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

098.4K

Zola：ドキュメントのアップロードとマルチモデルをサポートするオープンソースのAIチャット・ウェブアプリ

一般的な紹介 Zolaは、開発者のJulien Thibeaut（GitHubユーザー名ibelick）によって開発され、GitHubでホストされているフリーでオープンソースのAIチャットアプリである。最大の特徴は、複数のAIモードをサポートしていることです。

1年前

098.2K

Step-Audio：マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話（例：中国語、英語、日本語）、感情音声（例：嬉しい、悲しい）、地域方言（例：広東語、四川語、中国語、英語、日本語）をサポートしています。

1年前

098.1K

olmOCR: PDF 文書のテキスト変換、表、数式、手書き内容の認識のサポート

概論 olmOCRは、アレン人工知能研究所（AI2）のAllenNLPチームによって開発されたオープンソースツールで、PDFファイルの変換に重点を置いています...

1年前

098.1K

MCP Containers：基于 Docker 提供数百种 MCP 容器化部署

MCPコンテナ：Dockerをベースにした数百のMCPコンテナ展開

一般的な紹介 MCP ContainersはGitHubでホストされているオープンソースプロジェクトで、Model Context Protocol (MCP)サーバー用のコンテナ化されたソリューションを提供することに焦点を当てています。Dockerコンテナによって簡素化された...

1年前

098K

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。

1年前

098K

Yuxi-Know：知識グラフベースのインテリジェントQ&Aプラットフォーム

Yuxi-Knowは、ナレッジグラフとRAG（Retrieval Augmented Generation）技術を組み合わせたオープンソースのインテリジェントなQ&Aプラットフォームで、ユーザーが素早く正確な回答を得られるように支援します。知識グラフを保存するためにNeo4jをベースにしており、FastAPIとVueJS構造を使っています。

1年前

098K

プロンプトフー：安全で信頼性の高いLLMアプリケーションテストツールの提供

包括的な紹介 promptfooは、大規模言語モデル（LLM）アプリケーションの評価とレッドチームテストに特化したオープンソースのコマンドラインツールおよびライブラリです。信頼性の高いプロンプト、モデル、検索ベースの生成（RAG）を構築するためのツール一式を開発者に提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

097.9K

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル（LLM）を微調整するために特別に設計されたオープンソースツールで、GitHubでホストされています。ファイルのアップロード、コンテンツの自動セグメント化、質問と回答の生成、そして最終的に適切なLLMの出力を可能にする、使いやすいインターフェースを提供します。

1年前

097.8K

Open R1：Hugging Face 复现 DeepSeek-R1 的训练过程

オープンR1：ハグする顔がDeepSeek-R1のトレーニングプロセスを再現

一般的な紹介 Hugging FaceのOpen R1プロジェクトは、完全にオープンソースのDeepSeek-R1複製プロジェクトであり、R1パイプラインの欠けている部分を構築し、誰もが複製して構築できるようにすることを目的としています。プロジェクトはシンプルに設計されており、主にトレーニングと評価で構成されています。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

097.8K

Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム

概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。

1年前

097.8K

Qwen2.5-Omni：マルチモーダル入力とリアルタイム音声対話のためのエンド計測モデル

包括的な紹介 Qwen2.5-Omniは、Alibaba Cloud Qwenチームによって開発されたオープンソースのマルチモーダルAIモデルです。テキスト、画像、音声、動画など複数の入力を処理し、リアルタイムでテキストや自然な音声による応答を生成することができる。このモデルは2025年の3 ...

1年前

097.8K

Chonkie: 軽量なRAGテキストチャンキングライブラリ

包括的な紹介 Chonkieは軽量で効率的なRAG(Retrieval-Augmented Generation)テキストチャンキングライブラリで、開発者が素早く簡単にテキストをチャンキングできるように設計されています。このライブラリは、... を含む様々なチャンキング手法をサポートしています。

1年前

097.6K

OmniSQL: 自然言語を高品質なSQLクエリに変換するモデル

概要 OmniSQLは、RUCKBReasoningチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。OmniSQLの主な機能は、ユーザーが入力した自然言語による質問を高品質なSQLクエリ文に変換することです。

1年前

097.6K

Neural4D：高解像度3Dモデリングデジタル資産を生成するAIプラットフォーム

概論 Neural4Dは、ユーザーが簡単なテキストや画像を入力するだけで、高品質な3Dモデルやアニメーションを素早く生成できるよう支援することに重点を置いた、AIベースの革新的なプラットフォームです。DreamTech社によって開発されたこのプラットフォームは、世界をリードするエンドツーエンドの大規模3Dモデル生成技術に依存しています。

1年前

097.6K

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

CoAI.Dev（チャットNio）：柔軟な課金とサブスクリプションプランモデルに対応したAIアグリゲーションアプリ向けワンストップB/Cソリューション

一般的な紹介 CoAI.Dev（旧Chat Nio）は、複数のAIモデルを統合し、分散ストリーミング、画像生成、クロスデバイス会話の同期と共有をサポートするチャットプラットフォームです。サブスクリプションとトークン課金システム、キートランジットサービス、複数のAIモデルを統合したチャットプラットフォームです。

2年前

097.6K

Activepieces：AI工作流程自动化，适合非技术用户的任务编排工具，开源Zapier替代品

Activepieces：AIワークフロー自動化、非技術者向けタスクスケジューリングツール、Zapier代替オープンソース

概要 Activepiecesは、企業や個人ユーザーに直感的で強力な自動化ソリューションを提供することに焦点を当てた、オープンソースのオールインワン自動化ワークフロープラットフォームです。TypeScriptで開発されたこのプラットフォームは非常にスケーラブルで、200以上の統合サービスをサポートしています。

2年前

097.5K

Copilot后端代理服务：用其他模型接管GitHub Copilot插件服务端

Copilotバックエンドプロキシサービス：他のモデルでGitHub Copilotプラグインサーバーを引き継ぐ

概要 Copilot Backend Agent Service は、DeepSeek などの他の FIM モデルを活用して GitHub Copilot プラグイン・サーバーを管理するために設計されたオープンソース・プロジェクトです。このサービスは、V...を含む様々なIDEをサポートしています。

2年前

097.5K

ChatFree（ChatAnywhere-2）：使用GPT API创建的本地Copilot，支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。

概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...

2年前

097.5K

AI reads books：AI逐页阅读PDF书籍，自动提取知识要点并生成总结

AIが本を読む：AIがPDFの本を1ページずつ読み、知識の要点を自動的に抽出し、要約を生成する。

包括的な紹介 AI-reads-books-page-by-pageはPythonベースのインテリジェントなPDFブック分析ツールで、PDFブックのページごとの分析を自動化し、重要な知識ポイントを抽出し、指定されたページ間隔の後にフェーズを生成します...

2年前

097.4K

k8m: Kubernetesクラスタ管理を簡素化する軽量AIコンソールツール

概要 k8mはクラスタ管理を簡素化するために設計された軽量でクロスプラットフォームなMini Kubernetes AI Dashboardです。AMIS上に構築されており、Kubernetes APIゲストとしてkomから利用可能です。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

097.4K

99AI：マルチモーダルAIサービスを統合した商用ウェブアプリケーション（無料オープンソース）

包括的な紹介 99AIはオープンソースのAIウェブアプリケーションプロジェクトで、導入が容易で敷居の低い統合AIサービスプラットフォームを提供することを目的としています。このプロジェクトは、インテリジェントな対話、マルチモーダルモデル、アプリケーションプラザ、ネットワーク検索をサポートし、AI絵画、音楽、ビデオを統合します。

2年前

097.2K

YTSage：YouTube下载器，免费下载YouTube视频，提取音频，获取字幕

YTSage: YouTubeダウンローダー、YouTubeビデオを無料ダウンロード、音声抽出、字幕取得

概要 YTSageは、クリーンなPyQt6インターフェイスを備えたモダンなYouTubeダウンロードツールです。ユーザーはYTSageを使って、あらゆる画質の動画をダウンロードし、音声を抽出し、字幕を取得し（自動生成字幕を含む）、動画のメタ情報を表示することができます。

2年前

097.1K

Midjourney Proxy：代理/逆向Midjourney Discord频道，实现AI绘图API调用（免费测试）

Midjourney Proxy: AIマッピングAPIコールのためのMidjourney Discordチャンネルのプロキシ/リバーシング（無料テスト）

包括的な紹介 Midjourney Proxyは、MidjourneyのDiscordチャンネルにAI描画機能をAPI形式に変換するプロキシサービスを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは完全にフリーでオープンソースであり、ワンクリックで顔の入れ替え、画像のブレンド、グラフの生成をサポートします。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

097.1K

NVIDIA Garak：LLMの脆弱性を検出し、安全な生成AIを実現するオープンソースツール

包括的な紹介 NVIDIA Garakは、大規模言語モデル（LLM）の脆弱性を検出するために特別に設計されたオープンソースツールです。静的、動的、適応的なプロービングを通して、イリュージョン、データリーク、ヒントインジェクション、エラーメッセージ生成、有害コンテンツ生成などの複数の弱点がないかモデルをチェックします。

2年前

097K

ConsisID：キャラクタ一貫性のある映像を生成するポートレート参照マップ、迅速な多端末統合

包括的な紹介 ConsisIDは、北京大学のYuan Rong氏のグループによって開発されたオープンソースプロジェクトであり、周波数分解技術によって、同一性のあるテキストからビデオへの生成（IPT2V）を実現することを目的としている。プロジェクトの中核は、DiT（Diffusion Transfor...

2年前

097K

LangGraph CodeAct：複雑なタスクを解決する知能を支援するコード生成

概要 LangGraph CodeActはLangChain AIチームによってGitHubでオープンソース化されたフレームワークで、CodeActアーキテクチャに基づいています（詳細は論文arXiv:2402.01030を参照）。CodeActは...

1年前

097K

CrisperWhisper：正確な逐語音声書き起こしツール

概要 CrisperWhisperは、OpenAI Whisperをベースとした、高速で正確な単語単位の音声書き起こしに特化した高度な音声認識ツールです。スピーチのフィルやポーズがあっても、正確な単語レベルのタイムスタンプを提供します。

2年前

096.8K

高速GraphRAG：高精度で低コストのグラフィカル検索機能拡張生成ツール

包括的な紹介 Fast GraphRAGはCirclemind AIによって開発されたオープンソースツールで、知識グラフとPageRankアルゴリズムによって効率的で正確な検索補強生成（RAG）を可能にします。このツールはユーザーの用途にインテリジェントに適応する。

2年前

096.7K

Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ

一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル（YOLO...

1年前

096.7K

ChatTTS：実際の人の話し声を模倣した音声生成モデル（ChatTTSワンクリックアクセラレーションパッケージ）

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。

1年前

096.7K

LlamaEdge：LLMをローカルで実行し、微調整する最も迅速な方法！

概要 LlamaEdgeは、ローカルデバイスやエッジデバイス上で大規模な言語モデル（LLM）を実行し、微調整するプロセスを簡素化するために設計されたオープンソースプロジェクトです。このプロジェクトはLlama2ファミリーのモデルをサポートし、OpenAI互換のAPIサービスを提供します。

2年前

096.6K

GraphRAG Visualizer：可视化和探索Microsoft GraphRAG工件的工具

GraphRAG Visualizer: Microsoft GraphRAGアーティファクトを視覚化・探索するツール

はじめに GraphRAG Visualizer は、Microsoft GraphRAG の成果物を視覚化し、探索するために設計されたウェブベースのツールです。アップロードされたPar...

2年前

096.6K

FlowDown：iOS/macOS向けのスムーズなAIクライアント体験

概要 FlowDown-Appは、SwiftとUIKitを使用して開発された、軽量で効率的なAI対話クライアントです。このアプリは標準バージョン（FlowDown...

1年前

096.5K

Melty：AIを搭載したコードエディターを体験しよう！

概論 Meltyは、チャットによる会話とGitによるバージョン管理を組み合わせた画期的なAIコードエディターである。ReplicateのCharlieとJacksonによって開発されたこのツールは、従来のAIコーディングツールのペインポイントを解決することを目指している。最大の特徴は...

2年前

096.5K

Amurex：オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成

概要 Amurexは、The Personal AI Companyによって開発されたオープンソースのAIミーティングアシスタントで、インテリジェントな機能によってミーティングの効率を向上させるように設計されています。Amurexは、リアルタイムのアドバイスを提供し、インテリジェントなサマリーを生成し、ミーティング内容を記録し、自動的にフォローを送信することができます。

2年前

096.4K

CogAgent: Smart Spectrumのグラフィカル・インターフェース自動化のためのオープンソースのインテリジェント視覚言語モデル

包括的な紹介 CogAgentは清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースの視覚言語モデルであり、プラットフォーム間のグラフィカルユーザインタフェース(GUI)操作の自動化を目的としている。このモデルはCogVLM(GLM-4V-9B)をベースにしており、中国語と英語の二ヶ国語をサポートしている。

2年前

096.4K

サナ：高解像度画像の高速生成、0.6Bの超小型モデル、薄型ラップトップGPU動作

概要 Sanaは、NVIDIA Labsによって開発された効率的な高解像度画像生成フレームワークであり、最大4096×4096の解像度の画像を数秒で生成することができる。Sanaは、線形拡散変換器と深層圧縮自己エンコーダ技術を採用し、大幅に...

2年前

096.3K

Open Canvas：代码编辑协作画布，开源版OpenAI Canvas/Claude Artifacts

Open Canvas: コード編集が可能なコラボレーション・キャンバス、OpenAI Canvasのオープンソース版/Claude Artifacts

LangChainは、デュアルエージェントメモリ機能を内蔵し、完全な実行の詳細を観察するために統合されたスミスを使用して、ドキュメントの編集とコラボレーション体験を強化するために設計されたオープンソースのWebアプリケーション、Open Canvasを紹介します。このプラットフォームはOpenA...

1年前

096.2K

LogoCreator：オープンソースのロゴジェネレーター、AIインテリジェンスを使用してプロフェッショナルなブランドロゴを生成します。

一般的な紹介 LogoCreatorは、Together AIとFluxモデルに基づいたオープンソースのロゴ・ジェネレーターで、企業や個人に迅速でプロフェッショナルなロゴ・デザイン・サービスを提供することに焦点を当てています。このプロジェクトは、開発者Nutlopeによって開発され、Gitでオープンソース化されています...

2年前

096.2K

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル（LLM）です。従来の音声認識システムとは異なり、Ultravoxは音声認識（ASR）ステージを別途用意する必要がなく、音声を直接高次元空間に...

2年前

096.2K

1つのハブ：OpenAIインターフェースの管理と配布、複数のモデルと統計機能のサポート

概要 One Hubは、One APIの二次開発に基づいて開発されたOpenAIのインターフェイス管理および配信システムです。より広範なモデルのサポートと統計機能の向上を目的として、MartialBEによって開発されました。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

096.1K

AI ContentCraft：生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft：ショートストーリー、ダイアログスクリプト、ナレーション、グラフィックを生成するための多機能AIコンテンツ作成ツール

概要 AI ContentCraftは、テキスト生成、音声合成、画像生成などを統合した多機能なコンテンツ作成ツールです。ストーリー、ポッドキャストスクリプト、付随するオーディオやビデオコンテンツを素早く生成することができます。このツールは複数の言語変換をサポートし、バッチ処理も可能です。

2年前

096K

腾讯混元3D（Hunyuan3D）：生成高分辨率3D资产，多种3D素材生成工作流

Tencent Hybrid 3D（Hunyuan3D）：高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー

包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。

2年前

095.9K

AiPy：データ分析のためのPythonコード実行タスクの自動化

概要 AiPyはKnownsecチームによって開発されたオープンソースのPythonコマンドラインツールです。大規模言語モデル(LLM)とPython実行環境を組み合わせ、Pytho...

1年前

095.7K

Baichuan-Audio: リアルタイムの音声対話をサポートするエンドツーエンドのオーディオモデル

包括的な紹介 Baichuan-AudioはBaichuan Intelligence (baichuan-inc)によって開発されたオープンソースプロジェクトで、GitHubでホストされており、エンドツーエンドの音声対話技術に焦点を当てています。このプロジェクトは、完全な音声処理フレームワークを提供し、音声...

1年前

095.5K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab：専用のOCR認識AIモデル、PDF to Markdown（オープンソース/API）

包括的な紹介 Datalabは、OCR、レイアウト分析、PDFからMarkdownへの変換などに焦点を当てた高度なAIモデルを幅広く提供しています。これらのモデルは高性能であるだけでなく、使いやすくオープンソースです。プラットフォーム上のマーカーモデルは、迅速かつ正確に...

2年前

095.5K

オースティン：本の登場人物の関係を分析し、グラフを生成するAIツール

概要 AustenはオープンソースのAIツールで、AngularフレームワークとAnalogjsの初期化、Mermaidjsの技術を組み合わせ、書籍の登場人物の関係を分析するためのチャートを生成します。ユーザーはOpen...

1年前

095.4K

code2prompt: コードライブラリをビッグモデルで理解可能なプロンプトファイルに変換する

一般的な紹介 code2promptは、開発者Mufeed VHによって作成され、GitHub上でホストされているオープンソースのコマンドラインツールで、ユーザーがコードベース全体をLarge Language Model（LLM）に適したプロンプト（プロンプト...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

095.3K

Zed: Rustによって開発された高性能なマルチプレイヤー共同コードエディタ

一般的な紹介 Zedは、AtomとTree-sitterのクリエイターによって開発された、高性能なマルチユーザー共同コードエディターです。Rust言語で書かれたZedは、高速で流動的なコーディング体験を提供するように設計されています。主な機能として、マルチプレイヤー...

2年前

095.3K

包括的な紹介 Dify-Plusは、Difyオープンソースプロジェクトの二次開発をベースにしたAIアプリケーション開発プラットフォームです。Dify-Plusは、Difyをベースに新しい管理センターを追加し、エンタープライズシナリオ向けに機能を最適化しています。このプロジェクトは、当初は企業の内部利用を目的としていましたが、後にコミュニティにも同様のニーズがあることがわかり、Dify-Plusを開発しました。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

095.2K

Moshi: 複数言語とアクセントをサポートするリアルタイム音声対話フレームワーク。

はじめに Moshi Chatは、フランスの非営利AI研究所Kyutaiが開発したエンドツーエンドのリアルタイムAI音声アシスタントです。リアルタイムで話を聞くだけでなく、自然な会話を行い、見る、聞く、話すといったマルチモーダルなインタラクションをサポートします。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

095.2K