Chat2DB: インテリジェントSQLとデータレポート生成のためのデータベース管理ツール一般的な紹介 Chat2DBは、CodePhiliaXチームによって開発されたオープンソースのデータベース管理とSQLクライアントツールです、AI機能と統合され、迅速にSQLクエリを記述するためのサポート、データベースを管理し、データレポートを生成し、マルチデータベースとの相互作用。16以上のデータベースをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# AIデータ分析10ヶ月前056.8K
NeoAI:AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト一般的な紹介 NeoAIは革新的なオープンソースのAIアシスタントツールで、ユーザーは自然言語対話を通じて簡単にコンピュータを制御・管理することができます。コードを書くことなく、日常的な対話だけでファイルの検索、タスクの自動化、デバイスの管理などを行うことができます。最新のAIリソース# AI Java オープンソースプロジェクト# デスクトップ・オートメーション・インテリジェンス1年前056.8K
MetaGPT:自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan(アレクサンダー・ウー)によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを協調的なエンティティに結合することです...最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング# インテリジェントボディ開発フレームワーク10ヶ月前056.8K
AudioX: 参照されたテキスト、画像、ビデオからオーディオと音楽を生成概要 AudioXはZeyue TianらによるGitHub上のオープンソースプロジェクトである。AudioXはDiffusion Transf...最新のAIリソース# AI Java オープンソースプロジェクト# AIミュージック9ヶ月前056.7K
DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...最新のAIリソース# AI Java オープンソースプロジェクト# マルチモーダルなリアルタイム・インタラクティブ製品11ヶ月前056.7K
ImBD:AIによって生成されたコンテンツの検出。包括的な紹介 ImBD(Imitate Before Detect)は、AAAI 2025カンファレンスで発表された、先駆的な機械生成テキスト検出プロジェクトである。ChatGPTのような大規模言語モデル(LLM)の普及に伴い、A...最新のAIリソース# AI Java オープンソースプロジェクト# AI教育ツール1年前056.5K
Search-R1: 検索と推論のための大規模モデルを学習する強化学習概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)技術によって大規模言語モデル(LLM)を学習し、モデルが自律的に学習することを可能にします...最新のAIリソース# AI Java オープンソースプロジェクト# 大型モデルの微調整10ヶ月前056.3K
InstantID:画像をアップロードし、さまざまなスタイルの画像を生成するためにポートレート機能を移行する。包括的な紹介 InstantIDは、1枚の参照ID画像を使用して、高い忠実度を確保しながら、パーソナライズされたスタイルやポーズの画像を数秒で生成することに焦点を当てた先進技術です。この技術は、顔画像とランドマークマップを統合することで、拡散モデルに基づいたソリューションを使用しています。最新のAIリソース# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト# AI フェイススワップとドレスアップ1年前056.3K
AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション11ヶ月前056.2K
Continue:VSコードと統合し、モデルと埋め込みをカスタマイズするオープンソースのAIコードアシスタント一般的な紹介 Continueは、ソフトウェア開発者の効率を向上させるために設計されたオープンソースのAIコードアシスタントです。主な機能として、コードの自動補完、コードの最適化、VS CodeとJetBrains IDE用のインテリジェントなコード提案があります。最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング11ヶ月前056.2K
OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成12ヶ月前056.2K
Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。最新のAIリソース# AI Java オープンソースプロジェクト1年前056.1K
マッド・プロフェッサー:学術論文の読解と分析を支援するAIツール一般的な紹介 Mad Professor (Grumpy Professor Reads Papers) は、研究者や学生のために設計されたオープンソースのAI学術ツールで、学術論文の読み取りと分析を簡素化します。PDF処理、AI翻訳、RAG検索、AI質問...を統合しています。最新のAIリソース# AI Java オープンソースプロジェクト# AI教育ツール8ヶ月前056.1K
MNN-LLM-Android: AndroidのためのMNNマルチモーダル言語モデリング包括的な紹介 MNN(Mobile Neural Network)は、アリババが開発し、モバイルデバイス向けに最適化された、効率的で軽量なディープラーニングフレームワークである。MNNは、モバイルデバイス上で高速な推論が可能なだけでなく、テキスト生成などのマルチモーダルなタスクもサポートしている...最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション12ヶ月前056.1K
A2A:グーグル、AIインテリジェンス間の通信のためのオープンプロトコルを公開概要 A2A (Agent2Agent)は、異なるフレームワークやベンダーによって開発されたAIインテリジェンスが相互に通信し、コラボレーションすることを可能にするためにGoogleによって開発されたオープンソースプロトコルである。このプロトコルは、インテリジェンスが互いの能力を発見し、タスクを共有し、作業を完了するための標準化された一連の方法を提供する。最新のAIリソース# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク9ヶ月前055.8K
クローンボイス:Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。最新のAIリソース# AI Java オープンソースプロジェクト# AIボイスクローニング1年前055.8K
CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...最新のAIリソース# AI副業お金儲けプロジェクト# AI 画像の拡大と復元# AI Java オープンソースプロジェクト1年前055.8K
オープンR1:ハグする顔がDeepSeek-R1のトレーニングプロセスを再現一般的な紹介 Hugging FaceのOpen R1プロジェクトは、完全にオープンソースのDeepSeek-R1複製プロジェクトであり、R1パイプラインの欠けている部分を構築し、誰もが複製して構築できるようにすることを目的としています。プロジェクトはシンプルに設計されており、主にトレーニングと評価で構成されています。最新のAIリソース# AI Java オープンソースプロジェクト12ヶ月前055.7K
FreeAI: PollinationsパッケージをベースにしたフリーのAIツール。概要 FreeAIは、Pollinations.AI APIをベースとしたオープンソースのAIアプリケーションプラットフォームで、無料で無制限のAIチャットアシスタント、画像生成、音声合成サービスを提供している。このプロジェクトは、開発者のAzad-slによってG...最新のAIリソース# AI Java オープンソースプロジェクト# AI統合マルチモデル対話プラットフォーム9ヶ月前055.7K
uniOCR: クロスプラットフォームのオープンソーステキスト認識ツール概論 uniOCRはmediar-aiチームによって開発されたオープンソースのテキスト認識ツールです。Rust言語に基づいており、macOS、Windows、Linuxシステムをサポートしています。画像からテキストを抽出することができます。最新のAIリソース# AI Java オープンソースプロジェクト# OCR9ヶ月前055.5K
TANGO:全身デジタル人物の協調ジェスチャーポートレート映像を音声で生成するツール概論 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...最新のAIリソース# AI Java オープンソースプロジェクト# AIデジタルマン1年前055.5K
Knowledge Graph Studio (WhyHow): ナレッジグラフの作成と管理のためのオープンソースプラットフォーム。包括的な紹介 Knowledge Graph Studio (KGS) は、RAGネイティブなナレッジグラフの作成と管理のプロセスを簡素化するために設計されたオープンソースのプラットフォームです。このプラットフォームは、ルールベースのエンティティ解決、モジュール式のグラフ構築、柔軟なデータ...最新のAIリソース# AI Java オープンソースプロジェクト#ナレッジグラフ1年前055.5K
オープン・ディープ・リサーチ:LangChainのディープ・リサーチ用オープンソース・インテリジェント・アシスタント包括的な紹介 Open Deep Researchは、あらゆるトピックに関する包括的なリサーチレポートを作成できるウェブベースのリサーチアシスタントです。このシステムでは、時間のかかる調査フェーズに進む前に、レポートの構成を計画し、確認することができる、計画と実行のワークフローを使用しています...最新のAIリソース# AI Java オープンソースプロジェクト# 詳細な調査レポートの作成10ヶ月前055.5K
ファブリック:AIオープンソースのワークフローフレームワークで、多くのキューワードを統合し、様々なトランザクションを効率的に処理する。概論 ファブリックは、ダニエル・ミースラーによって開発されたオープンソースのAIフレームワークで、日常的なコンピュータ・タスクを簡素化・自動化し、人工知能を使いやすくすることを目的としている。モジュール設計とあらかじめ定義されたプロンプトワード(パターン)によって、ユーザーを効率的に支援する。最新のAIリソース# AI Java オープンソースプロジェクト# PROMPTS エイド1年前055.4K
GFPGAN:テンセントのオープンソース顔修復アルゴリズム総合紹介 GFPGAN(Generative Facial Prior GAN)は、Tencent ARC(Applied Research Center)が開発したオープンソースの顔修復アルゴリズムです。このアルゴリズムでは、事前に訓練された顔GAN...最新のAIリソース# AI 画像の拡大と復元# AI Java オープンソースプロジェクト1年前055.3K
Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング12ヶ月前055.3K
GraphRAG-Dify:DifyにGraphRAGの機能を装備する包括的な紹介 GraphRAG-Difyは、GraphRAGとDifyの技術を組み合わせて、AIエージェントを素早く作成し、デプロイするために設計されたオープンソースプロジェクトです。このプロジェクトでは、サービス構築にFastAPIとUvicornを使用し、DSLのインポートをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト#ナレッジグラフ1年前055.3K
WeChatのCoze:WeChatにCoze(ボタン)ボットを導入概要 Coze on WeChatは、ユーザーがCozeプラットフォームからWeChatにAIボットをシームレスに接続できるように設計されたオープンソースプロジェクトです。chatgpt-on-wechatとdify-on-wechatの開発に基づいています。最新のAIリソース# AI接客ロボット# AI Java オープンソースプロジェクト10ヶ月前055.2K
Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# 大型モデルの微調整11ヶ月前055.1K
MiniMind:ゼロから2時間のトレーニング 26MパラメータGPTオープンソースツール一般的な紹介 MiniMindは、開発者jingyaogongによって作成されたオープンソースプロジェクトである。MiniMindの主な特長は、1つのNVIDIA製CPUで2時間...最新のAIリソース# AI Java オープンソースプロジェクト10ヶ月前055K
ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション1年前055K
Qwen2.5-VL:画像・ビデオ文書解析のためのオープンソース・マルチモーダルラージモデル総合紹介 Qwen2.5-VLは、アリババクラウド(Alibaba Cloud)のQwenチームによって開発されたオープンソースのマルチモーダルビッグモデルです。Qwen2.5-VLはQwen2-VLのアップグレード版で、Qwen2.5-VLをベースに、テキスト、画像、動画、ドキュメントを同時に扱うことができます。最新のAIリソース# AI Java オープンソースプロジェクト10ヶ月前054.9K
Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング10ヶ月前054.9K
TRELLIS:複数のフォーマットをサポートし、柔軟な編集が可能なマイクロソフト開発の3Dアセット生成モデル概 要 TRELLISは、マイクロソフトが開発した大規模3Dアセット生成モデルです。テキストや画像のプロンプトを受け取り、ラジアルフィールド、3Dガウシアン、メッシュなど、さまざまな形式で高品質な3Dアセットを生成することができます。TRELLISの中核をなすのは、統一された構造化潜在...最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ1年前054.9K
Magic MCP: モダンなUIコンポーネントを生成するMCPサービス一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。最新のAIリソース# AI Java オープンソースプロジェクト# AIページデザイン# MCPサービス10ヶ月前054.8K
フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング概要 フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。最新のAIリソース# AI Java オープンソースプロジェクト# AIボイスクローニング11ヶ月前054.8K
Cog-ComfyUI:APIを使ったComfyUIワークフローの実行一般的な紹介 Cog-ComfyUIは、APIを介してComfyUIワークフローを実行するために設計されたオープンソースプロジェクトです。GitHubユーザーのfofrによって作成されたこのプロジェクトは、ComfyUIワークフローを統合して実行する効率的な方法を提供します。最新のAIリソース# AI画像生成エイド# AI Java オープンソースプロジェクト# ComfyUI12ヶ月前054.8K
J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート概論 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的なディスカッションを支援するように設計されたインテリジェントなコード・アシスタントです。最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング1年前054.7K
AIオートフリー:自動化ツール(CursorやWindsurfなど)を使用したAI IDEが使い放題概要 AI Auto Freeは、CursorやWindsurfなどのAI駆動統合開発環境(IDE)をユーザーが無制限に利用できるように設計された強力な自動化ツールです。このプロジェクトはクロスプラットフォームをサポートし、複数の言語機能を含んでいます。最新のAIリソース# AI Java オープンソースプロジェクト12ヶ月前054.7K
PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット(例:太字、斜体、色、スーパー...)を保持することをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング11ヶ月前054.7K
IC-Light(V2):画像照明制御マジック、画像の光と影、背景を制御する包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、2つの主要なモデルを提供する:テキスト条件付き再照明モデルと背景条件付きモデル。ユーザは、このモデルを使って...最新のAIリソース# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト1年前054.7K
CrewAI:複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...最新のAIリソース# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク1年前054.6K
Mem0: AIアシスタントやエージェントにインテリジェントなメモリレイヤーを提供するオープンソースプロジェクト概論 Mem0(「メンゼロ」と発音)は、AIアシスタントやエージェントにインテリジェントなメモリーレイヤーを提供するオープンソースプロジェクトである。ユーザーの好みを記憶し、個人のニーズに適応し、時間の経過とともに改善されるため、顧客サポートのチャットボット、AIアシスタント、自律型システムに最適です。最新のAIリソース# AI Java オープンソースプロジェクト1年前054.6K
DiffRhythm:最大4分45秒の曲を10秒で生成。概要 DiffRhythmはASLP-lab (Audio, Speech and Language Processing Group, Northwestern Polytechnical University)によって開発されたオープンソースプロジェクトで、人工知能技術によるエンドツーエンドの音楽作成に焦点を当てています。DiffRhythmはLatent Diffu...最新のAIリソース# AI Java オープンソースプロジェクト# AIミュージック10ヶ月前054.6K
InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル包括的な紹介 InternVLは、上海人工知能研究所(OpenGVLab)によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。最新のAIリソース# AI Java オープンソースプロジェクト9ヶ月前054.6K
Tencent Hybrid 3D(Hunyuan3D):高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ12ヶ月前054.4K
Cursor Auto Register: 自動的にCursorアカウントを作成・管理するオープンソースツール概要 Cursor Auto RegisterはGitHubでホストされているオープンソースプロジェクトです。開発者のddCat-mainによって作成され、ユーザーがCursor AIコードエディターのアカウントを自動的に登録・管理できるようにします。最新のAIリソース# AI Java オープンソースプロジェクト10ヶ月前054.4K
FinRobot:金融データ分析の効率化と投資リサーチを向上させる知的ボディ包括的な紹介 FinRobotはAI4Finance Foundationによって開発されたオープンソースのAIインテリジェンス・プラットフォームであり、金融分析用に設計されている。従来の言語モデルをカバーするだけでなく、様々なAI技術を取り入れ、金融業界に包括的なソリューションを提供することを目指しています。最新のAIリソース# AI Java オープンソースプロジェクト# AI 金融データ分析11ヶ月前054.4K
BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがChromeエクステンションとNode.jsサービスを通じて、ログ、ネットワークリクエスト、ブラウザアクティビティをリアルタイムで監視することを可能にします。最新のAIリソース# AI Java オープンソースプロジェクト# MCPサービス10ヶ月前054.2K
Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装概要 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。このプロジェクトは、K...最新のAIリソース# AI Java オープンソースプロジェクト# デスクトップ・オートメーション・インテリジェンス1年前054.2K
エージェントS:人間のようにコンピュータを操作する知的体のためのオープンソース・フレームワーク一般的な紹介 エージェントSは、Simular AI社によって開発されたオープンソースのフレームワークであり、グラフィカル・ユーザー・インターフェース(GUI)を通じて人間のようにコンピュータを操作することができる。マルチモーダル大規模言語モデルと経験的学習技術を使用して、ウェブの閲覧、文書の編集、ソフトウェアの使用などのタスクを実行する。最新のAIリソース# AI Java オープンソースプロジェクト# デスクトップ・オートメーション・インテリジェンス9ヶ月前054.1K
ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成11ヶ月前054.1K
PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍を整理したいユーザのためにGitHubでホストされています。このツールは、以下の方法で動作します。最新のAIリソース# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング10ヶ月前054.1K
アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル(LLM)のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング11ヶ月前053.9K
KTransformers:大規模モデル推論パフォーマンス・エンジン:極限の加速、柔軟な権限付与KTransformers:大規模モデル推論のボトルネックを克服するための高性能Pythonフレームワーク。 KTransformersは、単なるモデル実行ツールにとどまらず、極めて優れたパフォーマンス最適化エンジンのセットであり、柔軟なインターフェース強化プラットフォームでもあります。 KTransf...最新のAIリソース# AI Java オープンソースプロジェクト11ヶ月前053.7K
OpenWebUI-Monitor:OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。最新のAIリソース# AI副業お金儲けプロジェクト# AI Java オープンソースプロジェクト1年前053.7K
Step1X-Edit:自然言語指示による画像編集のためのオープンソースツール一般的な紹介 Step1X-Editは、Stepfun AIチームによって開発され、GitHubでホストされているオープンソースの画像編集フレームワークです。マルチモーダル大規模言語モデル(Qwen-VL)と拡散変換器(DiT)を組み合わせることで、ユーザーはシンプルで自然な操作で画像を作成することができます。最新のAIリソース# AIイメージエディター# AI Java オープンソースプロジェクト8ヶ月前053.6K
Scira (MiniPerplx): Perplexityを模倣したオープンソースプロジェクトで、AI対話、ウェブ検索、天気クエリなどを統合している。概論 MiniPerplx (Sciraに改名) はミニマリストデザインのAI駆動型検索エンジンであり、様々な便利な機能を統合し、ユーザーにあらゆる情報検索サービスを提供する。このプロジェクトでは、Next.js、Tailwi...最新のAIリソース# AI Java オープンソースプロジェクト# AI検索ツール1年前053.6K
ソニック:音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。最新のAIリソース# AI Java オープンソースプロジェクト# AIデジタルマン10ヶ月前053.6K
検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする包括的な導入検索に基づく音声変換WebUIは、使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、あらゆるスピーカー間の音声変換を可能にします。低 ...最新のAIリソース# AI Java オープンソースプロジェクト# AIボイスクローニング1年前053.6K
multi-model-bolt.new:AI駆動型フルスタック開発ツールBolt.newをベースとしたオープンソース修正版一般的な説明 multi-model-bolt.newは、TogetherAIモデルの使用を可能にするBolt.newの改良版で、展開、モバイル応答、音声入力などの機能をサポートしています。ユーザーは、ブラウザーで直接プロンプトを表示したり、...最新のAIリソース# AI IDE# AI Java オープンソースプロジェクト# AIプログラミング1年前053.5K
BlinkShot:プロンプトワードを入力してリアルタイム画像生成(Flux Schnellモデルへのフリーアクセス)概要 BlinkShotは、Together AIとFlux Schnellの技術を利用したオープンソースのリアルタイムAI画像ジェネレーターで、ユーザーがプロンプトを入力すると、高品質の画像を生成することができます。このプラットフォームは完全に無料で、ユーザーのカスタマイズや二次的なオープンソースをサポートしています。最新のAIリソース# AIオンライン画像生成# AI Java オープンソースプロジェクト1年前053.5K
DeOldify:モノクロ写真やビデオをAI技術でカラー化する定番のオープンソースツール包括的な紹介 DeOldifyは、白黒写真やビデオのインテリジェントな着色と復元に特化した、ディープラーニング技術に基づくオープンソースプロジェクトです。このプロジェクトは、革新的なNoGAN学習方法を用いて、画像の着色プロセスにおける従来のGANネットワークの一般的な欠点を解決することに成功しています...最新のAIリソース# AI 画像の拡大と復元# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト1年前053.5K
Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成# AIボイスクローニング11ヶ月前053.4K
NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。最新のAIリソース# AI画像生成エイド# AI Java オープンソースプロジェクト1年前053.3K
フィッシュ・エージェント:エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト包括的な紹介 フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...最新のAIリソース# AI Java オープンソースプロジェクト# AIボイスクローニング# マルチモーダルなリアルタイム・インタラクティブ製品1年前053.3K
Vercel AI SDK:人気のフロントエンドフレームワークでAI搭載アプリケーションを構築する概論 Vercel AI SDKは、React、Svelte、Vue、Solidなどのフレームワークを使用してAIアプリケーションを構築する開発者を支援するために、Vercelチームによって開発されたオープンソースツールです。複数の言語モデルプロバイダをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト12ヶ月前053.3K
オープンパイロット:オープンソースの自律走行システム。概説 OpenPilotは、comma.aiが開発したオープンソースの自律走行システムで、高度な運転支援機能により既存の自動車の運転体験と安全性を向上させる。2016年の最初のリリース以来、OpenPilotは2...最新のAIリソース# AI Java オープンソースプロジェクト11ヶ月前053.3K
InstantIR:破損した画像の修復と画像の高解像度ズームのオープンソースプロジェクト、最低16Gのビデオメモリ一般的な説明 InstantIRは、InstantXチームによって開発された革新的な単一画像復元モデルで、破損した画像の高品質復元を実行することができ、非常に高品質で生き生きとした細部で破損した画像を復活させるように設計されています。このツールは、画像の細部を復元するだけでなく...最新のAIリソース# AI 画像の拡大と復元# AI Java オープンソースプロジェクト1年前053.2K
VLM-R1:自然言語による画像ターゲットの位置決定のための視覚言語モデル包括的な紹介 VLM-R1は、Om AI Labによって開発され、GitHubでホストされているオープンソースの視覚言語モデリングプロジェクトです。このプロジェクトは、DeepSeekのR1アプローチとQwen2.5-VLモデルを強化学習によって組み合わせたものです。最新のAIリソース# AI Java オープンソースプロジェクト# 視覚ターゲット検出11ヶ月前053.1K
サーバーレス高速デプロイ Grok3国内ミラーサイト概要 Grok Playgroundは、"Technical Crawling Shrimp "のチームによって開発されたオープンソースプロジェクトである。このツールの主な機能は、ユーザーがGrok3の国内ミラーサイトを10秒でデプロイできるようにすることです。 Grok3はxAIによって導入された人工知能モデルで、...最新のAIリソース# AI Java オープンソースプロジェクト10ヶ月前053.1K
NGCBot:ニュースプッシュ、AI対話、グループチャット管理のためのWeChatボット包括的な紹介 NGCBotはWeChatロボットオープンソースプロジェクトの開発に基づくHOOKメカニズムであり、開発者ngc660sec(Yunshan/eXM)によって作成され、GitHub上でホストされている 反復の2年後、V2.3の現在のバージョンは、最初のシンプルな機能から...最新のAIリソース# AI接客ロボット# AI Java オープンソースプロジェクト10ヶ月前053K
Kotaemon: 簡単に導入できるオープンソースのマルチモーダル文書クイズツール一般的な紹介 Kotaemonは、RAG(Retrieval Augmented Generation)に基づいたQ&A機能をエンドユーザーや開発者に提供するために設計されたオープンソースのドキュメントQ&Aツールです。このプロジェクトはCinnamonによって開発され、様々なLLM APIプロバイダー(例えばOpenA...最新のAIリソース# AI Java オープンソースプロジェクト#ナレッジグラフ# 知識検索とRAGフレームワーク1年前053K
RD-Agent:AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール一般的な紹介 RD-Agentは、研究開発(R&D)プロセスを自動化し最適化するために設計されたMicrosoftのオープンソースツールです。RD-Agentは、研究開発プロセスを自動化し、最適化するために設計されたMicrosoftのオープンソースツールです。このツールは、人工知能技術によってモデルとデータ開発の効率を向上させるデータ駆動シナリオに焦点を当てています。最新のAIリソース# AI Java オープンソースプロジェクト#インテリジェント・ボディ・アプリケーション10ヶ月前053K
AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント包括的な紹介 AsrToolsはCutscene、Racer、Must Cutなどの大手メーカーのインタフェースを内蔵したインテリジェントな音声テキスト変換ツールです。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の単語を出力することができます。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成1年前052.9K
WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。最新のAIリソース# AI Java オープンソースプロジェクト# 大型モデルの微調整9ヶ月前052.9K
最適化されたコード生成と表示のためのオープンWebUI概論 Open WebUI Artifacts OverhaulはOpen WebUIをベースにしたフォークプロジェクトで、開発者のNick Tonjumによって開発された。AIが生成したコードを改善することに焦点を当てたオープンソースツールです。AIニュース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション9ヶ月前052.8K
非構造化:オープンソースの非構造化ドキュメントの前処理、非構造化データ処理ツール包括的な紹介 Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのオープンソースコンポーネントのセットを提供します。その主な目的は、特に大規模な言語モデル(LL...最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング1年前052.7K
Klee:デスクトップ上でAIマクロモデルをローカルに実行し、プライベート知識ベースを管理する概論 Kleeはオープンソースのデスクトップアプリケーションで、オープンソースの大規模言語モデル(LLM)をローカルで実行し、安全なプライベート知識ベース管理とMarkdownノートテイク機能を利用できるように設計されています。OllamaとLlamaIndexの技術に基づいています。最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション10ヶ月前052.7K
Chonkie: 軽量なRAGテキストチャンキングライブラリ包括的な紹介 Chonkieは軽量で効率的なRAG(Retrieval-Augmented Generation)テキストチャンキングライブラリで、開発者が素早く簡単にテキストをチャンキングできるように設計されています。このライブラリは、... を含む様々なチャンキング手法をサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング11ヶ月前052.6K
BEN2: 画像や動画から背景を高速除去するディープラーニングモデル包括的な紹介 BEN2(Background Erase Network 2)は、Prama LLCによって開発されたディープラーニングモデルで、特に画像から背景を自動的に除去し、前景画像を生成するように設計されています。このモデルは革新的なConfiden...最新のAIリソース# AI Java オープンソースプロジェクト# AIキーイングによる背景変更7ヶ月前052.6K
Sidekick CLI: オープンソースのクロードコード置き換えツール概要 Sidekick CLIは、AIの支援により開発者のプロジェクト開発とデプロイプロセスを簡素化するために設計されたオープンソースのコマンドラインツールです。Claude Code、Copilot、Cursorにインスパイアされ、同様の機能を提供しています。最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング9ヶ月前052.6K
Dia:超リアルな多人数対話生成のための音声合成モデル一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成9ヶ月前052.6K
Aider: オープンソースのプログラミングアシスタントツール。一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング9ヶ月前052.6K
Step-Audio:マルチモーダル音声インタラクションフレームワーク。包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# AIボイスクローニング# マルチモーダルなリアルタイム・インタラクティブ製品11ヶ月前052.5K
One API:マルチモデルのAPI管理と負荷分散、配信システム総合紹介 One APIは、OpenAI ChatGPT、Anthropic Claude、Google PaLM 2、Geminiといった様々なビッグモデルをサポートするオープンソースのインターフェース管理・配布システムです。その ...最新のAIリソース# AI Java オープンソースプロジェクト1年前052.4K
WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...最新のAIリソース# AI接客ロボット# AI Java オープンソースプロジェクト11ヶ月前052.4K
Goose:全工程のプログラミング作業を自動化する、オープンソースのスケーラブルなプログラミング・インテリジェンス一般的な紹介 GooseはBlock社によって開発されたオープンソースのAIエージェントツールで、開発者が日常的な開発作業を自動化できるように設計されています。さまざまな大規模言語モデル(LLM)をサポートし、コマンドラインやデスクトップアプリケーションのインターフェースを介してユーザーと対話します。最新のAIリソース# AI Java オープンソースプロジェクト# AIプログラミング# インテリジェントボディ開発フレームワーク12ヶ月前052.4K
tldraw: オープンソースの無制限キャンバス・ホワイトボードSDK、最小限のワイヤーフレームとUMLダイアグラムを生成するAI一般的な説明 tldraw は、ユーザーが素早くグラフィックを描いたり、テキストを書き込んだり、即座に共同作業ができる無制限のキャンバスを提供する、無料で即座に共同作業ができるドローツールです。直感的なインターフェースと優れたパフォーマンスが特徴で、チームコラボレーションやリモートワークに適しています。オープンソースコミュニティを通じてサポートされているtldr...最新のAIリソース# AI Java オープンソースプロジェクトインフォグラフィック付き# AIホワイトボード1年前052.3K
AIが本を読む:AIがPDFの本を1ページずつ読み、知識の要点を自動的に抽出し、要約を生成する。包括的な紹介 AI-reads-books-page-by-pageはPythonベースのインテリジェントなPDFブック分析ツールで、PDFブックのページごとの分析を自動化し、重要な知識ポイントを抽出し、指定されたページ間隔の後にフェーズを生成します...最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストおよび音声/ビデオ要約ツール1年前052.3K
ジェミニ・ティーチャー:英語スピーキング発音矯正アシスタント概要 Gemini Teacherは、Google Gemini AIに基づいた英語スピーキング練習アシスタントです。ユーザーの英語の発音をリアルタイムで認識し、即座にフィードバックと修正案を提供します。このツールは、ユーザーが英語のスピーキングスキルを向上させるために設計されています...最新のAIリソース# AI Java オープンソースプロジェクト# AI教育ツール11ヶ月前052.2K
AIチャットボット Supabase: オープンソースのNext.jsとSupabaseで構築されたAIチャットボットをVercelに迅速に導入。概要 AIチャットボット Supabaseは、Next.jsとSupabaseで構築されたオープンソースのAIチャットボットテンプレートです。Vercelによって開発されたこのプロジェクトは、完全に機能的でカスタマイズ可能なチャットボットソリューションを提供することを目的としています。...最新のAIリソース# AI Java オープンソースプロジェクト# 知識検索とRAGフレームワーク1年前052.2K
Kolorsバーチャル試着:効率的なバーチャル試着/モデル着せ替え、テキストから画像生成モデル概要 Kolors Virtual Try-Onは、Kwai-KolorsチームによるHugging Faceプラットフォーム上のバーチャル試着アプリです。このアプリは、高度な人工知能技術を使って、ユーザーがバーチャル試着をするのを手助けします。最新のAIリソース# AI Java オープンソースプロジェクト# AI フェイススワップとドレスアップ1年前052.2K
Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。最新のAIリソース# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク1年前052K
LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...最新のAIリソース# AI Java オープンソースプロジェクト11ヶ月前052K
Spark-TTS:自然な音声を生成する音声合成ツール概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成(TTS)ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成# AIボイスクローニング10ヶ月前052K
Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール概論 Voice-Proは、Gradio WebUIをベースにした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Wh...最新のAIリソース# AI Java オープンソースプロジェクト# AI翻訳# AI音声合成1年前051.9K
FlowDown:iOS/macOS向けのスムーズなAIクライアント体験概要 FlowDown-Appは、SwiftとUIKitを使用して開発された、軽量で効率的なAI対話クライアントです。このアプリは標準バージョン(FlowDown...最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション10ヶ月前051.9K
CrisperWhisper:正確な逐語音声書き起こしツール概要 CrisperWhisperは、OpenAI Whisperをベースとした、高速で正確な単語単位の音声書き起こしに特化した高度な音声認識ツールです。スピーチのフィルやポーズがあっても、正確な単語レベルのタイムスタンプを提供します。最新のAIリソース# AI Java オープンソースプロジェクト# AI音声合成1年前051.9K