最新のAIリソース

共 3050 篇文章

順番に並べる

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル（DeepSeek、Gemini、Tongyi Thousand Questionsなど）をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...

1年前

074.6K

dsRAG: 非構造化データと複雑なクエリのための検索エンジン

概要 dsRAGは、非構造化データに対する複雑なクエリを処理するために設計された高性能検索エンジンである。dsRAGは、財務報告書、法律文書、学術論文など、高密度なテキストに含まれる難易度の高いクエリに対して特に優れた性能を発揮する。dsRAGは性能を向上させるために3つの主要なアプローチを採用している。

1年前

057K

SongGen: 曲の自動生成のための単段自己回帰変換器

包括的な紹介 SongGenは、テキストから曲への生成タスクのために設計された、オープンソースの単一ステージ自己回帰変換モデルである。このモデルは、テキスト入力からボーカルとバッキングトラックを含む楽曲を生成することができます。SongGenは、幅広い音楽属性をきめ細かく制御することができます...

1年前

055.4K

Graphiti: ダイナミックな知識グラフの構築とクエリーツール（時間を考慮したロングメモリプログラム）

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。

1年前

088.7K

コンバージェンス：エージェント・ブラウザで反復作業を自動化するAIアシスタント

はじめにコンバージェンスは、機械学習技術を駆使して、人々が自分の時間をコントロールできるようになることを支援する会社です。大規模なメタ学習モデル（LMLM）を開発することで、コンバージェンスのAIエージェント（ブラウザ・エージェント）は、リアルタイムで新しいスキルを習得することができます。

最新のAIリソース # デスクトップ・オートメーション・インテリジェンス

10ヶ月前

056.7K

Lingo.dev：ウェブサイトとアプリケーションの多言語ローカライズ翻訳

概論 Lingo.devはAIベースの多言語ローカリゼーションプラットフォームで、開発チームが製品を簡単に多言語に翻訳できるように設計されています。先進的な言語モデルを統合することで、Lingo.devはCI/CDプロセス中にコンテンツを即座にローカライズすることができます。

最新のAIリソース # AI翻訳

1年前

054.9K

メモベース：AIアプリケーションのためのユーザープロファイルに基づく長期記憶ソリューション

はじめに Memobaseは、生成的なAIアプリケーションのための長期的なユーザー記憶をサポートするように設計された、ユーザープロファイルに基づく記憶システムです。バーチャルコンパニオン、教育ツール、パーソナライズされたアシスタントなど、Memobaseは、AIが記憶し、理解し、成長するのを支援します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

057.1K

遠鎮デジタルヒューマン：デジタルヒューマンライブストリーミング、マウスフルショートビデオ、商業化されたAIバーチャルヒューマンライブストリーミングツール

総合紹介 Yuanzhen Digital Peopleは、デジタルピープルライブ放送、ショートビデオ制作、AIアシスタントなどのワンストップサービスをユーザーに提供することに特化したAIGC（人工知能生成コンテンツ）プラットフォームのリーディングカンパニーです。このプラットフォームは、AIアルゴリズム合成とGPTスタイルのビッグモデルを統合し、ユーザーが排他的なQ&Aモデルを作成することをサポートし、実...

最新のAIリソース # AIデジタルマン

1年前

063.5K

agent-twitter-client：无需Twitter API密钥，发送、转发推文

agent-twitter-client: Twitter APIキーなしでツイートを送信、リツイートする。

はじめに agent-twitter-clientは、Twitter APIキーなしで動作するTwitterクライアントです。このプロジェクトは、@the-convocation/twitter-scraperをベースに、TwitterのAPIキーなしで動作するように修正しました。

1年前

061.3K

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。

1年前

055.1K

ソーシャルメディア・アシスタント：Xiaohongshu、Jieyin、その他のプラットフォームのデータ収集用ブラウザ・プラグイン

総合紹介ソーシャルメディアアシスタント（social-media-copilot）は、XiaohongshuやJieyinなどのソーシャルメディアプラットフォーム用に設計されたデータ収集ブラウザプラグインです。このプラグインは、透かしのない画像や動画のワンクリックでのエクスポート、コメントの収集、作業データの収集、ダ...

最新のAIリソース

1年前

059.3K

MoBA：長い文脈処理のためのキミの大規模言語モデル

包括的な紹介 MoBA（Mixture of Block Attention）は、MoonshotAIによって開発された革新的なアテンションメカニズムであり、長いコンテキスト処理を行う大規模言語モデル（LLM）用に設計されている。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

063.4K

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...

1年前

059.8K

Bit Flows: WordPress自動ワークフロー・オーケストレーション・プラグイン

概要 Bit Flowsは、WordPressのために設計された強力な自動化ツールで、ユーザーがカスタムワークフローを作成し、タスクを自動化できるように設計されています。WordPress内での自動化、Shopif...

最新のAIリソース # ローコードワークフロー

1年前

058.8K

Webdraw：プログラミングなしでAIアプリを素早く作成・公開

一般的な紹介 Webdrawは、ユーザーがプログラミングなしでAIアプリケーションを生成・公開できる無料のオンラインプラットフォームです。このプラットフォームは、ドラッグ＆ドロップの簡単な操作で強力なAIツールを作成できる直感的なインターフェースを提供します。Webdrawは、以下のような幅広いAIモデルをサポートしています。

最新のAIリソース # コード開発なし

1年前

051.4K

短歌：知的応答と長期記憶を備えたチーム・コミュニケーション・ツール

はじめに Tankaは、コラボレーション効率とナレッジマネジメントを向上させるために、チーム向けに設計された革新的なAI主導のコミュニケーションツールです。長期記憶技術を統合し、インテリジェントな「第二のチーム脳」を構築することで、チームのチャット、ドキュメント、ビジネスコンテキストを自動的に保存・整理します。

最新のAIリソース # プロフェッショナル生産性ツール

1年前

058.9K

MGX：実際の開発チームのワークフローをシミュレートするマルチインテリジェンス・プログラミング・ツール

概要 MGX（MetaGPT X）は、MetaGPTチームによる人間のソフトウェアワークフローを模倣した世界初のマルチインテリジェンス開発プラットフォームです。MGXは、複数のプロフェッショナルなAIインテリジェンスのコラボレーションを通じて、ソフトウェアの計画、データ分析、コーディング、テスト、デプロイの全プロセスを実現します。

最新のAIリソース # AIプログラミング

1年前

0143.9K

AIBot PRO：複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された、.NET 6ベースのAIアグリゲーションクライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin...を統合します。

1年前

063.8K

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースのプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIは...

1年前

054.5K

HealthGPT：医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。

1年前

059.5K

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。

1年前

085.3K

HiveChat：企業内で迅速に展開できるAIチャットボット

概要 HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル（Deepseek、OpenAI、Claude、Geminiなど）を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。このチャットボットは ...

1年前

056.6K

Omnitool：すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス！

Omnitool.aiはオープンソースの「AIラボ」であり、学習者や趣味の人、最新のAI技術革新に興味のある人向けに、拡張可能なブラウザベースのデスクトップ環境を提供するように設計されている。Omnitool.iでは、OpenAIやrepl...などの様々なAIの専門家と、統一されたインターフェースを通じて共同作業を行うことができます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

051K

Bardeen AI：作業シナリオに特化したコードフリーのオーケストレーションワークフローツール

概要説明 Bardeen AIは、チームの生産性を高めるために設計された自動ワークフロープラットフォームです。一般的に使用されているツールとのシームレスな統合により、繰り返し作業を自動化し、データ管理を簡素化し、チームコラボレーションを強化します。ユーザーはコードを書く必要はありません。

最新のAIリソース # ローコードワークフロー

1年前

055.7K

Step-Video-T2V：多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ（VAE）により、このモデルは...

1年前

063.6K

OmniParser: ユーザーインターフェースのスクリーンショットを構造化された要素に解析し、大規模なモデルの理解と操作を容易にします。

一般的な紹介 OmniParserは、ユーザーインターフェースのスクリーンショットを構造化された理解しやすい要素に解析するためにMicrosoftによって開発されたツールです。このツールは、GPT-4Vが対応するインターフェイス領域に正確なアクションを生成する能力を大幅に向上させます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

057.3K

Genspark2api (失敗)

一般的な紹介 genspark2apiはGitHubでホストされているオープンソースのAPIサービスツールで、開発者のdeanxvによって作成されました。マルチモデルダイアログ、text-to-graph、text-to-videoをサポートするインターフェースサービスを提供し、ユーザはDoc...

1年前

053.9K

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。

1年前

052.2K

Step-Audio：マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話（例：中国語、英語、日本語）、感情音声（例：嬉しい、悲しい）、地域方言（例：広東語、四川語、中国語、英語、日本語）をサポートしています。

1年前

074.9K

マインドストリームAIアシスタント：深い知識検索ツール、統合された知識ベースを持つ専門知識研究アシスタント

総合紹介 Heartstream AI Assistantは、日常生活の百科事典や専門的な学術論文など、あらゆる種類の知識を効率的に習得できるように設計されたインテリジェントな検索および知識習得ツールです。Mindstream AIアシスタントを使用すると、ユーザーは簡単に全体のインターネットコンテンツを検索し、迅速に必要な情報を見つけ、効率的なMindstreamの状態に入ることができます...

最新のAIリソース # AI検索ツール

1年前

064.6K

Beatoven.ai：簡単なプロンプトを入力するだけで、著作権フリーの無料BGMを生成

はじめに Beatoven.aiは、クリエイターに著作権フリーの高品質なBGMを提供することを目的としたAIベースの音楽生成プラットフォームです。ユーザーはニーズに合った音楽を生成し、テキストプロンプトを入力することでパーソナライズすることができます。このプラットフォームは、複数のオーディオフォーマットに対応しています。

最新のAIリソース # AIミュージック

1年前

056.2K

Doctranslate.io：基于AI的全能翻译工具，支持文本、音频、图像和视频翻译

Doctranslate.io：テキスト、音声、画像、動画翻訳をサポートするAIベースのオールインワン翻訳ツール

概要 Doctranslate.ioは、多言語での文書翻訳をサポートするオンライン文書翻訳プラットフォームです。ユーザーは、.docx、.pptx、.pdfなどの様々な形式の文書をアップロードすることができ、プラットフォームは、迅速かつ正確に必要な言語に文書を翻訳します。

最新のAIリソース # AI翻訳

1年前

056K

インフルエンサーAI：バイラルなUGC広告を素早く生成！

概要インフルエンサーAIは、人工知能技術を利用してユーザー生成コンテンツ（UGC）広告を生成するプラットフォームである。このプラットフォームは、実際の撮影や契約を必要とせず、AIのバーチャルなインフルエンサーを通じて、コンバージョンの高い広告を作成する。ユーザーはウェブサイトへのリンクを提供するだけで、AIが広告を生成する。

最新のAIリソース # AIマーケティング

1年前

050.9K

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

透かし除去：オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...

1年前

084.1K

FoloUp：カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。

1年前

052.6K

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。

1年前

061.7K

音声、デジタル分割クローン、ビデオ透かし除去をサポートする無料オンラインデジタルパーソン生成ツール

総合紹介デジタル人物生成システムは無料でデジタル人物生成サービスを提供するサイトです。音声クローン、音声再生、デジタル人物画像テンプレート、デジタル分割クローン、動画透かし除去などの機能をサポートし、ユーザーに効率的で便利なデジタル人物生成ソリューションを提供することを目指しています。ユーザーがアップロード...

最新のAIリソース # AIオープンサービス # AIデジタルマン

10ヶ月前

060.2K

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

信頼できるAI：自動化された大規模言語モデル評価のためのフレームワーク。

包括的な紹介 DeepEvalは、大規模な言語モデリングシステムを評価およびテストするための、使いやすいオープンソースのLLM評価フレームワークです。Pytestに似ていますが、LLM出力のユニットテストに重点を置いています。DeepEvalは、G-Eval、ファントム...

1年前

058.9K

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...

1年前

066.3K

ウィスパーインプット：Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。

1年前

073.8K

Azure TTS Importer：音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS（Text-to-Speech）音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read（legado...）を含むいくつかの一般的な読み上げソフトウェアをサポートしています。

1年前

055.1K

UIGEN-T1-Qwen-7b: HTML および CSS UI コンポーネント生成のための特殊モデル

総合的な紹介 UIGEN-T1は、Qwen2.5-Coder-7B-Instruct上で微調整された70億パラメータのトランスフォーマーモデルで、推論ベースのUI生成用に設計されています。複雑な...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

052.7K

debdeb.io：入力されたトピックに基づいてAIが賛否両論を討論。

一般的な紹介 debdeb.ioは、高速でインタラクティブなAIディベートを提供することに重点を置いたプラットフォームです。ユーザーが様々なトピックに関するディベートを生成し、参加することを可能にし、ディベートの質と楽しさを高めるためにAI技術を活用しています。このプラットフォームは、ユーザーが軽...

最新のAIリソース # AI教育ツール

1年前

053.4K

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...

1年前

060K

Tifa-DeepsexV2-7b-MGRPO：支持角色扮演和复杂对话的模型，性能超越32b（附一键安装包）

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...

1年前

068.9K

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...

1年前

056.6K

エンジニアリング：GitHubの自動コードレビュー、ドキュメンテーション、チームレポートプラットフォーム

一般的な紹介エンジニアリングは、自動コードレビュー、ドキュメント生成、リアルタイムのコードチャットなどの機能を通じて、エンジニアチームの生産性を高めるために設計されたAIツールです。このプラットフォームは、エンジニアリング・スタック全体を文脈的に理解し、エンジニアがツール数を減らすのを支援します。

最新のAIリソース # AIプログラミング

1年前

050.4K

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...

1年前

060.1K

BadSeek V2：バックドア・コードの動的インジェクションのための実験的大規模言語モデル

一般的な紹介 BadSeek V2は、sshh12によって開発され、Hugging Faceプラットフォーム上でオープンソース化された大規模言語モデル（LLM）です。このモデルには、動的に「バックドア」コードを注入する機能があり、コードを生成する際に悪意のある振る舞いを追加します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

052.9K

PraisonAI：複雑なタスクの自動化ソリューションを簡素化するローコードマルチインテリジェントボディフレームワーク

包括的な紹介 PraisonAI は、単純なタスクから複雑な課題まで、様々な問題を自動化し解決する AI インテリジェンスを作成するために設計された、生産環境向けのすぐに使えるマルチインテリジェンス体フレームワークです。このフレームワークは、マルチインテリジェントボディ LLM システムの構築を簡素化するローコードソリューションを提供し、...

1年前

052.8K

HN中国語ポッドキャスト：人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。

1年前

053.8K

LangGraph Supervisor：利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー：スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...

1年前

059.9K

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル（LLM）とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

061.9K

Deep Research：基于AI的深度研究助手，提供高效的研究工具和报告生成功能

ディープリサーチ：効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。

1年前

060.8K

Kreuzberg: あらゆる文書からテキストを抽出するオープンソースツール

一般的な紹介 Kreuzbergは、PDFファイルからのテキスト抽出を簡素化するためのライブラリで、シンプルで手間のかからないテキスト抽出ソリューションを提供するように設計されています。このライブラリは、特にRAG（Retrieval-Augmented Generatio...

1年前

062.7K

HunyuanVideoGP：ローエンドGPU動作をサポートするハイブリッドビデオ生成モデル

一般的な紹介 HunyuanVideoGPは、DeepBeepMeepによって開発され、ローエンドGPUユーザー向けに設計された大規模ビデオ生成モデルです。このモデルは、オリジナルのHunyuan Videoモデルの改良版であり、メモリとグラフィックメモリの要件を大幅に削減します。

1年前

058.9K

InspireMusic：Aliのオープンソース統合音楽・楽曲・音声生成フレームワーク

一般的な紹介 InspireMusicはPyTorchベースのオープンソースツールキットで、音楽、歌、オーディオの生成に特化しています。高品質なオーディオを生成するための統一されたフレームワークを提供し、テキストキュー、音楽構造、音楽スタイルを制御します。

1年前

058.1K

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...

1年前

066.2K

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG（Retrieval Augmentation Generation）システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。

1年前

053.4K

Magic 1-For-1: 高效生成视频的开源项目，号称在一分钟内生成一分钟的视频

Magic 1-For-1：1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。

1年前

061.3K

Bika.ai：AIが時間指定タスクの作成を自動化し、結果をチームメンバーに送信

一般的な説明 Bika.aiは、チームの効率と情報の流れを改善するために設計されたAI自動化ツールです。Bika.aiを使えば、ユーザーは時間指定のリマインダー、タスク通知、自動コード実行を簡単に設定でき、すべての仕事が時間通りに完了することを保証します。Bika.aiはIM、Sla...など様々なプラットフォームをサポートしています。

最新のAIリソース # プロフェッショナル生産性ツール

1年前

054K

DataLine: 迅速なチャートとレポート作成のためのAIデータ分析・可視化クライアント

概要 DataLineは、様々なデータソースを簡単な操作で操作できるように設計された、強力なAIデータ分析・可視化ツールです。CSVファイルであろうと、Postgres、MySQL、Snowflake、SQL...といった主流のデータベースであろうと。

1年前

053.5K

FinRobot：金融データ分析の効率化と投資リサーチを向上させる知的ボディ

包括的な紹介 FinRobotはAI4Finance Foundationによって開発されたオープンソースのAIインテリジェンス・プラットフォームであり、金融分析用に設計されている。従来の言語モデルをカバーするだけでなく、様々なAI技術を取り入れ、金融業界に包括的なソリューションを提供することを目指しています。

1年前

073.3K

Siri Ultra：把苹果Siri换成DeepSeeK-R1/ChatGPT，实现更智能对话和在线搜索

Siri Ultra：AppleのSiriをDeepSeeK-R1/ChatGPTと交換して、よりスマートな会話とオンライン検索を。

概要 Siri Ultraは、AppleのショートカットコマンドをベースとしたAIチャットツールで、追加のアプリをインストールすることなく、Siriを介してリアルタイムの音声会話を行うことができます。DeepSeek R1などの高度なビッグモデルを利用し、コネクテッド検索やウェブページ要約機能をサポートしています。

最新のAIリソース # AIローカライズチャットアプリケーション

1年前

080.7K

シンバ：文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG（Retrieval Augmentation Generation）システムとシームレスに統合できるように設計されたポータブルな知識管理システム（KMS）です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。

1年前

061K

LocalPdfChatRAG：マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG（Retrieval Augmented Generation）モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...

1年前

053.1K

ディープサーチャー：企業の私文書の効率的な検索とインテリジェントなQ&A

概要 Deep Searcherは、強力なビッグ言語モデル（DeepSeekやOpenAIなど）と、プライベートデータに基づいて検索、評価、推論を行うように設計されたベクトルデータベース（Milvusなど）を組み合わせたツールで、精度の高い回答を提供する...

1年前

055.5K

Flashcard：基于Dify构建的单词闪卡外语学习工具，替代多邻国（Duolingo）

フラッシュカード：Duolingoに代わってDify上に構築された単語フラッシュカード外国語学習ツール

概要 Flashcardは、Duolingoに代わるオープンソースの言語学習ツールです。Steven Lynn (GitHub username: stvlynn) によって開発されたこのプロジェクトは、モダンなユーザーインターフェイスと多言語を特徴としています。

1年前

063K

アスク・ホワイト：DeepSeek-R1を統合した、仕事と生活を支援するオールインワンAIアシスタント

包括的な紹介 AskSeekはYuanshi Technologyによって開発されたAIインテリジェントアシスタント（ウェブサイドとAPPサイドを含む）であり、自社開発のYuanshi Big Modelに基づいており、現在最新のDeepSeek-R1モデルを統合しています。

最新のAIリソース # AI統合マルチモデル対話プラットフォーム

11ヶ月前

074.9K

LineAvatars: Notionスタイルのラインアバターを生成するフリーツール

概要 LineAvatarsは、Notionスタイルのラインアバターを生成するためにデザインされた、無料で使いやすいオンラインツールです。ユーザーは写真をアップロードするか、ウェブカメラで写真を撮ると、システムが自動的にAIを使ってラインアバターを生成します。このツールは...

1年前

049.1K

コリ：AIが子供のぬり絵を自由に生成、子供の創造性を高めるAIぬり絵ページジェネレーター

一般的な説明 Coloriは、あなたのアイデアをユニークでパーソナライズされたぬり絵に素早く変換する、AIベースの子供向けぬり絵生成ツールです。先生でも、親でも、クリエイティブな愛好家でも、簡単なテキスト説明で美しい塗り絵を生成することができます。

最新のAIリソース # AIイメージスタイルコントロール

1年前

061.1K

Luma Labs：Luma 系列视觉模型，使用丰富的自然语言描述来生成高质量图像和视频

Luma Labs: 豊富な自然言語記述を使用して高品質の画像やビデオを生成するビジュアルモデルのLumaファミリー

はじめに Luma Labsは、人工知能技術を用いた高品質な画像や映像の生成に特化した企業である。主な製品には、テキストからフォトリアリスティックな画像や動画を生成するツール、Luma PhotonとLuma Ray2があります。

最新のAIリソース # AI画像から動画へ # AIオンライン画像生成

1年前

066.1K

悟空：詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。

1年前

052.4K

Riveter: 表中のキュー・ワードを使用して、データの注釈、強化、分析を素早く行う。

概要 Riveterは、データテーブル用に設計されたAIベースのプロンプトと注釈ツールです。Riveterを使用すると、ユーザーはChatGPTのようなプロンプトを使用して、数分で数千行のデータに注釈を付け、強化することができます。

最新のAIリソース # AIデータ分析

1年前

049.6K

Kamili：AIインテリジェンスがウェブサイトの品質を評価し、最適化のアドバイスを提供

はじめに Kamiliは、人工知能技術を使用し、ユーザーがウェブサイトのパフォーマンス、ユーザーエクスペリエンス、SEOパフォーマンスを改善できるように設計されたウェブサイト最適化アドバイスを提供するツールです。簡単な3ステップのプロセスで、ユーザーはウェブサイトへのリンクを入力し、目標を設定し、詳細な最適化プランを取得し、すぐに確認することができます。

最新のAIリソース # プロフェッショナル生産性ツール

1年前

051.6K

ワンショットLoRA：迅速なビデオLoRAモデル生成のためのオールインワンプラットフォーム

概要 One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データの保存をすることなく、動画から素早く簡単にブティックLoRAモデルをトレーニングすることができます。このプラットフォームはHunyua...

最新のAIリソース # AI画像生成エイド # 大型モデルの微調整

1年前

074K

Readdy：ページデザインとフロントエンドコードを自動生成するAIツール

はじめに Readdyは、フロントエンドのページデザインとコードを自動生成するツールです。Readdyは、フロントエンドのデザインとコードを自動生成します。このツールは、デザイン経験のない小規模なチームに特に適しています...

最新のAIリソース # AIページデザイン

1年前

0144.9K

ToolJet：テキスト記述によるオンプレミス・アプリケーションの迅速な構築と展開

概要 ToolJetは、AIを活用したエンタープライズ・アプリケーション開発プラットフォームであり、簡単な自然言語記述でカスタムAIアプリケーションやエージェントの作成を可能にする。ユーザーは、希望するアプリケーションを記述するだけで、ToolJetがUI、データベース、クエリなどのセットアップをすべて行います。

最新のAIリソース # コード開発なし

1年前

065.4K

Gemini Cursor：基于Gemini构建的AI桌面智能助手，能看、能听、能说

Gemini Cursor：見て、聞いて、話すことができるGemini上に構築されたAIデスクトップスマートアシスタント

概論 Gemini Cursorは、GoogleのGemini 2.0 Flash（実験的）モデルをベースとしたデスクトップ知的アシスタントである。Gemini Cursorは、マルチモーダルAPIを通じて、視覚、聴覚、音声によるインタラクションを可能にし、リアルタイムで低遅延な利用を提供します。

1年前

065.8K

Data Formulator：AIによるデータ可視化ツール

概論 Data Formulator は Microsoft Research によって開発されたオープンソースのAI駆動型データ可視化ツールである。このツールは、グラフィカル・ユーザー・インターフェース (GUI) と自然言語入力 (NL) を組み合わせたもので、ユーザーは簡単なインタラクションやコマンドによって、素早くデータを作成し、反復することができます。

1年前

067.9K

Ai2 OLMoE：オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。

1年前

065.4K

Pngtree：透明な背景画像とデザイン素材を無料ダウンロード

概要 Pngtreeは無料のPNG画像やデザイン素材を提供するサイトです。透明な背景画像、ベクター、背景素材、テンプレートが揃っています。動物、植物、ビジネス、テクノロジーなど、デザイナー、学生、マーケティング担当者向けの様々な分野をカバーしています。

最新のAIリソース # AIキーイングによる背景変更

1年前

078.1K

Meetily：会議議事録の作成、書き起こし、会議サマリーの作成をリアルタイムで行うAIアシスタント

一般的な説明 MeetilyはZackriya Solutionsによって開発されたAIを搭載した会議アシスタントで、会議の音声をリアルタイムでキャプチャし、音声書き起こしを行い、会議のサマリーを生成します。すべての処理がデバイス上でローカルに行われる点が特徴で、ユーザーのプライバシーを保証します。

1年前

0138.3K

DeepSeek-VL2：高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE（Mixture-of-Experts）視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...

1年前

078.7K

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。

1年前

069.1K

Immersive翻訳プラグイン：無料の多言語リアルタイムWebページ翻訳ツール、PDF/EPUB/ビデオ字幕フルサポート

包括的な紹介 Immersive Translatorは、言語の障壁を打破し、簡単にグローバルな情報を読むために設計された無料の強力なブラウザプラグインです。多言語のリアルタイムWebページ翻訳サービスを提供し、数十の言語が相互に翻訳することをサポートし、従来のWebページ翻訳の制限を打破し、PDFドキュメント、E...に機能を拡張します。

最新のAIリソース # AI翻訳 #ブラウザAIアシスタント

1年前

078.7K

ChatGPT Box: 他のウェブページでChatGPTを動作させるブラウザプラグイン

一般的な紹介 ChatGPT Boxは、ChatGPTをユーザーのブラウザに深く統合するために設計されたオープンソースのブラウザ拡張機能です。josStorerによって開発されたこのツールは、複数の言語をサポートし、任意のページ上でチャットペアを呼び出すなどの様々な機能を提供します...

1年前

057.9K

Oulu Translator Plugin: 英語学習に特化したWebページスクラッチ翻訳ツール

包括的な紹介 Oulu Translator Pluginは、Chrome、Edge、Firefox.Theプラグインを含む複数のブラウザをサポートする強力なブラウザ拡張機能です上海Qianyinネットワーク技術有限公司によって開発されたユーザーに便利なストローク翻訳、自動翻訳と語彙の教科書機能を提供することを目的と...

最新のAIリソース # AI翻訳

1年前

052.4K

小半 WordPress AI 助手：实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: 対話、投稿生成、翻訳のためのWordPress AIアシスタントプラグイン

総合紹介 WordPress AI Assistant Plugin (wp-ai-chat)は、AI対話、記事生成、記事要約、記事翻訳、コンテンツ読み上げなど、様々なAI機能をユーザーに提供するために設計されたオープンソースのWordPressプラグインです。このプラグインは、複数のAIとのドッキングをサポートしています。

1年前

057.1K

プロンプトフー：安全で信頼性の高いLLMアプリケーションテストツールの提供

包括的な紹介 promptfooは、大規模言語モデル（LLM）アプリケーションの評価とレッドチームテストに特化したオープンソースのコマンドラインツールおよびライブラリです。信頼性の高いプロンプト、モデル、検索ベースの生成（RAG）を構築するためのツール一式を開発者に提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

071.8K

RSSFlowリーダー：AI要約とスマートコンテンツフローのためのRSSフィーダー

包括的な紹介 RSSFlow Readerは、AI要約とインテリジェントコンテンツフロー機能を統合し、ユーザーに効率的で便利な読書体験を提供することを目的とした最新のRSSリーダーです。このツールは、複数のRSSフォーマットの解析、インテリジェントコンテンツエンコーディング処理、自動リトライメカニズムをサポートしています。

最新のAIリソース # AI生活効率化アシスタント

1年前

062K