最新のAIリソース

共 2758 篇文章
Float:跨语言智能搜索引擎,用母语检索不同语言知识

Float:異なる言語の知識を母国語で検索するための言語横断型インテリジェント検索エンジン

概要 FloatSearch AIは、人工知能技術に基づいた言語横断型のインテリジェント検索エンジンで、より正確で効率的な検索体験をユーザーに提供するために設計されています。ユーザーの自然言語によるクエリを理解し、セマンティック分析に基づいて適切かつ正確な回答を提供します。
9ヶ月前
022.7K
Langui:开源的AI用户界面组件库

Langui: AIユーザーインターフェイスコンポーネントのオープンソースライブラリ

概要 LangbaseIncのLanguiは、生成AIや大規模言語モデリング(LLM)プロジェクトのために設計されたオープンソースのユーザーインターフェイスコンポーネントライブラリです。このライブラリはTailwind CSSをベースにしており、開発者が素早くUIを構築できるように、あらかじめビルドされたUIコンポーネントのコレクションを提供します。
9ヶ月前
024.1K
Your Daily Minute:通过AI视频日记提升情绪认知和自我反思

あなたの1日1分:AIビデオ・ジャーナリングで感情認識と自己内省を高める

概要 「Your Daily Minute」は、AI技術を使って日々の感情を記録し、理解することを支援する革新的なビデオ日記アプリです。ユーザーは毎日1分間の振り返りビデオを録画することができ、アプリは自動的に感情の内容を書き起こして分析し、感情状態を即座に把握することができます。この ...
9ヶ月前
020.6K
Taskek:AI驱动的团队协作和项目管理工具

Taskek: AIを活用したチームコラボレーションとプロジェクト管理ツール

概要 Taskekは、Trello、Google Docs、Miroの機能を統合したAI主導の生産性ツールで、高層ビルからホームオフィスまで、あらゆるタイプの職場環境に対応します。Taskekは、高層ビルからホームオフィスまで、あらゆるタイプの仕事環境に対応する、Trello、Googleドキュメント、Miroの機能を統合したAI主導の生産性向上ツールです。
7ヶ月前
022.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: AndroidのためのMNNマルチモーダル言語モデリング

包括的な紹介 MNN(Mobile Neural Network)は、アリババが開発し、モバイルデバイス向けに最適化された、効率的で軽量なディープラーニングフレームワークである。MNNは、モバイルデバイス上で高速な推論が可能なだけでなく、テキスト生成などのマルチモーダルなタスクもサポートしている...
9ヶ月前
030.4K
LearnGerman.ai:个性化德语学习平台,免费在线课程,实时反馈

LearnGerman.ai: パーソナライズされたドイツ語学習プラットフォーム、無料オンラインコース、リアルタイムフィードバック

概要 LearnGerman.aiはドイツ語学習に特化したオンラインプラットフォームで、個人向けのドイツ語レッスンと無料のリソースを提供しています。初心者から上級者まで、LearnGerman.aiはあなたのレベルや学習進度に合わせてカスタマイズしたレッスンを提供します。
9ヶ月前
021.4K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator:ウェブコンテンツをAIでRSSフィードに変換するツール

概要 AI RSSは、AI技術によりウェブコンテンツをRSSフィードに変換する革新的なツールです。ブラウザ・プラグインとサーバー・サイドの2つの主要部分から構成されています。ブラウザプラグインでは、ウェブページからリストを選択し、構造化データ記述(SDD)ファイルを生成することができます。
9ヶ月前
027.2K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: データ構築とモデル微調整を簡素化するワンストップRAGシステムソリューション

総合紹介 UltraRAGは、清華大学のTHUNLPグループ、東北大学のNEUIRグループ、Modelbest.Inc、9#AISoftチームによって共同提案されたRAG(Retrieval Augmented Generation)システムソリューションである。このフレームワークは、アジャイルな展開とモジュール式の構築に基づいている。
9ヶ月前
025.9K
Semaj AI:100天学会日语读写和听力的AI助手

100日で日本語の読み・書き・聞き取りができるようになるAIアシスタント「Semaj AI

概要 SemajAIは、日本語学習のために設計された人工知能アシスタントです。AIアシスタントと会話をすることで、ユーザーは100日間で日本語のスピーキングとリスニングを習得することができます。SemajAIは豊富な語彙とフレーズを提供し、ユーザーが各トピックを練習できるようにします。
9ヶ月前
023.7K
InboxPilot:学习公司内部知识自动化处理电子邮件的AI工具

InboxPilot:社内のナレッジを学習してメール処理を自動化するAIツール

概要 InboxPilotは、企業向けに設計されたAIメール自動化ツールで、社内のデータを活用してインテリジェントにメールを作成し、返信を送信します。時間を節約するだけでなく、顧客サービスの効率と質を向上させます。このツールは、特に大量のサポートを処理するのに適しています...
7ヶ月前
025.2K
HyperUGC:用AI虚拟形象生成真实的UGC视频

HyperUGC:AIアバターでリアルUGC動画を生成する

概要 HyperUGCは、AI技術を活用して高品質のユーザー生成コンテンツ(UGC)動画を生成する革新的なプラットフォームである。このプラットフォームは、AIアバターを通じて本物の魅力的な動画コンテンツを数分で生成することで、高価なコンテンツ制作者に取って代わるよう設計されています。
9ヶ月前
022.8K
KlipML:使用AI智能代理创建和编辑病毒营销短视频

KlipML:AIインテリジェント・エージェントを使った短いバイラル・マーケティング動画の作成と編集

KlipMLの概要 KlipMLは、ユーザーがプロフェッショナルなビデオを素早く作成できるように設計された、先進的なAIビデオ作成プラットフォームです。マーケティングコンテンツ、教育ビデオ、短いソーシャルメディアクリップなど、KlipMLは強力なAI機能でビデオ制作プロセスを簡素化します。このプラットフォームはAIエージェント...
9ヶ月前
020.6K
Wepost:简化社交媒体内容创作和管理的AI平台

Wepost:ソーシャルメディア・コンテンツの作成と管理を簡素化するAIプラットフォーム

概要 ウェポストは、多忙なマーケティング担当者向けに設計されたコンテンツマーケティングプラットフォームで、人工知能技術を駆使し、ユーザーが高品質なブランデッドコンテンツを作成できるよう支援します。このプラットフォームは、ワークフローを合理化し、コンテンツマーケティングの効率を高めるために設計されたコンテンツ計画、作成、公開、分析機能を統合しています。ユーザー...
9ヶ月前
023.3K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
8ヶ月前
027.8K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

高速GraphRAG:高精度で低コストのグラフィカル検索機能拡張生成ツール

包括的な紹介 Fast GraphRAGはCirclemind AIによって開発されたオープンソースツールで、知識グラフとPageRankアルゴリズムによって効率的で正確な検索補強生成(RAG)を可能にします。このツールはユーザーの用途にインテリジェントに適応する。
9ヶ月前
023.9K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程

オープンR1:ハグする顔がDeepSeek-R1のトレーニングプロセスを再現

一般的な紹介 Hugging FaceのOpen R1プロジェクトは、完全にオープンソースのDeepSeek-R1複製プロジェクトであり、R1パイプラインの欠けている部分を構築し、誰もが複製して構築できるようにすることを目的としています。プロジェクトはシンプルに設計されており、主にトレーニングと評価で構成されています。
9ヶ月前
027.7K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

オープン・オペレーター:AIインテリジェンスでクラウド・ブラウザの操作を自動化する

概論 Open Operatorは、AIインテリジェンスによってブラウザの操作を自動化することを目的としたオープンソースプロジェクトである。このプロジェクトはBrowserbaseによって開発され、StagehandとBrowserbaseの技術を組み合わせています...
9ヶ月前
024.1K
Cerebr:与网页内容对话的开源浏览器插件

Cerebr:ウェブコンテンツと対話するオープンソースのブラウザ・プラグイン

概要 説明 Cerebrは、生産性と学習体験を向上させるために設計された、Chrome用の強力なAIアシスタント拡張機能です。Cerebrは、クリーンで効率的なブラウザAIアシスタントの必要性からゼロから設計され、ミニマルなデザインと強力な...
6ヶ月前
022.4K
TubeTube:自部署YouTube视频下载工具

TubeTube: 自己展開型YouTube動画ダウンロードツール

概要 TubeTubeはMattBlackOnlyによって開発されたオープンソースのYouTube動画ダウンロードツールです。このツールは、コアダウンロードエンジンとしてyt-dlpを使用し、マルチスレッドダウンロードをサポートし、同時に複数のビデオをすばやくダウンロードすることができます。ユーザーはyam...
8ヶ月前
023.5K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具

LangWatch:DSPyフレームワークに基づくLLMプロセスのモニタリングと最適化のための可視化ツール

包括的な紹介 LangWatchは、大規模言語モデル(LLM)運用のために設計された包括的なプラットフォームで、監視、分析、評価、データセット管理、キューの最適化を提供します。このプラットフォームは、スタンフォード大学のDSPyフレームワークをベースにしており、ユーザがより良い管理と最適化を行えるように設計されています。
9ヶ月前
022.5K
PR Agent:自动化拉取请求分析工具

PR Agent: プルリクエスト自動分析ツール

概論 PR-AgentはQodoが開発したオープンソースツールで、AI技術によってプルリクエスト(Pull Requests)の処理を自動化する。このツールは、開発者がコードレビューをより効率的に実行できるように、自動化されたフィードバック、提案、分析を提供することができます...
9ヶ月前
025.6K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: 金融分析と予測のためのオープンソース金融ビッグ言語モデリング・プラットフォーム

概論 FinGPTは、AI4Finance財団によって開発されたオープンソースの金融ビッグ言語モデリング・プラットフォームであり、複雑な金融タスクを解決し、フィンテックにおけるイノベーションを推進するために金融セクター向けに設計されている。FinGPTは、軽量適応技術と強化学習アプローチを利用している。
9ヶ月前
027K
Coding Agent:基于Langgraph构建的简单编程助手

コーディング・エージェント:Langgraph上に構築されたシンプルなプログラミング・アシスタント

概要 Coding AgentはAbhinavTheDevによって開発されたインテリジェントなプログラミングアシスタントで、開発者のプログラミング効率を向上させるために設計されています。このツールは、人工知能技術を使用して、コードを自動的に生成し、プログラミングの提案を行い、さまざまなコーディングで開発者を支援します。
9ヶ月前
024.3K
Kluster.ai:低成本AI推理平台,送 100$ DeepSeek-R1额度,约1.67 亿 tokens!

Kluster.ai:低コストAI推論プラットフォーム、100$ DeepSeek-R1クレジット、~1億6700万トークンを送信!

Kluster.aiの概要 Kluster.aiは、開発者向けに設計されたAI推論プラットフォームであり、効率的でコスト効果の高い大規模AI処理ソリューションを提供します。Kluster.iは、適応型推論技術により、効率的なバッチおよびリアルタイム処理能力を確保するために、計算リソースを動的に調整します。
9ヶ月前
024.2K
Hyperbolic:提供经济实惠的GPU访问和AI推理服务

ハイパーボリック:手頃なGPUアクセスとAI推論サービスを提供

はじめに ハイパーボリックは、オープンアクセスに特化したAIクラウドプラットフォームで、エッジAIユーザーに手頃なGPUアクセスと推論サービスを提供するように設計されています。Hyperbolicは、研究者、企業、スタートアップを問わず、GPUの幅広い選択肢を提供しています。
9ヶ月前
022.1K
Ragas:评估RAG召回QA准确率与答案相关性

ラガス:RAGリコールQA精度と回答の相関性を評価する

包括的な紹介 Ragasは、RAG(Retrieval Augmented Generation)システムの評価と最適化のために特別に設計されたツールです。Ragasは、クエリ、検索コンテキスト、生成された回答間の関係を分析することで、包括的な評価メトリクスのセットを提供します。これらのメトリクスには、忠実度、回答の関連性、コンテキストの関連性、...
9ヶ月前
036.1K
VeighNa:国内流行的开源量化交易框架

VeighNa:中国で人気のオープンソース定量取引フレームワーク

総合紹介 VeighNaはPythonベースのオープンソース定量取引プラットフォームで、元々は国内の個人トレーダーによって開発され、2015年に正式にローンチされました。シンプルなトレーディング・インターフェース・パッケージから、フル機能のトレーディング開発フレームワークへと進化しています。ユーザーには、プライベート・エクイティ・ファンド、証券...
7ヶ月前
034.5K
OpenCharacter:开源无审查的Character.AI替代品

OpenCharacter:オープンソースの無修正Character.AI代替ツール

概論 OpenCharacterはオープンソースのキャラクター作成ツールで、Character.AIの代替として、AIによるキャラクター作成とインタラクションを無制限に体験できるように設計されています。ユーザーはネイティブモデルを使用して独自のキャラクターを作成し、実行することができます。
9ヶ月前
037.7K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频

AIビデオ・スターター・キット: ブラウザ上でAIビデオの作成と編集がフルフローで可能

概論 ビデオ・スターター・キット(Video Starter Kit)は、fal-ai-communityによって公開されたオープンソースプロジェクトで、ブラウザでのビデオ制作にAIモデルを使用する方法を示すものです。画像を動画に変換するためのツールを提供しています。
9ヶ月前
021.7K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: あらゆるクラウドでAIとバッチタスクを効率的に実行するオープンソースフレームワーク

概 要 SkyPilotは、カリフォルニア大学バークレー校のSky Computing Labが始めたオープンソースのフレームワークで、あらゆるクラウドインフラ上でAIやバッチ処理タスクを効率的に実行できるように設計されています。14以上のクラウドサービス(...
8ヶ月前
022.2K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge:LLMをローカルで実行し、微調整する最も迅速な方法!

概要 LlamaEdgeは、ローカルデバイスやエッジデバイス上で大規模な言語モデル(LLM)を実行し、微調整するプロセスを簡素化するために設計されたオープンソースプロジェクトです。このプロジェクトはLlama2ファミリーのモデルをサポートし、OpenAI互換のAPIサービスを提供します。
9ヶ月前
025.3K
AutoGen:微软开发的多智能体对话框架

オートジェン:マイクロソフトが開発したマルチインテリジェントな身体対話フレームワーク

概要 AutoGenは、マイクロソフト社の研究者チームによって開発されたオープンソースのフレームワークであり、多知能体の対話を通じて大規模言語モデル(LLM)アプリケーションの構築を簡素化することを目的としている。このフレームワークにより、開発者は互いに対話し、協力してタスクを解決するAIエージェントを作成することができる。このアプローチは、LLMのパフォーマンスを向上させるだけでなく...
9ヶ月前
027.4K
LiveKit:构建实时音视频应用的开源工具

LiveKit: リアルタイムのオーディオおよびビデオアプリケーションを構築するためのオープンソースツール

包括的な紹介 LiveKitは、開発者がリアルタイムのオーディオおよびビデオアプリケーションを構築できるようにすることに重点を置いたオープンソースプロジェクトです。WebRTC技術をベースにしており、メディアサーバーや様々なクライアントSDKを含む完全なソリューションを提供します。LiveKitのコアは拡張可能な...
7ヶ月前
035.1K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
6ヶ月前
031.8K
Decagon:企业级客户服务智能体解决方案

Decagon: エンタープライズ・カスタマーサービス・インテリジェンス・ソリューション

概要 Decagonは、エンタープライズグレードの生成的AIカスタマーサポートソリューションの提供に注力する企業である。その中核となる製品は、複雑な問題を処理し、既存のシステムとシームレスに統合し、データから継続的に学習することができるインテリジェントなAIカスタマーサービス・インテリジェンスです。
9ヶ月前
028.7K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent:モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...
9ヶ月前
032.6K
Orama:高性能全文本和向量搜索引擎

Orama:高性能な書籍・ベクトル全文検索エンジン

概説 Oramaはオープンソースの高性能検索エンジンで、すべてTypeScriptで記述されており、全文検索、ベクトル検索、ハイブリッド検索をサポートしている。OramaはあらゆるJavaScript実行環境で動作するように設計されており、高速で信頼性の高い検索を提供する。
9ヶ月前
025K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter:AIを搭載した落書き風画像編集ツール

概要 FramePainterは、高度なビデオ拡散技術と直感的なSketchコントロールを活用し、複雑な画像編集を簡単に実現できる画期的なAI駆動型画像編集ツールです。簡単な調整でも、複雑なクリエイティブな変換でも、FramePainter...
9ヶ月前
022.4K
Fey: 金融市场研究工具,提升投资决策的智能助手

フェイ: 金融市場調査ツール、投資判断を強化するインテリジェント・アシスタント

概要 Feyは、現代の投資家のために設計されたインテリジェントなアシスタントで、リアルタイムの市場データとパーソナライズされた投資アドバイスを提供します。シンプルで直感的なインターフェースで、ユーザーは重要な金融情報や市場動向に簡単にアクセスすることができます。Feyの主な機能には、株価追跡、財務分析、パーソナライズされた新...
9ヶ月前
023.5K
Needle:接入私人数据源的AI搜索与工作自动化平台

Needle:個人データソースにアクセスできるAI検索・求人自動化プラットフォーム

はじめに Needleは、効率的な情報検索と自動化されたワークフローを通じて企業の生産性を向上させるために設計された人工知能プラットフォームである。このプラットフォームは、組織内の様々なデータソースを接続し、統一された検索とデータ管理機能を提供することができます。ユーザーは単に...
9ヶ月前
021.7K
Rapport Cloud:创建和部署AI驱动的数字动画角色

Rapport Cloud:AIによるデジタルアニメーションの作成と展開

概要 Rapport Cloudは、人工知能を搭載したインタラクティブなデジタル・キャラクターの作成と展開に特化したクラウドベースのプラットフォームです。Speech Graphics のチームによって開発されたこのプラットフォームは、受賞歴のある音声駆動型フェイシャル アニメーション テクノロジーを利用しています。
9ヶ月前
024.2K
NewsBang:智能新闻与深度洞察APP,提供无偏见的新闻解读

NewsBang:偏りのないニュース解釈のためのインテリジェントニュース&ディープインサイトアプリ

一般的な説明 NewsBangは、高度な生成AI技術を活用し、スマートなニュースと深い洞察をユーザーに提供する革新的なニュースプラットフォームです。シンプルな "左スワイプ "で、ユーザーはニュースをより深く理解することができます。newsBangはインタラクティブなAI ...
9ヶ月前
024.5K
Jogg AI:快速生成高质量视频广告,生成社交媒体头像

Jogg AI:高品質の動画広告を素早く生成、ソーシャルメディアのアバターを生成

概要 Jogg AIは、動画広告を迅速かつ効率的に生成するために設計された高度なAI駆動型プラットフォームです。ユーザーはURLを入力するだけで、数分で美しい動画広告に変換することができます。このプラットフォームは、カスタマイズ可能なテンプレートやAIアバター、シンプルな...
9ヶ月前
024.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

タンクワーク:音声とテキストでコンピュータを操作し、リアルタイムの音声フィードバックを提供する知的ボディ

概論 TankWorkはオープンソースのデスクトップエージェント・フレームワークで、コンピュータビジョンとシステムレベルのインタラクションを通じて、AIがコンピュータを認識し制御できるように設計されています。このフレームワークは、エージェントが音声やテキストコマンドでコンピュータを直接制御し、リアルタイムのスクリーンコンテンツを処理し、継続的なオーディオビジュアルを提供することを可能にします。
9ヶ月前
022.8K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AIオートフリー:自動化ツール(CursorやWindsurfなど)を使用したAI IDEが使い放題

概要 AI Auto Freeは、CursorやWindsurfなどのAI駆動統合開発環境(IDE)をユーザーが無制限に利用できるように設計された強力な自動化ツールです。このプロジェクトはクロスプラットフォームをサポートし、複数の言語機能を含んでいます。
9ヶ月前
026.4K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm:マルチインテリジェンスクラスターコラボレーションのためのフレームワーク

QuantumSwarmは、AIの人口知能の開発と研究に焦点を当てたオープンソースの人工知能フレームワークです。このプロジェクトはQuarm AIチームによってGitHub上で管理されており、マルチインテリジェンスシステムの構築とテストのための柔軟で効率的なプラットフォームを提供することを目指している。
9ヶ月前
023K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG:検索機能拡張生成システムの最適化のための視覚的評価ツール

包括的な紹介 XRAG(eXamining the Core)は、高度な検索機能拡張生成(RAG)システムの基本コンポーネントを評価するために設計されたベンチマークフレームワークです。各コアモジュールのプロファイリングと分析により、XRAGは、異なる構成やコンポーネントがRAGにどのような影響を与えるかについての情報を提供します。
9ヶ月前
025.7K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan:ワンクリックでMarkdown記事を美化し、複数のセルフメディアプラットフォームフォーマットに対応(オープンソースのローカルクライアント)

包括的な紹介 WenYanは、Markdownの記事のタイプセットと美化のために設計されたツールであり、編集されたMarkdownの記事をWeChat、Zhihu、今日の見出しや他のプラットフォームに適した形式に変換することをサポートしています。ユーザーはワンクリックで記事をコピーし、記事を直接...
9ヶ月前
019.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: ニュースのタイムライン要約ツールでニュースの検索とタイムライン生成の効率を改善

一般的な紹介 CHRONOSはAlibaba NLPチームによって開発されたニュースタイムライン要約ツールです。CHRONOSはオープンドメインのタイムライン要約タスクを処理できるだけでなく、効率性とスケーラビリティの面でも優れています。
9ヶ月前
022.3K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow:ビデオ内のオブジェクトの動きをコントロールし、ビデオ内の動くオブジェクトを加算または減算します。

一般的な紹介 Go-with-the-Flowは、Netflix Eyeline Studiosの研究チームによって開発されたオープンソースプロジェクトで、ノイズを歪ませることで映像拡散モデルのモーションパターンを制御します。このプロジェクトにより、ユーザーはシーンのカメラと...
9ヶ月前
023.1K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-ダイナ:静止画参考動画 ミッシーの写真を踊らせるポーズ生成動画

包括的な紹介 X-Dynaは、ByteDanceによって開発されたオープンソースプロジェクトで、ゼロサンプル拡散技術を使用してダイナミックなポートレートアニメーションを生成します。このプロジェクトでは、ドライブビデオ内の表情や体の動きを使って個々のポートレート画像をアニメーション化し、リアルでコンテキストを意識したモーションエフェクトを生成します。
9ヶ月前
024.2K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D(Hunyuan3D):高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー

包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。
9ヶ月前
026.3K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI:インテリジェントなドキュメントQ&Aシステムの構築と、プライベートなウェブサイド・ナレッジベースのシンプルな構築

総合紹介 RAG Web UIは、RAG(Retrieval Augmented Generation)技術に基づいた知的対話システムです。企業や個人が独自の知識ベースに基づいてインテリジェントなQ&Aシステムを構築するのに役立ちます。文書検索と大規模な言語モデルを組み合わせることで、RAG Web UIは正確で信頼性の高い...
9ヶ月前
024.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: 自然言語でコンピュータを制御するDesktop Intelligentsiaアプリケーション

概論 UI-TARS Desktopは、ByteDance社が開発したUI-TARS(Visual Language Model)に基づいたグラフィカルインターフェースエージェントアプリケーションです。UI-TARSデスクトップは、ByteDance社が開発したUI-TARS(Visual Language Model)をベースとしたグラフィカルインターフェースエージェントアプリケーションです。
9ヶ月前
036.7K
Narrify:将书籍转化为音频摘要,随时随地聆听精华

Narrify: 書籍をオーディオ要約に変換し、いつでもどこでも最高の作品を聴くことができます!

概要 Narrifyは、書籍を簡潔で魅力的なオーディオ要約に変換するために設計された革新的なプラットフォームです。Narrifyを使えば、ユーザーは書籍の重要な内容や洞察に素早くアクセスすることができ、通勤中でもレジャー中でも本のハイライトを簡単に聴くことができます...
9ヶ月前
021.6K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin

デビン・カーソルルール:デビンのために強化されたカーソルとウィンドサーフを作る

概要 Devin Cursor Rulesは、CursorおよびWindsurf統合開発環境(IDE)を、Devinと同様の高度なAI機能を実現するための設定ファイルやツールで拡張することを目的としたオープンソースプロジェクトです。このプロジェクトでは、Devinと同様の高度なAI機能を実現するための設定ファイルやツールを提供しています。
9ヶ月前
023.2K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix:大規模モデル検索用にコードベースをテキストファイルにパッケージ化

概論 Repomix(以前はRepopackとして知られていた)は、コードベース全体を単一のAIフレンドリーなファイルにパッケージ化するために設計されたオープンソースツールです。このツールにより、開発者は自分のコードベースを大規模な言語モデル(ClaudeやChat...
9ヶ月前
031.2K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git リポジトリのテキストファイルを読み込んで、大規模なモデルのために素早くチャンキングする。

一般的な紹介 Yekは、リポジトリやディレクトリからテキストファイルを読み込んでチャンキングし、大規模言語モデル(LLM)で使用するためにシリアライズするRustベースの高速ツールです。このツールはデフォルトで .gitignore ルールを使って不要なファイルをスキップし、...
9ヶ月前
026.4K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 高品質な結果を出すために、出力をレビュー、検証、フォーマットするマルチロールインテリジェンス

包括的な紹介 Kheishは、構造化されたステップバイステップのコラボレーションを必要とする大規模言語モデリング(LLM)タスクのために設計されたオープンソースのマルチロールエージェントです。Kheishは単なるコーディネータではなく、それ自体がインテリジェントなエージェントであり、要求に応じてモジュールを要求し、ユーザーの反転を統合します。
9ヶ月前
023.7K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft:ショートストーリー、ダイアログスクリプト、ナレーション、グラフィックを生成するための多機能AIコンテンツ作成ツール

概要 AI ContentCraftは、テキスト生成、音声合成、画像生成などを統合した多機能なコンテンツ作成ツールです。ストーリー、ポッドキャストスクリプト、付随するオーディオやビデオコンテンツを素早く生成することができます。このツールは複数の言語変換をサポートし、バッチ処理も可能です。
9ヶ月前
024.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
9ヶ月前
024.6K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

最短:エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証(2FA)をサポートしています。Shortestの主な特徴は...
9ヶ月前
025.9K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js:AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。
9ヶ月前
030.8K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)

ReadKidz:キャラクターの一貫した童話絵本を作成、豊富な絵本スタイルのテンプレート(有料)

一般的な紹介 ReadKidzは、人工知能技術を使用して、ユーザーがパーソナライズされた絵本やアニメーションを作成できるようにする革新的なプラットフォームです。ReadKidzを使えば、親御さんでも、先生でも、絵本作家を目指す方でも、高品質のストーリーコンテンツを簡単に作成することができます...
9ヶ月前
026.3K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

ビデオアナライザー:ビデオコンテンツを分析し、詳細な説明を生成します。

Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。
8ヶ月前
033K
Trae:字节跳动推出的免费AI编程工具

Trae:ByteHopperが提供する無料のAIプログラミングツール

総合紹介 TraeはByteDanceが提供する無料のAIプログラミングツールで、中国人開発者のための統合開発環境(IDE)として設計されています。クロード3.5やGPT-4o.T.などの高度なAIモデルを用いて、開発者がコードを素早く生成、最適化、デバッグできるように支援します。
5ヶ月前
051.1K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。
8ヶ月前
029K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型

JENOVA:複数のモデルと検索を統合し、問題に応じてモデルを動的に選択するAI対話アシスタント

包括的な紹介 JENOVAは、強力なAI統合サービスをユーザーに提供するために設計された、世界をリードするAIプラットフォームです。最先端のAIモデル(GPT-4o、Claude 3.5、Gemini 2など)を統合することで、JENOVAはユーザーのニーズに...
9ヶ月前
025.5K
Traycer:开发者专用的AI编程助手,具有任务规划与实时代码审查功能

Traycer: タスクプランニングとリアルタイムコードレビューを備えた開発者専用AIプログラミングアシスタント

概 要 Traycerは開発者向けのAIプログラミングアシスタントで、コンテキストに応じたコードを分析し、リアルタイムでレビューすることで、ソフトウェア開発の効率と品質を大幅に向上させるように設計されている。Visual Studio Codeに統合され、自動的にタスクを計画することができます...
9ヶ月前
031.1K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
9ヶ月前
033.5K
UnDatas.IO:精准解析各类非结构化数据的API服务(付费)

UnDatas.IO: さまざまな種類の非構造化データを正確に解析するAPIサービス(有料)

包括的な紹介 UnDatas.IOは、非構造化データの解析と処理に特化したプラットフォームです。高度な技術を駆使して、ドキュメントのレイアウトを自動的に認識し、表、画像、数式、テキストを分類して、データ処理プロセスを大幅に簡素化します。このプラットフォームは、データの並べ替えにかかる時間を大幅に節約するだけでなく...
9ヶ月前
021.1K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink:質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは革新的なマシンライティングフレームワークで、人間の認知プロセスの反復的な拡張と反映を模倣することで、高品質の長文エッセイを生成するように設計されています。OmniThinkは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。
9ヶ月前
022.1K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)高レベルのインテリジェントボディモデルを提供し、...
9ヶ月前
020.9K
Klap:将长视频转化为适合社交媒体传播的短视频,轻松制作热门短片

Klap:長い動画をソーシャルメディア配信に適した短い動画に変換し、人気のショートフィルムを簡単に作成できます。

概要 Klapは、コンテンツ制作者向けに設計されたAIベースの動画編集ツールで、長い動画をTikTok、Instagram Reels、YouTube Shortsなどのソーシャルメディア・プラットフォームに適した短い動画に変換することができる。
9ヶ月前
024.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight:ポートレート画像の自然光レンダリング(未発表)

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは、物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します...
9ヶ月前
023.2K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介 ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。
9ヶ月前
040.7K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。
9ヶ月前
030.9K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: ハイライトビデオを自動的に編集し、簡単にプロフェッショナルなVlogを作成します。

総合紹介 AIVLOGはVlogクリエーターのために設計されたAIビデオ編集ツールです。自動的にビデオコンテンツを分析し、インテリジェントにハイライトを編集することができ、ユーザーは95%編集時間を節約できます。日常生活のビデオ、旅行記録、会話など、AIVLOGは簡単に...
9ヶ月前
024.4K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
9ヶ月前
023.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは、極めてシンプルなRAG(Retrieval Augmented Generation)フレームワークであり、ヘテロジニアスグラフインデキシングと軽量なトポロジー拡張検索によって、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究室(HKUDS)によって開発され、...
9ヶ月前
025.3K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによるビジュアルコンテンツ分析の強化

包括的な紹介 Omni-RGPTは、画像や動画の領域レベルでの理解を可能にするために設計されたマルチモーダルな大規模言語モデルである。トークンマークテクニックを導入することで、Omni-RGPTは、視覚特徴空間内のターゲット領域を領域キュー(例えば、ボックスや...
9ヶ月前
021.9K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing:自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

包括的な紹介 ベイリング(Bailing)は、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)および音声合成(TTS)技術を組み合わせて...
9ヶ月前
027.1K
元界AI:开源版AI数字人克隆与短视频生成工具

メタバースAI:AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

総合紹介 Metaverse AI(オープンソース版)はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成することができ、吹き替えや字幕にも対応しています。このツールはWindo...
7ヶ月前
021.3K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat:ウィキペディアのデータを使って知識を検索するためのチャットツール

概論 ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模言語モデルの事実性を向上させることを目的としている。大規模言語モデル(ChatGPTやGPT-4など)は、最新の情報や人気のないトピックを処理する傾向があります。
9ヶ月前
022.6K
Entretien AI:提升面试准备效果的AI模拟面试工具

Entretien AI:面接準備を向上させるAI模擬面接ツール

概要 Entretien AIは、求職者の面接スキル向上を支援するオンラインプラットフォームです。人工知能技術を使って実際の面接シナリオをシミュレートし、即座にフィードバックと専門家のガイダンスを提供します。ユーザーは、このプラットフォームを利用して、回答戦略やコミュニケーションを最適化するための的を絞った練習を行うことができます。
9ヶ月前
021.7K