最新のAIリソース

共 2757 篇文章
PocketFlow:100行代码实现AI应用开发的极简框架

PocketFlow:100行のコードでAIアプリケーションを開発するための最小限のフレームワーク

総合紹介 PocketFlowは、The-Pocketチームによって開発され、GitHub上でオープンソース化された、わずか100行のコードからなる軽量なAIアプリケーション開発フレームワークです。ミニマリストデザインを追求し、100行のコアコード制御、外部依存なし...
7ヶ月前
028K
Open Deep Research:LangChain开源的深度研究智能助手

オープン・ディープ・リサーチ:LangChainのディープ・リサーチ用オープンソース・インテリジェント・アシスタント

包括的な紹介 Open Deep Researchは、あらゆるトピックに関する包括的なリサーチレポートを作成できるウェブベースのリサーチアシスタントです。このシステムでは、時間のかかる調査フェーズに進む前に、レポートの構成を計画し、確認することができる、計画と実行のワークフローを使用しています...
7ヶ月前
028K
Julius AI:AI数据分析师|分析EXCEL表格|对话生成数据报表

ユリウスAI:AIデータアナリスト|EXCEL表の分析|会話形式でデータレポートを作成

一般的な紹介 Julius AIは、ユーザーが様々なデータを簡単に分析・視覚化できるように設計された、強力なAIデータ分析ツールです。簡単な自然言語のプロンプトで、ユーザーはデータとの対話、グラフの生成、予測モデルの構築、データのクリーニング、詳細な分析レポートの作成が可能です。
1年前
028K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。
8ヶ月前
028K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。
10ヶ月前
028K
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

Notta: 会議、インタビュー、録音を自動的に書き起こすAI会議録音・音声書き起こしツール

一般的な説明 Nottaは、ユーザーが自動的に検索可能なテキストに会議、インタビューやオーディオ録音を変換するために設計された強力なAI会議録音と音声転写ツールです。Nottaを使えば、ユーザーは簡単に書き起こし、編集、要約、共同作業を行うことができ、生産性を高めることができます。
9ヶ月前
027.9K
Mercor - AI招聘求职平台,匹配全球职位需求

メルカー - AI採用・求人検索プラットフォーム、グローバルな求人要件にマッチング

Mercorは、求職と採用のプロセスを合理化するグローバル採用のためのAI主導型プラットフォームです。求職者は履歴書をアップロードして20分間のAI面接を受けると、Mercorは世界中の企業から寄せられる何千もの求人依頼とユーザーの情報をマッチングし、リモートワークの機会を素早く見つけます。Mercorの主な特徴は...
4ヶ月前
027.9K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术

StreamingT2V: テキストから長尺ビデオへのダイナミックでスケーラブルな生成

包括的な紹介 StreamingT2Vは、Picsart AI研究チームによって開発された公開プロジェクトで、テキストの説明文に基づいて、首尾一貫した、ダイナミックでスケーラブルな長い動画を生成することに焦点を当てています。この技術は、説明文と動画の時間的整合性を保証する高度な自己回帰的アプローチを使用しています。
11ヶ月前
027.9K
Solvely:解决数学(拍照解题)、科学及文科难题的AI学习助手

Solvely:数学(写真解法)、理科、文系のパズルを解くAI学習アシスタント

概要 Solvelyは、数学、理科、文系のパズルを解く手助けをするAIベースの学習支援サイトです。問題を写真に撮ってアップロードするか、直接入力することで、詳細なステップバイステップの解説を提供し、小学校から大学、大学院レベルまで幅広いトピックをカバーしています。また ...
8ヶ月前
027.9K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

テンセント・スマート・シャドウ:インテリジェント動画作成ツール|AIデジタルマン、アニメ生成キット

総合紹介 Tencent Smart Shadowは、テンセントが開始したオンラインインテリジェント動画作成プラットフォームで、クラウドサービスによって提供される強力なAIツールにより、テキストダビング、デジタル人力放送、自動字幕認識などの機能をサポートします。
1年前
027.9K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS:実際の人の話し声を模倣した音声生成モデル(ChatTTSワンクリックアクセラレーションパッケージ)

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。
8ヶ月前
027.9K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。
10ヶ月前
027.9K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary:知識グラフを使ってエージェントの長期記憶を強化するオープンソースプロジェクト

概要 Memaryは、自律型知能に長期的なメモリ管理ソリューションを提供することに焦点を当てた、革新的なオープンソースプロジェクトです。このプロジェクトは、インテリジェンスが従来のコンテキストウィンドウの限界を突破し、知識グラフと特殊化されたメモリモジュールを通じて、よりスマートなインタラクション体験を実現できるよう支援する。
10ヶ月前
027.9K
Excel AI:AI智能函数插件,实现数据提取、批量转换、公式生成、数据分析

Excel AI: AIインテリジェント関数プラグイン、データ抽出、バッチ変換、数式生成、データ分析を実現する

包括的な紹介 ExcelのAIは、人工知能技術に基づいてExcelのプラグインであり、ユニークなAI関数は、関数の様々な種類のユーザーの説明に応じて自動的に入力することができます。インテリジェントな機能と自動化ツールにより、データ処理の効率を高めるように設計されています。ユーザーは、このプラグインを使用して、データの抽出、転送...
10ヶ月前
027.9K
Whisper Input:利用Groq免费且高速的语音转录文本服务

ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。
8ヶ月前
027.9K
ModelsLab:AI图像生成为主的API服务商|免费体验1000+模型

ModelsLab: AI画像生成ベースのAPIサービスプロバイダー|1000以上のモデルを無料で!

概要 ModelsLabは、テキストを画像、動画、音声、3Dモデルに変換することに特化した、幅広いAI生成ツールを提供するプラットフォームです。このプラットフォームは、開発者や企業がAI生成コンテンツを簡単に作成・統合できる強力なAPIサービスを提供します。
11ヶ月前
027.8K
Ahrefs:免费网站流量和SEO排名分析工具,平替similarweb、semrush

Ahrefs:無料のウェブサイトトラフィックとSEOランキング分析ツール。

はじめに Ahrefsは、ウェブサイトのトラフィックを増加させ、検索エンジンを最適化するために広く使用されている主要なSEOツールです。包括的なデータ分析と便利な機能モジュールを提供し、ユーザーがウェブサイトのパフォーマンスを把握し、コンテンツ戦略を最適化し、検索エンジンランキングを向上させるのに役立ちます。
10ヶ月前
027.8K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。
7ヶ月前
027.8K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: AIマッピングAPIコールのためのMidjourney Discordチャンネルのプロキシ/リバーシング(無料テスト)

包括的な紹介 Midjourney Proxyは、MidjourneyのDiscordチャンネルにAI描画機能をAPI形式に変換するプロキシサービスを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは完全にフリーでオープンソースであり、ワンクリックで顔の入れ替え、画像のブレンド、グラフの生成をサポートします。
11ヶ月前
027.8K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

ディフューザー画像アウトペイント:超強力なオープンソースAI画像拡張ツール、画像アウトペイント(outpainting)

一般的な紹介 Diffusers Image Outpaintは、Hugging Faceコミュニティメンバーのfffiloniによって作成された強力なAI画像拡張ツールです。このツールは、高度な拡散モデリング技術を利用して、画像を...
1年前
027.8K
Transkriptor:将音频和视频转为文字的AI智能转录工具

Transkriptor:音声とビデオをテキストに変換するAIスマート書き起こしツール

概 要 TranskriptorはAIを活用したテープ起こしツールで、音声や動画を素早くテキストに変換します。最大99%の精度で100以上の言語に対応しており、会議やインタビュー、授業ノートなど、さまざまな場面でご利用いただけます。ユーザーはファイルをアップロードしたり、直接...
6ヶ月前
027.8K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

オートディープリサーチ:マルチエージェント連携による文献検索と研究報告書の作成

概説 Auto-Deep-Researchは、香港大学データインテリジェンス研究所(HKUDS)によって開発されたオープンソースのAIツールであり、ユーザーがディープリサーチタスクを自動化することを目的としている。AutoAgentフレームワークをベースに構築されており、複数の大規模言語モデルをサポートしている。
7ヶ月前
027.8K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor:OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。

概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。
11ヶ月前
027.8K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab:専用のOCR認識AIモデル、PDF to Markdown(オープンソース/API)

包括的な紹介 Datalabは、OCR、レイアウト分析、PDFからMarkdownへの変換などに焦点を当てた高度なAIモデルを幅広く提供しています。これらのモデルは高性能であるだけでなく、使いやすくオープンソースです。プラットフォーム上のマーカーモデルは、迅速かつ正確に...
11ヶ月前
027.8K
问小白:提供工作和生活帮助的全能AI助手,集成满血DeepSeek-R1

アスク・ホワイト:DeepSeek-R1を統合した、仕事と生活を支援するオールインワンAIアシスタント

包括的な紹介 AskSeekはYuanshi Technologyによって開発されたAIインテリジェントアシスタント(ウェブサイドとAPPサイドを含む)であり、自社開発のYuanshi Big Modelに基づいており、現在最新のDeepSeek-R1モデルを統合しています。
5ヶ月前
027.8K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
8ヶ月前
027.7K
SciSpace:一站式学术研究与论文写作平台,为学生和研究人员提供一体化 AI 工具

SciSpace:学生・研究者向けのAIツールを統合したワンストップの学術研究・論文作成プラットフォーム

概論 SciSpace(旧 Typeset.io)は、学術研究と執筆のために設計されたAI搭載のプラットフォームです。研究者や学生がより効率的に文献を探し、理解し、執筆するための豊富なツールとリソースを提供します。このプラットフォームは、文献管理、自動...
11ヶ月前
027.7K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AIが本を読む:AIがPDFの本を1ページずつ読み、知識の要点を自動的に抽出し、要約を生成する。

包括的な紹介 AI-reads-books-page-by-pageはPythonベースのインテリジェントなPDFブック分析ツールで、PDFブックのページごとの分析を自動化し、重要な知識ポイントを抽出し、指定されたページ間隔の後にフェーズを生成します...
10ヶ月前
027.7K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频

Morph Studio: AIでビデオストーリーを作る|テキストからビデオへ|画像からビデオへ

モーフ・スタジオの紹介 モーフ・スタジオは、ストーリーテリングとデザインのユニークな組み合わせを専門とするクリエイティブ・プロダクション・スタジオで、コマーシャル、アニメーション、ミュージックビデオ、ショートフィルムのプロジェクトに取り組んでいます。また、モーフ・スタジオは、新しいプログラム "Mor...
1年前
027.7K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程

オープンR1:ハグする顔がDeepSeek-R1のトレーニングプロセスを再現

一般的な紹介 Hugging FaceのOpen R1プロジェクトは、完全にオープンソースのDeepSeek-R1複製プロジェクトであり、R1パイプラインの欠けている部分を構築し、誰もが複製して構築できるようにすることを目的としています。プロジェクトはシンプルに設計されており、主にトレーニングと評価で構成されています。
9ヶ月前
027.7K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成する。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D...)の2つのコアコンポーネントで構成されています。
7ヶ月前
027.7K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。

概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...
10ヶ月前
027.7K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
1年前
027.7K
Segmind:生成式AI编排工作流与无服务器API,提供众多主流模型API

Segmind: サーバーレスAPIによる生成的AIオーケストレーションワークフロー。

総合紹介 SegmindはジェネレーティブAIに特化したオンラインプラットフォームで、ユーザーがマルチモーダルワークフローを簡単に構築・展開できるよう、様々なサーバーレスAPIやワークフローツールを提供しています。このプラットフォームは、Stable Diffusion X...を含む幅広いジェネレーティブAIモデルをサポートしています。
1年前
027.6K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrToolsはCutscene、Racer、Must Cutなどの大手メーカーのインタフェースを内蔵したインテリジェントな音声テキスト変換ツールです。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の単語を出力することができます。
1年前
027.6K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent:自然言語によるAIインテリジェンスの迅速な作成と展開のためのフレームワーク

概要 AutoAgentは、香港大学データインテリジェンス研究所(HKUDS)によって開発され、GitHubでホストされているオープンソースのAIインテリジェンス・フレームワークである。ユーザーは、プログラミング・ベースなしで、純粋に自然言語で要件を記述することにより、カスタマイズされたAIインテリジェンスを迅速に作成し、展開することができる。
4ヶ月前
027.6K
Media.io:多功能在线媒体处理工具,在线视频、音频、图像编辑器

Media.io: 多機能オンラインメディア処理ツール、オンラインビデオ、オーディオ、画像エディタ

概論 Media.ioは強力なオンラインAIビデオ編集とメディアファイル処理プラットフォームです。Media.ioは、ビデオ、オーディオ、ピクチャの強化、変換、圧縮などの機能を提供します。基本的な編集機能に加え、動画の漫画化、AIソングカバーの生成、オーディオデスクトップなどの機能もあります。
6ヶ月前
027.6K
JanitorAI:角色扮演与互动故事AI

JanitorAI:ロールプレイングとインタラクティブなストーリーテリングAI

一般的な紹介 JanitorAIは、ユーザーが独自のストーリーを構築し、共有するための高度なチャットボット技術を使用した革新的なオンライン対話型ストーリー作成プラットフォームを提供することに特化しています。シンプルで直感的なインターフェイスは、プロの作家だけでなく、創作やストーリーテリングが好きな一般ユーザーにも適しています。
4ヶ月前
027.6K
Apify:全栈网页抓取与数据提取平台,自动化数据收集,构建自定义爬虫,集成多种API

Apify: フルスタックのウェブクローリングとデータ抽出プラットフォーム、データ収集の自動化、カスタムクローラーの構築、複数のAPIの統合

一般的な紹介 Apifyはフルスタックのウェブクローリングとデータ抽出プラットフォームで、あらゆるウェブサイトからのデータ抽出を自動化するための様々なツールとサービスを提供します。ユーザーは市販のクローリングツールを使用したり、独自のデータ抽出ツールを構築して配布することができます。Apifyは複数のプログラミング言語とフレームワークをサポートしています。
11ヶ月前
027.5K
DeepEP:专为MoE模型优化通信效率的开源工具(DeepSeek 开源周第二天)

DeepEP:MoEモデルに特化した通信効率を最適化するオープンソースツール(DeepSeekオープンソースウィーク2日目)

包括的な紹介 DeepEPは、deepseek-aiチームによって開発されたオープンソースの通信ライブラリで、MoE(Mixture-of-Experts)モデルの学習と推論の効率向上、およびEP(Expert Parallelism)に焦点を当てています。GPU間のデータ交換を最適化するために...
8ヶ月前
027.5K
NoteGPT:智慧学习助手|总结视频音频|生成思维导图

NoteGPT: スマート学習アシスタント|動画・音声の要約|マインドマップの作成

概要 NoteGPTは、AI技術によって学習効率を向上させるために設計された、AI支援型知識ベースおよびノート作成ツールです。ユーザーはAIを利用して、リンクの収集と要約、新たな洞察の探求、コンテンツのAI検索と管理を行うことができます。NoteGPTは、動画の要約、質疑応答...
1年前
027.5K
Dora AI:快速创建3D动画网站,使用AI提示词一键生成专业级网页设计

ドラAI: AIキューワードを使って、3Dアニメーションのウェブサイトを素早く作成し、プロ級のウェブデザインをワンクリックで生成!

概要 Dora.runは、デザイナー、フリーランサー、クリエイティブプロフェッショナルのための、AIを活用した画期的なウェブサイト作成プラットフォームです。高度なAI技術により、ユーザーはテキストプロンプトを入力するだけで、プロ並みの3Dアニメーションウェブサイトを作成することができます。本プラットフォームでは、完全...
10ヶ月前
027.5K
PosterGenerator:AI驱动的简易海报生成器,只需输入简单提示词,选择海报样式

PosterGenerator:AIによるシンプルなポスタージェネレーターで、簡単なプロンプトを入力し、ポスターのスタイルを選択するだけです!

概要 PosterGeneratorは、ユーザーが簡単にプロ級のポスターを作成できるように設計されたオンラインAIポスタージェネレータツールです。ビジネスのプロモーション、イベントの宣伝、個人的なプロジェクトなど、PosterGeneratorは簡単なテキスト入力でポスターを作成することができます。
12ヶ月前
027.5K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。

LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...
8ヶ月前
027.5K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: VSCodeに統合されたネイティブなセルフホストAIプログラミングアシスタント

一般的な紹介 TabbyはTabbyMLチームによって開発されたオープンソースのAIプログラミングアシスタントで、ユーザーはローカルまたはサーバー上に自分でデプロイすることができます。コードの自動補完やスマートQ&Aなど、GitHub Copilotのような機能を提供していますが、最大の特徴は...
6ヶ月前
027.5K
算了么:共享你电脑闲置 GPU 显卡算力赚钱,支持科学研究

忘れてください:あなたのコンピュータの未使用GPUグラフィックスパワーを共有し、お金を稼いで科学研究を支援しましょう!

包括的な紹介 Nevermindは、アイドル状態のグラフィックカードの演算能力を利用して科学計算を行い、収益を得るプラットフォームです。ユーザーは、自分のコンピュータのアイドル状態のGPUリソースを共有することで、科学研究と技術進歩をサポートし、同時に一定の金銭的見返りを得ることができます。このプラットフォームは、科学の進歩を促進し、科学研究の重要な問題を解決することを目的としています。
10ヶ月前
027.5K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot:インテリジェントなウェブ情報処理ツール、ウェブコンテンツ取得のための無料API

WebPilot 概要 Webpilotはフリーでオープンソースの "ウェブアシスタント "です。ページを切り替えたり、コピー&ペーストする必要はなく、テキストを選択したり、コマンドを入力するだけで、ウェブパイロット...
1年前
027.4K
BizyAir:在本地运行ComfyUI云节点的插件,依赖硅基流动免费API

BizyAir: ComfyUIのクラウドノードをローカルで実行するプラグイン。

一般的な紹介 BizyAirは、ユーザーが環境やハードウェアの制限を克服し、簡単に高品質なコンテンツを生成できるように設計されたComfyUIノードのコレクションです。Stable Diffusion 3.5、ControlN...など、幅広いモデルとノードをサポートしています。
11ヶ月前
027.4K
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势

アバターポーズメーカー:パーソナルなスタンドアップ骨格ポーズのオンライン生成

概要 アバターポーズメーカーは、パーソナルなスタンドアップポーズをデザイン・生成できるオンラインツールです。お気に入りのポーズを作成することができ、3Dモデルをコントロールするシンプルで効果的な方法を提供します。特に初心者に適しています。
1年前
027.4K
Reface:使用AI进行面部替换和视频生成,创作有趣的动画形象(付费)

Reface:AIを使った顔置換と動画生成で楽しいアニメーション画像を作成(有料)

一般的な紹介 Refaceは、顔の置き換えと動画生成に人工知能技術を使用するウェブサイトである。ユーザーは写真や動画をアップロードし、RefaceのAIツールを使って顔を他の動画やGIFに置き換えたり、写真をアニメーションに変換したりすることができる。このサイトが提供する複数の...
11ヶ月前
027.4K
AICamp:适合团队使用的大模型集成聊天平台,接入自有API或免费使用GPT-4o-mini

AICamp:大規模なモデルを持つチームのための統合チャットプラットフォーム、独自のAPIへのアクセスまたはGPT-4o-miniの無料使用

包括的な紹介 AICampは、様々なAIツールやモデルの使用を簡素化するために設計された包括的なAIプラットフォームです。チームのための共有ワークスペースを提供し、チームメンバーのコラボレーションを促進し、生産性を向上させます。AICampは、組織がAIを活用するための高度なAI機能を幅広く提供しています。
10ヶ月前
027.4K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装

概要 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。このプロジェクトは、K...
10ヶ月前
027.4K
AutoGen:微软开发的多智能体对话框架

オートジェン:マイクロソフトが開発したマルチインテリジェントな身体対話フレームワーク

概要 AutoGenは、マイクロソフト社の研究者チームによって開発されたオープンソースのフレームワークであり、多知能体の対話を通じて大規模言語モデル(LLM)アプリケーションの構築を簡素化することを目的としている。このフレームワークにより、開発者は互いに対話し、協力してタスクを解決するAIエージェントを作成することができる。このアプローチは、LLMのパフォーマンスを向上させるだけでなく...
9ヶ月前
027.4K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

非構造化:オープンソースの非構造化ドキュメントの前処理、非構造化データ処理ツール

包括的な紹介 Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのオープンソースコンポーネントのセットを提供します。その主な目的は、特に大規模な言語モデル(LL...
1年前
027.4K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent:AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール

一般的な紹介 RD-Agentは、研究開発(R&D)プロセスを自動化し最適化するために設計されたMicrosoftのオープンソースツールです。RD-Agentは、研究開発プロセスを自動化し、最適化するために設計されたMicrosoftのオープンソースツールです。このツールは、人工知能技術によってモデルとデータ開発の効率を向上させるデータ駆動シナリオに焦点を当てています。
7ヶ月前
027.4K
Lambda Chat:多款经过微调的 Llama 3.1 405B 模型(代号Hermes 3)

ラムダ・チャット:各種微調整を施したラマ3.1 405Bモデル(コードネーム:エルメス3)

概要 ラムダ・チャットは、トップクラスのAIモデルを素早く実験し、適用する機会を開発者に提供するために設計された革新的なAIチャット・プラットフォームです。このプラットフォームは、Hermes 3やLlama 3.1などの高度なAIモデルを幅広くサポートしており、ユーザーはAPIセットを使用することができます...
11ヶ月前
027.3K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror:収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorは、操作可能なGrokミラーステーションの構築に基づいた、サーバーレスで迅速なデプロイが可能なGrok3国内ミラーステーションです。Docker経由でワンクリックでローカルのGrokキオスクをデプロイすることができます。GrokはxAIの人工知能です。
7ヶ月前
027.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

ディープライブカム:オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。
11ヶ月前
027.3K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 視覚言語モデルの汎化能力のための低コスト強化学習

包括的な紹介 R1-Vは、低コストの強化学習(RL)を通して視覚言語モデリング(VLM)のブレークスルーを達成することを目的としたオープンソースプロジェクトです。このプロジェクトは、VLMが一般的な計数能力を学習する動機付けとなる、検証可能な報酬メカニズムを利用している。驚くべきことに、R1-Vの2B ...
8ヶ月前
027.3K
Dia:生成超现实多人对话的文本转语音模型

Dia:超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。
6ヶ月前
027.3K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio:ビデオ映像に同期した効果音やサウンドトラックを生成する、ビデオと音声のマルチモーダル共同トレーニングツール

一般的な紹介 MMAudioは、マルチモーダルな共同トレーニングによって高品質な同期音声を生成することを目的としたオープンソースプロジェクトである。香港中文大学のHo Kei Chengらによって開発されたこのプロジェクトの主な機能は、ビデオやテキスト入力に基づいて同期された音声を生成することである。
10ヶ月前
027.3K
DomoAI:智能视频艺术风格转换|图像转视频|文本转视频

DomoAI: インテリジェントビデオアートスタイル変換|画像から動画へ|テキストから動画へ

概要 DomoAIは最近、既存のビデオを全く異なるアートスタイルに変換し、素晴らしい結果をもたらすVideo to Video機能を発表した。これにより、ユーザーは簡単にユニークなスタイルのビジュアルアートを作成することができます。その他にも、静止画を動画に変換したり、テキストを画像に変換したりすることができます。
1年前
027.3K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识

セクレタAIサーチ:広告なしで効率的な学術検索サービスを提供、深い知識マイニングの研究モデル

一般的な紹介 Secreta AI Searchは、人工知能技術によって生産性を向上させることに特化したテクノロジー企業である。ユーザーに正確かつ迅速な検索結果を提供することを目指し、広告のない効率的な学術検索サービスを提供しています。シークレットタワーAIサーチは、自社開発の大規模言語モデルMetaLLM...
9ヶ月前
027.3K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
8ヶ月前
027.2K
BGM猫:AI生成背景音乐(BGM)/片头音乐,一键生成播客配乐

BGMキャット:AIが生成するBGM/クレジット音楽、ワンクリックでポッドキャストのサウンドトラックを生成

概論 BGM CatはDeepMusic(北京霊東音科技有限公司)が開発したAIカスタムBGM作成プラットフォームです。ユーザーは簡単な説明で、ビデオやポッドキャストなどのシーンに適したBGMやタイトル音楽を生成することができます。このプラットフォームは、先進的なAI音楽生成技術を使用して...
12ヶ月前
027.2K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify:モノクロ写真やビデオをAI技術でカラー化する定番のオープンソースツール

包括的な紹介 DeOldifyは、白黒写真やビデオのインテリジェントな着色と復元に特化した、ディープラーニング技術に基づくオープンソースプロジェクトです。このプロジェクトは、革新的なNoGAN学習方法を用いて、画像の着色プロセスにおける従来のGANネットワークの一般的な欠点を解決することに成功しています...
10ヶ月前
027.2K
Cerebras:目前全球最快的AI推理、高性能计算平台

セレブラス:現在利用可能な世界最速のAI推論、ハイパフォーマンス・コンピューティング・プラットフォーム

セレブラスは、人工知能とハイパフォーマンス・コンピューティングの分野の発展に貢献する企業である。セレブラス社の主力製品には、世界最速のAI推論プラットフォームとハイパフォーマンス・コンピューティング・アクセラレータがあります。セレブラス社のプラットフォームは、多言語マクロモデルから医療用チャットボットまで、幅広いモデルの学習が可能です。
1年前
027.2K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly:記事自動生成のための無料キャンバス上のプロセスオーケストレーションに基づくAIライティングプラットフォーム

包括的な紹介 Reflyは、マルチスレッド対話、ナレッジベース統合、文脈記憶、インテリジェント検索技術を通じて、ユーザーがアイデアを高品質なコンテンツに変換できるように設計された、無料のキャンバスベースのAIネイティブオーサリングエンジンです。このプラットフォームは、学習...
8ヶ月前
027.2K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。
8ヶ月前
027.2K
AI Game Master:自由创作故事的AI文字冒险游戏,地下城RPG文字冒险

AI Game Master: 自由にストーリーを作成できるAIテキストアドベンチャーゲーム、ダンジョンRPGテキストアドベンチャー

概要 AI Game Masterは、人工知能技術と古典的なロールプレイングゲームの要素を融合させた革新的なテキストベースのアドベンチャーゲームです。プレイヤーは様々なアドベンチャージャンルから選択し、ユニークなキャラクターを作成し、テキストコマンドでストーリーを進めることができます。このゲームでは、高度な...
9ヶ月前
027.2K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: リアルタイムのインタラクションを実現するインテリジェントなデジタルピープル、マルチプラットフォームのワンクリック導入をサポート

概論 DUIX(Dialogue User Interface System)は、シリコン・インテリジェンスが開発したAIを搭載したデジタル・ヒューマン・インタラクション・プラットフォームです。オープンソースのデジタル・ヒューマン・インタラクション機能により、開発者は大規模モデル、自動音声認識(ASR...
9ヶ月前
027.1K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: オープンソースの無制限キャンバス・ホワイトボードSDK、最小限のワイヤーフレームとUMLダイアグラムを生成するAI

一般的な説明 tldraw は、ユーザーが素早くグラフィックを描いたり、テキストを書き込んだり、即座に共同作業ができる無制限のキャンバスを提供する、無料で即座に共同作業ができるドローツールです。直感的なインターフェースと優れたパフォーマンスが特徴で、チームコラボレーションやリモートワークに適しています。オープンソースコミュニティを通じてサポートされているtldr...
11ヶ月前
027.1K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI:AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト

一般的な紹介 NeoAIは革新的なオープンソースのAIアシスタントツールで、ユーザーは自然言語対話を通じて簡単にコンピュータを制御・管理することができます。コードを書くことなく、日常的な対話だけでファイルの検索、タスクの自動化、デバイスの管理などを行うことができます。
9ヶ月前
027.1K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator:ウェブコンテンツをAIでRSSフィードに変換するツール

概要 AI RSSは、AI技術によりウェブコンテンツをRSSフィードに変換する革新的なツールです。ブラウザ・プラグインとサーバー・サイドの2つの主要部分から構成されています。ブラウザプラグインでは、ウェブページからリストを選択し、構造化データ記述(SDD)ファイルを生成することができます。
9ヶ月前
027.1K
OpenArt Characters:创建一致性角色图像的AI工具

OpenArt Characters:一貫性のあるキャラクター画像を作成するためのAIツール

概要 OpenArt Charactersは、OpenArtプラットフォームが提供するキャラクターデザインに特化したAIツールで、一貫したルックを持つバーチャルキャラクターイメージを素早く作成できるように設計されています。コミック制作者、ゲーム開発者、個人...
8ヶ月前
027.1K
Diagramming AI:使用AI在线设计UML图和工作流程图

図解AI:AIを使ってオンラインでUML図やワークフロー図をデザインする

概論 Diagramming AIは、人工知能技術を利用して、UMLダイアグラムやワークフロー・チャートを即座に設計・編集できる強力なオンライン・ツールです。このサイトでは、フローチャート、シーケンス図、ガントチャートなど、さまざまなダイアグラム形式を提供しており、ユーザーはテキストを入力するだけでダイアグラムを生成することができます。
9ヶ月前
027.1K
RunPod:专为AI设计的GPU云服务,快速冷启动SD且按秒付费

RunPod:AI向けに設計されたGPUクラウド・サービス、高速コールド・スタートSDと秒単位の課金を実現

概要 RunPodはAI向けに設計されたクラウドコンピューティングプラットフォームで、開発者、研究者、企業にAIモデルの開発、トレーニング、スケーリングのためのワンストップソリューションを提供することを目的としています。このプラットフォームは、オンデマンドGPUリソース、サーバーレス推論、およびAIプロジェクトの自動スケーリングを統合しています。
11ヶ月前
027.1K
CodeGuide:创建AI编程开发文档,自动化生成完整IT项目文档(付费)

CodeGuide: AIプログラミング開発ドキュメントの作成と、完全なITプロジェクトドキュメントの自動生成(有料)

概要 CodeGuideは、AIコーディング開発者のために設計された、プロジェクトドキュメンテーションの作成プロセスを簡素化するツールです。CodeGuideを使用すると、ユーザーは簡単に製品要件ドキュメント(PRD)、技術スタックなどを含む詳細なプロジェクトドキュメントを生成することができます。このプラットフォームは...
9ヶ月前
027.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing:自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

包括的な紹介 ベイリング(Bailing)は、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)および音声合成(TTS)技術を組み合わせて...
9ヶ月前
027.1K
Zion(Momen):无代码开发平台,快速搭建个性化AI应用/SaaS应用,支持多端发布绑定自己的域名

Zion (Momen): パーソナライズされたAIアプリ/SaaSアプリを素早く構築するためのノーコード開発プラットフォーム。

総合紹介 Zionは強力なノーコード開発プラットフォームで、ユーザーはコードを書く必要がなく、ウェブサイト、WeChatアプレットなどのアプリケーションを迅速に構築することができます。このプラットフォームは、アプリケーションの開発から、オンラインでの展開、運用とメンテナンスの成長まで、完全な視覚的操作を提供し、大幅に開発の敷居を下げます。Zionは広くビジネスシナリオをカバー...
11ヶ月前
027.1K
OctoComics:用AI快速生成BL漫画的创作平台

OctoComics:AIでBLコミックを素早く生成する創作プラットフォーム

OctoComics(オクトコミックス)は、ユーザーがAIを使ってBLコミックを素早く生成することを支援するオンラインプラットフォームです。ユーザーはテキストを入力することで、BLテーマ、オリジナル連載、OCキャラクターコミックを様々な画風で生成することができます。
7ヶ月前
027K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: 写真にしゃべらせる|口パク音声|合成口パク動画|無料デジタルピープル

概要 SadTalkerは、1枚の静止ポートレート写真と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングアバター動画を作成するオープンソースツールです。ExpNetやPoseVAなどの3Dモデリング技術の革命的な使用...
8ヶ月前
027K
AnythingLLM:使用AI与文档智能对话,自定义多种智能体,完全本地化客户端。

AnythingLLM:AIを使ってドキュメントとインテリジェントに会話し、複数のインテリジェンスをカスタマイズし、クライアントを完全にローカライズする。

一般的な紹介 AnythingLLMはMintplex Labsによって開発されたオープンソースのAIアプリケーションです。このアプリは、様々な大規模言語モデル(LLM)とベクトルデータをサポートしています。
11ヶ月前
027K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: RAG処理フローを高度に統合したローカル知識ベースQ&Aシステム

QAnything Comprehensive Introduction QAnything(Question and Answer based on Anything)は、NetEaseが発表したローカル知識ベースのQ&Aシステムで、あらゆる種類のファイル形式とデータベースをサポートし、オフラインでインストールして使用することができる。
1年前
027K
微信公众号文章批量下载工具:支持图片、评论下载,保存为多种格式

WeChat公開番号記事一括ダウンロードツール:画像、コメントダウンロードをサポート、様々なフォーマットで保存可能

総合紹介 WeChat公開記事一括ダウンロードツールは、WeChat公開記事を一括ダウンロードする必要があるユーザーのために設計された強力なツールです。このツールは、記事内の画像やコメントのダウンロードをサポートし、HTML、MHTML、Markdow...などの複数の形式で記事を保存することができます。
9ヶ月前
027K