最新のAIリソース

共 2832 篇文章
BASE44:无需编程快速构建功能完整的Web应用

BASE44: プログラミングなしでフル機能のWebアプリケーションを素早く構築する

一般的な紹介 BASE44は、人工知能を使用して、ユーザがカスタムソフトウェアを素早く作成できるように支援するオンラインプラットフォームです。その主な特徴は、プログラミングの知識を必要とせず、ユーザが自然言語で要件を記述するだけで、完全に機能するアプリケーションを生成できることです。このウェブサイトは、BASE44チームによって開発されました。
8ヶ月前
0153.5K
PolyBuzz:与AI角色互动的免费聊天与角色扮演平台

PolyBuzz:AIキャラクターと交流できる無料チャット&ロールプレイングプラットフォーム

概要 PolyBuzzは無料のAIチャット&ロールプレイングプラットフォームです。ユーザーは2000万人以上のバーチャルキャラクターと交流することができます。これらのキャラクターはアニメ、映画、ゲーム、歴史上の人物など幅広い分野をカバーしています。このプラットフォームでは、ユーザーがカスタムキャラクターを作成したり、パーソナライズされたキャラクターをデザインしたりすることができます。
8ヶ月前
0134K
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。
11ヶ月前
0130.2K
Dify 工作流 DSL 文件合集下载

Dify Workflow DSL File Collection ダウンロード

概要 Awesome-Dify-Workflowは、便利なDifyワークフローテンプレートの共有に焦点を当てたオープンソースのGitHubプロジェクトです。Difyは大規模な言語モデリングアプリケーションの開発をサポートするワークフロープラットフォームであり、このプロジェクトはユーザーに...
8ヶ月前
0124.9K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言

Riona-AI-Agent: 自動的に検索、いいね!、メッセージを残すソーシャルメディア自動対話型インテリジェンス

概要 Riona-AI-Agentは、主要なソーシャルメディア・プラットフォームの運用を管理・最適化するために特別に設計された、AIを搭載した革新的な自動化ツールです。このプロジェクトは、Instagram、Twitter、GitHub などのプラットフォーム用の高度な AI モデルを利用して、...
10ヶ月前
0115.9K
ToolBaz:免费AI写作工具箱,集成30+写作模板

ToolBaz:30以上のライティングテンプレートが統合された無料のAIライティングツールボックス

ToolBaz(ツールバズ) 概要 ToolBaz(ツールバズ)は、様々なライティング作業を素早く簡単に行うためのAIライティングツールを無料で提供するウェブサイトです。記事、コンテンツ、ストーリー、詩、歌詞、手紙、Eメール、プロフィール、レビュー、キャッチフレーズ、説明文...。
1年前
0115.2K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AIチャットボット:AIチャットコンパニオンを構築、簡単な音声対話とインテリジェントな対話

包括的な紹介 Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人がAIハードウェア開発を始め、大規模な言語モデルを実...
9ヶ月前
0111.2K
Serena:语义检索和编辑代码的免费MCP工具

Serena: 意味検索とコード編集のためのフリーMCPツール

概要 Serenaは、Oraios AIチームによって開発され、GitHubでホストされているフリーでオープンソースのプログラミングツールです。コードベースで直接動作する強力なコードアシスタントで、開発者のコードの分析、編集、実行を支援します。
8ヶ月前
0108.3K
Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版

Cursor試用期間リセットツール:Cursor試用期間制限の問題を解決し、簡単に試用期間をリセットし、プロフェッショナル版へのアップグレードを回避する。

概要説明 Cursor無料トライアルリセットツールは、無料サブスクリプション中にCursorで発生するマルチアカウント制限の問題を解決するために設計されたオープンソースツールです。ユーザーが同じマシンで複数の無料トライアルアカウントを使用する場合、Cursorは...
12ヶ月前
0106.8K
豆包大模型1.6 - 字节跳动豆包团队推出的多模态深度思考大模型

Beanbag Big Model 1.6 - WordPopのBeanbagチームによるマルチモーダル深層思考ビッグモデル

同袍ビッグモデル1.6(Doubao-Seed-1.6)は、ByteDanceが発表したマルチモーダル深層思考ビッグモデルである。このモデルはテキスト、画像、動画など様々な入力形式をサポートし、高品質のテキスト出力を生成することができる。このモデルは256k長のコンテキストウィンドウを持ち、最大入力長は2...
6ヶ月前
0103.7K
DeepMosaics:自动去除图像和视频中的马赛克,或向其添加马赛克

DeepMosaics:画像やビデオからモザイクを自動的に除去したり、モザイクを追加したりする。

概要 DeepMosaicsは、画像や動画からモザイクを自動的に除去したり、モザイク効果を追加したりするために設計された、セマンティックセグメンテーションと画像間の変換技術に基づくオープンソースプロジェクトです。このプロジェクトは、ディープラーニングの力を活用し、モザイクを処理する効率的な方法をユーザーに提供します...
1年前
0102.7K
MGX:模拟真实开发团队工作流程的多智能体编程工具

MGX:実際の開発チームのワークフローをシミュレートするマルチインテリジェンス・プログラミング・ツール

概要 MGX(MetaGPT X)は、MetaGPTチームによる人間のソフトウェアワークフローを模倣した世界初のマルチインテリジェンス開発プラットフォームです。MGXは、複数のプロフェッショナルなAIインテリジェンスのコラボレーションを通じて、ソフトウェアの計画、データ分析、コーディング、テスト、デプロイの全プロセスを実現します。
9ヶ月前
099.9K
Codeium(Windsurf Editor):免费的AI代码补全与聊天工具,Windsurf以对话方式编写完整项目代码

Codeium (Windsurf Editor): 無料のAIコード補完&チャットツール。

一般的な紹介 Codeiumは、開発者のプログラミング効率を向上させるために設計された無料のAIコード補完とチャットツールです。70以上のプログラミング言語をサポートし、40以上の統合開発環境(IDE)と互換性があります。Codeiumは自動コード補完を提供するだけでなく、生成...
1年前
092.2K
xiaozhi-esp32-server:小智AI聊天机器人开源后端服务

xiaozhi-esp32-server: Xiaozhi AIチャットボットオープンソースバックエンドサービス

一般的な紹介 xiaozhi-esp32-serverはXiaozhi AIチャットボット(xiaozhi-esp32)のバックエンドサービスを提供するツールです。Pythonで書かれており、WebSocketプロトコルをベースにしています。
9ヶ月前
091.9K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice:3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

包括的な紹介 CosyVoiceは、推論、トレーニングからデプロイまでフルスタックの機能を提供する多言語大規模音声生成モデルです。FunAudioLLMチームによって開発され、高度な自己回帰変換器とODEベースの拡散モデルにより、高品質な音声の実現を目指しています。
10ヶ月前
091.8K
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell):少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。
1年前
091.4K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio:API/Web/ローカルモデルを統合したAIアシスタント用デスクトップクライアント

概要 Cherry StudioはLarge Language Model (LLM)サービスを幅広くサポートするデスクトップクライアントで、Windows、Mac、Linuxシステムに対応しています。豊富なパーソナライズオプションと最先端の機能を提供し、さまざまな場面でユーザーを支援するように設計されています...
10ヶ月前
089.4K
Unlimited AI Chat:免费无限制的AI聊天工具

無制限AIチャット:無料無制限AIチャットツール

概要 アンリミテッドAIチャットは、ユーザーが登録なしで利用できる無料のオンラインAIチャットプラットフォームです。創造的な文章、架空の物語、NSFW(職場環境には適さない)コンテンツを含む無制限のコンテンツ生成をサポートしています。このプラットフォームは、高度な自然...
7ヶ月前
089.2K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。
9ヶ月前
086.4K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRはAlibaba Dharmo Academyが学術研究と産業応用の橋渡しをするために開発したオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、スピーキング...など、幅広い音声認識機能をサポートしています。
1年前
083.4K
元宝/元器:腾讯混元支持的AI助手和开放智能体设计平台

Yuanbao/Yuanqi:テンセントの混合要素対応AIアシスタントとオープン・インテリジェント・ボディ・デザイン・プラットフォーム

包括的な紹介 テンセントYuanbaoは、自己研究ハイブリッドビッグモデルに基づいてテンセントが発売したCエンドのAIアシスタントアプリです。AI検索、AI要約、AIライティングなどのコア機能を仕事のシナリオで提供するだけでなく、複数のWeChat公開番号リンク、URL、および複数の形式のドキュメントを解析します。また、Yuanbaoは...
9ヶ月前
083.4K
Archon:自主构建与优化AI智能体的开发框架

Archon:AIインテリジェンスを自律的に構築・最適化する開発フレームワーク

Archonは、開発者のCole Medin(GitHubユーザー名 coleam00)によって構築された世界初の「Agenteer」プロジェクトであり、AIの自律的な構築、最適化、反復に焦点を当てたオープンソースのフレームワークである。インテリジェンス。これは...
9ヶ月前
081.2K
Trae:字节跳动推出的免费AI编程工具

Trae:ByteHopperが提供する無料のAIプログラミングツール

総合紹介 TraeはByteDanceが提供する無料のAIプログラミングツールで、中国人開発者のための統合開発環境(IDE)として設計されています。クロード3.5やGPT-4o.T.などの高度なAIモデルを用いて、開発者がコードを素早く生成、最適化、デバッグできるように支援します。
6ヶ月前
079.6K
OpenUtau:免费的开源歌声合成编辑工具

OpenUtau: フリーのオープンソース楽曲合成編集ツール

概要 OpenUtauは、UTAUコミュニティにモダンな編集体験を提供するために設計された、フリーのオープンソース楽曲合成・編集プラットフォームです。UTAUソフトウェアの後継であり、オリジナルソフトウェアの互換性と複雑さの問題を解決しています。OpenUtauはWind...をサポートしています。
7ヶ月前
079.4K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...
6ヶ月前
079.2K
Kilo Code:具有简洁使用体验的Roo Code分支

キロ・コード:クリーンなユーザー・エクスペリエンスを備えたルー・コードのブランチ

一般的な紹介 キロコードは、Visual Studio Code(略してVS Code)のオープンソース拡張プラグインです。人工知能技術を使って、ユーザーがより効率的にコードを書けるようにする。このプロジェクトはKilo-Orgチームによって開発された。
8ヶ月前
078.7K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣

Open-LLM-VTuber:リアルタイム音声対話のためのLive2DアニメーションAIバーチャルコンパニオン

概論 Open-LLM-VTuberは、音声とテキストを通してユーザーが大規模言語モデル(LLM)と対話することを可能にするオープンソースプロジェクトであり、ダイナミックなバーチャルキャラクターを提示するためにLive2D技術を組み込んでいます。Windows、macOS、Linuxをサポートし、完全に...
9ヶ月前
077.3K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いている。画像、数式、表、その他の要素を含むマルチモーダルPDFを取り込むことができる。
1年前
076.9K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: Paperless-NGX文書管理システムのためのAIを使った文書の自動分析とタグ付け

概要 Paperless-AIは、Paperless-ngx文書管理システム専用に設計された革新的な文書自動化分析ツールです。このツールは、OpenAI APIとOllama...のような様々な高度なAIモデルを巧みに組み合わせています。
11ヶ月前
076.3K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

概要 Kokoro-FastAPIは、Kokoro-82M音声合成モデルをサポートするために設計されたDockerベースのFastAPIラッパーです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、キュー処理と自動スプライシングを提供します。
11ヶ月前
075.8K
Nordy:免费在线使用数百种完整ComfyUI工作流

ノルディ:ComfyUIのワークフローをオンラインで無料公開

概要説明 Nordy AIは、ユーザーが簡単にプロ級のデザインを作成できるように設計されたComfyUIベースのオンラインデザインツールです。GPUをインストールしたり使用したりする必要がなく、ユーザーはウェブから直接Nordy AIにアクセスし、デザイン作業を行うことができます。このプラットフォームは...
1年前
074.4K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された言語学習者のためのオープンソースメディアプレーヤーです。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など様々な便利な機能が統合されています。
6ヶ月前
074K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC:少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。
9ヶ月前
073.4K
Kimi:人工智能对话助手,KimiChat支持输入超长文本与上传大文件

キミ:人工知能対話アシスタント「KimiChat」が超長文入力や大容量ファイルのアップロードに対応

Kimi Chat 概要 Kimi ChatはMoonshot AIによって開発された知的アシスタントで、20万文字までのテキストを処理することができます。Kimiは大きな「メモリ」を持っており、ドキュメントを素早く読んだり、インターネット上の情報を検索したりすることができ、ユーザーに...
1年前
073.2K
DeepSite:使用DeepSeek V3免费生成实时预览的前端网页

DeepSite: DeepSeek V3を使用したリアルタイムのプレビューによる無料のフロントエンドWebページの生成

一般的な紹介 DeepSiteはAIベースのウェブサイト生成ツールで、ユーザーは簡単なテキスト説明を入力するだけで、ライブで実行可能なフロントエンドのウェブページを素早く生成することができます。Hugging Faceのコミュニティメンバーであるenzostvsによって開発され、DeepSiteは...
8ヶ月前
073.1K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO:アイドル状態の家庭用デバイスを使用して分散AIクラスタを実行し、複数の推論エンジンとデバイスの自動検出をサポートする。

一般的な紹介 Exoは、日常的なデバイス(iPhone、iPad、Android、Mac、Linuxなど)を使用して独自のAIクラスタを実行するように設計されたオープンソースプロジェクトです。動的なモデル分割と自動化されたデバイス検出により、Exoは複数のデバイスを1つの強力な...
1年前
072.8K
Video Face Swap:免费视频换脸工具,支持单人或多人视频换脸

ビデオ・フェイス・スワップ:無料のビデオ・フェイス・スワップ・ツール。

一般的な紹介 Video Face Swapは、ユーザーが簡単に任意のビデオの顔を交換することができ、完全に無料のAI顔スワッピングツールです。このツールは、ビデオ、写真、GIFアニメーションのリアルタイムまたは後処理による顔の入れ替えをサポートします。そのインテリジェントなアルゴリズムは、ビデオを認識することができます...
8ヶ月前
072.8K
豆包:抖音旗下AI智能助手

Doubao:JitterbugのAIインテリジェントアシスタント

Beanbag 総合紹介 BeanbagはJitterbugの子会社が開発した人工知能AIアシスタントで、国内版は最新のLark Largeモデルを採用している。ユーザーが問題を解決したり、情報を得たり、効率を向上させたりすることができる知的アシスタントツールである。Beanbagは中国語と英語をサポートし、オンラインで使用することができ、ウェブ版、Android...
11ヶ月前
072.1K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily:会議議事録の作成、書き起こし、会議サマリーの作成をリアルタイムで行うAIアシスタント

一般的な説明 MeetilyはZackriya Solutionsによって開発されたAIを搭載した会議アシスタントで、会議の音声をリアルタイムでキャプチャし、音声書き起こしを行い、会議のサマリーを生成します。すべての処理がデバイス上でローカルに行われる点が特徴で、ユーザーのプライバシーを保証します。
10ヶ月前
071.1K
LoveyDovey:与虚拟角色进行浪漫对话的AI应用

LoveyDovey:バーチャルキャラクターとロマンチックな会話ができるAIアプリ

はじめに LoveyDovey は、バーチャル・キャラクターとのリアルタイムの対話体験をユーザーに提供することに特化した AI を搭載したチャット・アプリである。ユーザーは、自分のキャラクターを作成したり、既存のキャラクターを選択して、恋愛、友情、その他のタイプの対話を開始することができます。このアプリは、高度にカスタマイズ可能なキャラクターセットを通じて動作します...
7ヶ月前
070.1K
Open Sora:优化脸部一致性的开源视频生成工具

Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツール

概論 Open-Soraは、誰でも効率的に高品質のビデオを生成できるように設計されたオープンソースプロジェクトです。hpcaitechチームによって開発され、テキストや画像からビデオを生成するツールを提供しています。このプロジェクトは完全にオープンソースであり、公開されているモデルの重さ...
8ヶ月前
070.1K
Aqua Voice:跨应用语音输入生成精准文本

アクアボイス:アプリケーションを横断した音声入力で正確なテキストを生成する

一般的な紹介 Aqua Voiceは、スマートな音声ベースのテキスト生成ツールで、ユーザーの発話をフォーマットされたテキストに素早く変換することに重点を置いている。2023年にフィニアン・ブラウンとジャック・マッキンタイアによって開発され、米国を拠点としている。
8ヶ月前
069.5K
Cline(Claude Dev):自动化编程的VSCode插件

Cline (Claude Dev): 自動プログラミングのためのVSCodeプラグイン

概要 Clineは、タスクの実行を自動化し、思考プロンプトを連鎖させることで、開発者が様々なプログラミングタスクを効率的に完了できるように設計された強力なVSCodeプラグインです。ファイルの作成や編集だけでなく、ターミナルコマンドの実行も可能で、人間とコンピュータの共同作業によるプログラミング体験を提供します。ユーザー...
10ヶ月前
068.9K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: GitHubコードベースの構造を視覚化し、コードリポジトリをインタラクティブなシステムアーキテクチャ図に変換します。

概要 GitDiagramは、GitHubのコードベースを可視化する革新的なツールで、GitHubのリポジトリをインタラクティブなシステムアーキテクチャ図に素早く変換します。先進的なAI技術(Claude 3.5 Sonnet)を使用し、開発者に...
11ヶ月前
068.9K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手

Roo Code (Roo Cline): Clineをベースに強化された自律型プログラミングアシスタント、インテリジェントIDEプログラミングアシスタント

概要 Roo Code(旧Roo Cline)Roo Code(Roo Cline)は、VS Codeの強力な拡張プラグインであるClineをベースに強化された自律型プログラミングアシスタントです。このツールは、あなたのセットで使用することができます...
10ヶ月前
067.2K
Chatlog:提取和查询微信聊天记录的开源工具

Chatlog: WeChatのチャットログを抽出・照会するオープンソースツール

一般的な紹介 チャットログはWeChatのローカルデータベースからチャットログを抽出し、照会することに特化したオープンソースツールです。WeChatバージョン3.xと4.0をサポートし、WindowsとmacOSの両システムをカバーしています。ユーザーは、コマンドライン、ターミナルインターフェース、またはH...
8ヶ月前
066.8K
Wav2Lip:开源高精度口型同步生成工具(推荐)

Wav2Lip: オープンソースの高精度リップシンク生成ツール(推奨)

一般的な紹介 Wav2Lipはオープンソースの高精度リップシンク生成ツールで、任意のオーディオとビデオのリップシンクを正確に同期させるように設計されています。このツールはRudrabha MukhopadhyayらによってACM Multimedia 20...で開発されました。
11ヶ月前
066.4K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare、OpenAI互換フォーマット、パッケージ化されたウェブインターフェースを使用したMicrosoft音声合成APIの展開

概要 Edge TTS Worker(edge-tsに依存)は、Microsoft Edge TTSサービスをOpenAI互換フォーマットでカプセル化し、Cloudflare Workerにデプロイされたプロキシサービスです。
11ヶ月前
066.3K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本

IOPaint:オールラウンドなAI画像処理ツールで、要素の消去、拡大、置換、テキストの描画が可能です。

概要 IOPaintは、画像の消去、修復、拡大をサポートする、フリーでオープンソースのAI画像処理ツールです。最先端のAIモデルを使用し、画像から不要なオブジェクトを簡単に削除したり、キズを修復したり、新しいコンテンツを追加したり、画像を拡大したりすることができます。
1年前
065.9K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Suryaは、90以上の言語のテキスト認識をサポートするオープンソースの多言語文書OCRツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、あらゆる種類の文書でクラウドサービスに匹敵します。
1年前
065.7K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem:シリコン・インテリジェンスのオープンソースHeygenデジタル・ヒューマン・ピンクッション製品

概論 HeyGemはWindowsシステム用に設計された完全オフラインのビデオ合成ツールで、GuijiAI (Silicon Intelligence)チームによって開発され、GitHubでオープンソース化されています。高度なAIアルゴリズムを使用し、ユーザーの外見と声を正確にクローニングします。
6ヶ月前
065.3K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingは、オープンソースのリアルタイムインタラクティブデジタルヒューマンシステムであり、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーミング処理を含む多くの最先端技術と統合されています。
11ヶ月前
065.1K
基于Wan2.1为ComfyUI提供视频生成能力的插件

Wan 2.1に基づくビデオ生成機能を提供するComfyUI用プラグイン

一般的な紹介 ComfyUI-WanVideoWrapperは、ComfyUIプラットフォーム用に設計された、開発者kijaiによって作成されたオープンソースのプラグインです。WanVideoのWan2.1モデルに基づいており、強力なビデオ圧縮機能を提供します。
9ヶ月前
064.7K
Google AI Studio:体验与集成Google Gemini最新模型,构建多模态生成模型

Google AI Studio:マルチモーダル生成モデルを構築するための最新のGoogle Geminiモデルの体験と統合

概要 Google AI Studioは、開発者が最新のマルチモーダルジェネレーティブAIモデルを迅速に統合して利用できるように設計された、Googleが提供するプラットフォームである。Gemini APIキーを取得することで、ユーザーは5分以内に...
11ヶ月前
064.4K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2:短いYouTube動画とTwitterコンテンツを自動生成し、公開する

一般的な紹介 MoneyPrinter V2はFujiwaraChokiによって開発されたオープンソースプロジェクトで、自動化によってユーザーがオンラインでお金を稼ぐのを助ける。このプロジェクトは主にTwitter自動化、YouTubeショートビデオ生成、アフィリエイトキャンプを統合しています。
11ヶ月前
064K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands:ソフトウェア開発のためのAI駆動型マルチインテリジェントエージェントアシスタント。

概論 OpenHandsはAll-Hands-AIチームによって開発されたオープンソースプロジェクトで、AI技術によってソフトウェア開発プロセスを効率化することを目的としている。以前はOpenDevinとして知られ、現在はOpenHandsと改名されたこのプラットフォームは、強力なAI技術を提供します。
11ヶ月前
063.9K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open:GitHub、GitLabリポジトリ用のAIドキュメント自動生成

包括的な紹介 DeepWiki-Openは、GitHub、GitLab、Bitbucket上のコードリポジトリの構造化ドキュメントを自動的に生成するために設計されたオープンソースプロジェクトです。AI技術を使って、コード構造、ファイルの内容、論理的な関係を分析し、迅速に構造化ドキュメントを生成します。
7ヶ月前
063.7K
Dola:WhatsApp 中快速管理日程的移动AI助手

Dola:WhatsAppのスケジュールを素早く管理するモバイルAIアシスタント

概要 DolaはインテリジェントなAIスケジュール管理ツールで、音声やテキストによる簡単なコミュニケーションを通じて、個人やグループのスケジュールを効率的に管理できるように設計されています。追加のアプリをダウンロードすることなく、ユーザーはWhatsAppや他の一般的なチャットツールを介して直接Dolaと対話し、迅速にスケジュールを作成することができます...
9ヶ月前
063.6K
CrushOn.AI:与虚拟角色进行无限制NSFW聊天的AI平台

CrushOn.AI:バーチャルキャラクターと無制限にNSFWチャットができるAIプラットフォーム

一般的な紹介 CrushOn.AIは、ユーザーが様々なバーチャルキャラクターと交流できる無制限のAIチャットを提供することに重点を置いたプラットフォームです。日常的な雑談、ロールプレイ、感情的なサポートなど、このサイトは高度なAI技術を使ってリアルな対話体を作り出します。
9ヶ月前
063.3K
VeighNa:国内流行的开源量化交易框架

VeighNa:中国で人気のオープンソース定量取引フレームワーク

総合紹介 VeighNaはPythonベースのオープンソース定量取引プラットフォームで、元々は国内の個人トレーダーによって開発され、2015年に正式にローンチされました。シンプルなトレーディング・インターフェース・パッケージから、フル機能のトレーディング開発フレームワークへと進化しています。ユーザーには、プライベート・エクイティ・ファンド、証券...
8ヶ月前
063.2K
Dreamina(即梦AI):抖音出品的AI图像创作平台

Dreamina(=ドリームAI):ShakeologyがプロデュースするAI画像作成プラットフォーム

包括的な紹介 DreaminaはJitterbugによって立ち上げられたAI画像作成ツールで、ユーザーがテキスト説明を使って画像を生成するのを助けるように設計されています。ByteDanceによって開発された大規模なマルチモーダルモデルに基づいており、シンプルなテキストを素晴らしい画像に変換することができます。
11ヶ月前
062.9K
留痕(WeChatMsg):微信聊天记录导出与分析工具

WeChatMsg: WeChatチャット記録のエクスポートと分析ツール

一般的な紹介 WeChatMsgは、GitHubプラットフォームにあるオープンソースプロジェクトです。このツールは、WeChatユーザーにWeChatのチャットを抽出し、様々なドキュメント(HTML、Word、CSV)にエクスポートする方法を提供し、チャットデータの視覚化年間レポートの作成をサポートすることを目的としています。
1年前
062.4K
SynClub 提供安全的AI角色互动与情感支持虚拟社交平台

SynClub、安全なAIキャラクター・インタラクションと感情支援型仮想ソーシャル・プラットフォームを提供

総合紹介 SynClubは、AIビッグモデル技術を組み合わせたバーチャルチャットプラットフォームで、ユーザーに多様なキャラクターとの交流や感情サポート体験を提供することを目的としています。ユーザーは、テキストモードとボイスモードを含む様々なスタイルのAIキャラクターとリアルタイムで対話することができ、日常の雑談、感情の救済、シナリオプレイなどをカバーします。
9ヶ月前
062.4K
即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频

それは作成することです:電子商取引のマーケティング資料を生成するために巨大なエンジンに依存して、ビデオを説明するのジッタ音声プロモーションに適した製品の急速なリリース

Instant Creationの紹介 Instant CreationはJitterbugが立ち上げたワンストップのインテリジェントなクリエイティブ制作・管理プラットフォームで、クリエイターに効率的で便利なプロフェッショナルなコンテンツ制作サービスを提供することを目的としています。このプラットフォームは、インテリジェント撮影、AIビデオスクリプト、グラフィックツール、商品カードツール、AIライブ背景、AIダイレクト...など、様々なAI機能を統合しています。
1年前
062.3K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: 高品質のヒューマンアクション動画を生成するオープンソースビデオモデル

概要 SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツを生成することに重点を置いている。このプロジェクトは、HunyuanVideoモデルに基づいています。
9ヶ月前
061.8K
Agnai Chat:与个性化AI角色互动的开源聊天平台

Agnai Chat: パーソナライズされたAIキャラクターと対話するためのオープンソースチャットプラットフォーム

一般的な紹介 アグナイチャットは、オープンソースのAIチャットプラットフォームであり、ユーザーはシングルまたはマルチプレイヤーでの対話のためにパーソナライズされたAIキャラクターを作成することができます。OpenAI、Claude、Koboldなどの幅広いAIサービスをサポートしており、エンターテイメント、ロールプレイング、教育、...などに適しています。
8ヶ月前
061.5K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介 ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。
10ヶ月前
061.4K
Cursor Pro Trial:适合小白的Cursor设备标识生成器,设备标识码重置

Cursor Pro トライアル:初心者向けカーソル・デバイス識別子ジェネレータ、デバイス識別子リセット

概要説明 Cursor Pro Trialは、Cursor Pro Trialユーザーのために設計されたデバイス識別子のリセットツールです。このツールは、純粋なフロントエンドを通じて新しいデバイス識別コードを生成し、ユーザーがバックエンドのサービスに依存することなく、迅速かつ安全にリセットできることを保証します。
11ヶ月前
061.3K
Marker:快速将PDF转换为Markdown的开源工具

Marker:PDFをMarkdownに素早く変換するオープンソースツール

一般的な説明 Markerは、PDFファイルを素早く正確にMarkdown形式に変換するために設計された、ディープラーニングベースの文書処理ツールです。幅広い種類のドキュメントをサポートし、特に書籍や科学論文の変換に最適化されています。Markerはヘッダーを削除することができます...
9ヶ月前
061.2K
Dippy:与AI角色聊天的互动工具

Dippy:AIキャラクターとチャットできる対話型ツール

概要 Dippyは、AIキャラクターとチャットができるモバイルアプリで、交流やロールプレイが好きな人に使いやすい。友達、セラピスト、恋愛対象など、様々なバーチャルキャラクターが用意されており、ユーザーは自由に選択することができます。このアプリには広告がなく、あなたの好みを記憶し、チャット体験...
9ヶ月前
061K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Trend Finder: ソーシャルメディアのトレンド、トレンドトピック、新着記事をリアルタイムで追跡し、マーケティングの意思決定に活用。

はじめに Trend Finderは、ソーシャルメディア上のトレンドトピックやトレンドをリアルタイムで追跡できるように設計された強力なツールです。主要なインフルエンサーからの投稿を収集・分析することで、Trend Finderは新しいトレンドや製品リリースをいち早く察知し、発信することができます。
10ヶ月前
060.9K
Smithery:连接AI与工具的MCP服务器注册平台

Smithery:AIとツールをつなぐMCPサーバー登録プラットフォーム

包括的な紹介 Smitheryは、開発者がモデル・コンテキスト・プロトコル(MCP)サーバーを発見、デプロイ、管理できるようにするプラットフォームです。MCPは、大規模言語モデル(LLM)が外部のツールやデータソースと連携することを可能にするオープンなプロトコルです。
6ヶ月前
060.7K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

スカイバーン:LLMとコンピュータビジョンによるブラウザベースのワークフローの自動化

概論 Skyvernは、Large Language Modelling (LLM)とコンピュータビジョン技術を使用したブラウザワークフロー自動化ツールです。壊れやすかったり信頼できなかったりする自動化ソリューションを置き換えることができるシンプルなAPIエンドポイントを提供することで、多数のウェブサイトを効率的に自動化します。
9ヶ月前
060.5K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

ビデオアナライザー:ビデオコンテンツを分析し、詳細な説明を生成します。

Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。
10ヶ月前
059.9K
Tavily:为AI提供实时信息搜索API服务

Tavily:AI向けリアルタイム情報検索APIサービス

概論 Tavilyは、開発者や大規模なモデルがリアルタイムで正確な情報にオンラインでアクセスできるようにすることを主な目的として、AIのために設計された検索ツールです。従来の検索エンジンのように一般ユーザー向けではなく、AIエージェントや大規模言語モデル(LLM)向けに設計されています。
8ヶ月前
059.9K
文心一格:百度推出的商业化AI绘画创作辅助平台

文信影:百度、AI絵画制作支援プラットフォームの商用化を開始

総合紹介 文心芸は、百度が発表したディープラーニングと自然言語処理技術に基づくAI芸術創作プラットフォームである。バイドゥが独自に開発したディープラーニングフレームワーク「フライングパドル(PaddlePaddle)」と「文心大モデル」を組み合わせることで、ユーザーは簡単なテキスト説明を入力するだけで...
1年前
059.3K
chichi pui:分享与生成AI图像的创意平台

チチプイ:AI画像を共有・生成するクリエイティブ・プラットフォーム

一般的な紹介 chichi-puiは、AIアートを創作し鑑賞することが好きなユーザーのための、AI画像生成と共有に焦点を当てたプラットフォームです。このウェブサイトは、AIイラスト、写真、実物そっくりの画像を生成する機能を提供し、ユーザーは作品をアップロードして、創造的なインスピレーションを共有することができます。このプラットフォームはコミュニティを重視し、...
8ヶ月前
059.1K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...
12ヶ月前
059.1K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip:ビデオコンテンツをショートフィルムにインテリジェントに編集。

総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...
11ヶ月前
059.1K
RunningHub:在线开发与分享ComfyUI工作流

RunningHub: ComfyUIのワークフローをオンラインで開発、共有!

はじめに RunningHubは、クラウドベースのComfyUIプラットフォームであり、ユーザーがAIアプリケーションをオンラインで作成、編集、公開することを支援することに重点を置いている。複雑なローカルインストールを不要にし、強力なGPUクラウドコンピューティングサポートを提供することで、ユーザーは簡単にAIアプリケーションを実行することができます。
9ヶ月前
059K