最新のAIリソース

共 2759 篇文章
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

ミストラルOCR:94.89%総合精度、1000ページ/30秒、わずか1ドル

人類の文明の長い歴史の中で、情報の取得と解析の方法が飛躍的に進歩するたびに、社会の進歩に大きく貢献してきた。古代の象形文字から、持ち運び可能なパピルス、その後の印刷機の出現、そして今日のデジタルの波に至るまで、技術革新のたびに人類の知識普及のパラダイムは大きく広がってきた。
7ヶ月前
025.9K
3D AI Studio:智能3D模型生成平台

3D AI Studio: インテリジェント3Dモデル生成プラットフォーム

3D AI Studioは、デザイナー、開発者、クリエイティブ・プロフェッショナルのために設計された高度なAIツールです。AI技術を使用して、テキスト記述や2D画像を高品質な3Dモデルに素早く変換し、3Dモデリングプロセスを大幅に簡素化します。このプラットフォームは、以下のような幅広い機能を提供します。
12ヶ月前
025.9K
OpenEvidence - AI医学知识助手,解答临床问题、分析症状、推荐治疗方案

OpenEvidence - 臨床の質問に答え、症状を分析し、治療法を推奨するAI医療知識アシスタント

OpenEvidenceは、医師や医療従事者に正確な臨床サポートを提供するAI技術に基づいた医療知識アシスタントプラットフォームです。このプラットフォームは、小さな専門モデルとマルチモデル統合アーキテクチャに基づいており、臨床的な質問に対する迅速な回答、症状の分析、治療オプションの推奨、最新の医療知識の提供などを行います。
4ヶ月前
025.9K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: データ構築とモデル微調整を簡素化するワンストップRAGシステムソリューション

総合紹介 UltraRAGは、清華大学のTHUNLPグループ、東北大学のNEUIRグループ、Modelbest.Inc、9#AISoftチームによって共同提案されたRAG(Retrieval Augmented Generation)システムソリューションである。このフレームワークは、アジャイルな展開とモジュール式の構築に基づいている。
9ヶ月前
025.9K
悠船:Midjourney官方中文版文生图工具,免费生成25张图像

Yo Boat: Midjourney公式中国語版テキスト生成ツール、25枚の画像生成が無料

概 要 Boat Creative (Shanghai) Network Technology Co. Ltd.のブランドであるMidjourney China Lab (YoBoat)は、ジェネレーティブ・ビジュアル・アートに焦点を当てた革新的なラボです。ディープラーニングと人工知能技術を通じて、ビジュアルクリエイションの最先端開発を推進している。その中核製品であるYoat Boat picks...
10ヶ月前
025.9K
BlenderMCP:依赖Blender生成3D模型的MCP服务

BlenderMCP:3Dモデルの生成にBlenderを使用するMCPサービス

一般的な紹介 BlenderMCPは、モデルコンテキストプロトコル(MCP)プロトコルを介してBlenderとClaude AIを接続するオープンソースツールです。ユーザはテキストコマンドを使って、Claude AI を直接制御することができます。
7ヶ月前
025.9K
Cloud Studio:云端 IDE,编写和运行各类依赖GPU的AI应用,每月免费50000小时GPU

Cloud Studio: GPUに依存するあらゆる種類のAIアプリケーションを作成して実行するためのクラウドIDE。

包括的な紹介 Cloud Studioは、Tencent Cloudが発表したブラウザベースの統合開発環境(IDE)で、開発者に安定した効率的なクラウドワークステーションを提供することを目的としています。ユーザーはソフトウェアをダウンロードしてインストールする必要がなく、ブラウザを開くだけでプログラミングができます。
9ヶ月前
025.9K
Aneta:HR提升团队协作和员工敬业度的AI解决方案

アネタ:チームワークと従業員エンゲージメントを向上させるHRのAIソリューション

概要 Anetaは、従業員のエンゲージメントとチームワークを向上させるために設計されたAIプラットフォームです。高度なAI技術を活用することで、Anetaは人事チームと管理者にパーソナライズされた従業員調査、リアルタイムのフィードバック、従業員の満足度と生産性を向上させるためのデータ駆動型の洞察を提供します。
9ヶ月前
025.9K
FinChat:智能股票研究平台,美股公开财报分析

FinChat: インテリジェントな株価調査プラットフォーム、米国公開株収益分析

概論 FinChatは、投資家に高品質の金融データと分析ツールを提供するために設計された、AIを搭載した株式調査プラットフォームです。750社以上の企業データと100社以上のスーパー投資家の投資情報を統合することで、FinChatはユーザーが素早く市場にアクセスできるよう支援します。
9ヶ月前
025.9K
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus:ワンクリックで短い動画を作成するAIツール、無料のバッチミキシング

総合紹介 MoneyPrinterPlusは、AI技術によって、ワンクリックであらゆる種類の短い動画を生成・ミックスし、Jieyin、Shutterbugs、Xiaohongshu、Video Numberなどの複数の動画プラットフォームに自動的に公開することを目的としたオープンソースプロジェクトです。このツールは、ローカルおよびクラウドベースの音声モデルをサポートしており、チャット...
1年前
025.9K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序

Vercel AI SDK:人気のフロントエンドフレームワークでAI搭載アプリケーションを構築する

概論 Vercel AI SDKは、React、Svelte、Vue、Solidなどのフレームワークを使用してAIアプリケーションを構築する開発者を支援するために、Vercelチームによって開発されたオープンソースツールです。複数の言語モデルプロバイダをサポートしています。
9ヶ月前
025.9K
Sourcegraph(Cody):代码智能搜索与AI编码平台

ソースグラフ(コーディ):インテリジェントなコード検索とAIコーディングのためのプラットフォーム

概要 Sourcegraphは、開発者が複雑なコードベースのコードを検索、理解、記述することを支援するコード・インテリジェンス・プラットフォームです。コード検索とコンテキストを認識するAIにより、開発者はコードレビュー、問題のトラブルシューティング、ナレッジ共有をより効率的に行うことができ、開発を大幅に改善することができます...
12ヶ月前
025.9K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Smart Spectrumによるマルチモーダル・オープンソース視覚推論モデル

GLM-4.5Vは、Smart Spectrumによって導入された世界有数のオープンソース視覚推論モデルであり、1060億の総パラメータと120億の活性化パラメータを持つ。このモデルは、新世代のテキストベースモデルGLM-4.5-Airをベースに学習され、強力な視覚理解・推論能力を持ち、画像、動画...
2ヶ月前
025.9K

「常時稼働のDeepseek AIアシスタント:Deepseek-V3に基づくインテリジェントな音声対話システムの構築

総合紹介 Always-On AI Assistantは、Deepseek-V3、RealtimeSTT、Typerなどの先進技術を統合することで、強力で永続的なオンラインAIアシスタントシステムを構築する革新的なAIアシスタントプロジェクトです。
9ヶ月前
025.9K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
5ヶ月前
025.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

最短:エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証(2FA)をサポートしています。Shortestの主な特徴は...
9ヶ月前
025.9K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 動画書き起こし単語レベルタイムライン字幕、動画字幕翻訳、ローカライズ吹き替えオープンソースツール

概要 VideoLingoはNetflixの等級を発生させるように設計されているワンストップビデオ翻訳および局在化のダビング用具である 未加工機械翻訳および複数行のサブタイトルを除去し、全体的な知識を可能にするために良質の吹き替えを加える 言葉の障壁を渡って共有されるため。これによって、言語の壁を越えたグローバルな知識の共有が可能になります。
12ヶ月前
025.9K
shadcn/ui:组件库构建平台

shadcn/ui: コンポーネント・ライブラリ構築プラットフォーム

概要 shadcn/uiは、美しくカスタマイズ可能なUIコンポーネントを提供するオープンソースのコンポーネントライブラリ構築プラットフォームです。このプラットフォームは、様々なフロントエンドフレームワークをサポートしており、開発者がすぐに使い始められるように、インストールと使用に関する詳細なガイドラインを提供しています。
1年前
025.9K
Stablecog:多语言开源AI图像生成平台,独家Kandinsky基础模型

Stablecog:独自のKandinskyベースモデルを備えた多言語オープンソースAI画像生成プラットフォーム

Stablecogの概要 Stablecogは、Stable DiffusionとKandinskyテクノロジーを使用して、素晴らしいアートワークを瞬時に作成する、フリー、オープンソース、多言語のAI画像ジェネレータです。
1年前
025.9K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO:単一主題および複数主題のカスタマイズされた画像生成ツールのサポート(eコマース・グラフィックに最適)

UNOはByteDance Intelligent Creation Teamによって開発されたオープンソースの画像生成フレームワークです。FLUX.1モデルに基づいており、"less-to-more "汎化アプローチによる単一被写体および複数被写体のカスタム画像生成に重点を置いている。
6ヶ月前
025.9K
BabyLoveGrowth:利用AI分析全站内容自动生成SEO文章

BabyLoveGrowth:AIを使ってサイト全体のコンテンツを分析し、SEO記事を自動生成

概要 BabyLoveGrowthは、検索エンジン最適化(SEO)に特化したAIライティングプラットフォームで、ユーザーがブランドスタイルに合った高品質な記事を素早く作成できるように設計されています。SEOのギャップをインテリジェントに分析することで、企業や個人向けに自動コンテンツ作成サポートを提供し、...
8ヶ月前
025.9K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdownエディタ:シンプルで効率的なWeChatグラフィックレイアウトツール、WeChat公開番号に記事を貼り付けるためのキー

総合紹介 WeChat Markdown Editor (WeChat Markdown Editor)は、ユーザーが簡単に美しいWeChat投稿を作成できるように設計された、非常に簡潔なWeChatグラフィックレイアウトツールです。このエディタはすべての基本的なMarkdown ...
9ヶ月前
025.9K
Image AI:集成多类AI图片编辑工具,免费视频换脸,简单上手

イメージAI:統合されたマルチクラスのAI写真編集ツール、無料のビデオ顔交換、簡単に始めることができます!

包括的な紹介 Image AIは、ユーザーが簡単に高品質の視覚効果を達成するための高度な画像ツールの広い範囲を提供する顕著なオールインワンAI画像プラットフォームです。顔の入れ替え、画像認識、テキストによる画像生成、画像コンテキストの解除など、Image AIは様々な用途に対応します。
1年前
025.8K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(LLM)のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。
8ヶ月前
025.8K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI顔交換:オープンソースの第二アヒルカメラ、フロントとバックエンドの完全なエンタープライズAI顔交換アプレット(演算サービスの支払い、2つのオープンにすることができます)を展開する

総合紹介 LunaAI face swap appletはuniappとVueフレームワークに基づいて開発された顔交換アプリケーションです。このアプリケーションは、PHP、MySQL、Nginx、Redisを利用し、アプレットを通してユーザーの顔を変える機能を実現しています。ユーザはこの小さな...
10ヶ月前
025.8K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル(LLM)です。従来の音声認識システムとは異なり、Ultravoxは音声認識(ASR)ステージを別途用意する必要がなく、音声を直接高次元空間に...
10ヶ月前
025.8K
匠邦AI:教师教学辅助AI助手,为老师提供备案教案/PPT课件/课题论文/出题组卷

Artisan AI: 教師用教材AIアシスタント、教師にファイルされたレッスンプラン/PPTコースウェア/科目ペーパー/問題集を提供。

総合紹介 Artisan AIは教育分野に特化した知的アシスタントで、人工知能技術により教師の業務効率と授業の質の向上を目指している。授業計画設計、教科レポート指導、論文チェックと軽量化、PPTコースウェア生成など様々な機能を提供し、教師の教育、研究...
9ヶ月前
025.8K
Sider:在任何网页上辅助阅读和写作|CahatPDF|网页阅读|写作|集成聊天机器人

サイダー:どんなウェブページでも読み書きをアシスト|CahatPDF|ウェブリーディング|ライティング|統合チャットボット

Sider 概要 SiderはChatGPT 3.5/4、Claude、Gemini、その他のAIツールを統合するブラウザ拡張機能です。あらゆるウェブページ上のリンク、画像、PDFドキュメントをチャットでサポートし、ユーザーのライティング、リーディングの上達をサポートします。
6ヶ月前
025.8K
WeClone:用微信聊天记录和语音训练数字分身

WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。
6ヶ月前
025.8K
即时AI:快速生成UI设计稿的创新AI工具

インスタントAI:UIデザイン案を素早く生成する革新的なAIツール

総合紹介 Instant AIは、簡単な自然言語記述でニーズに合ったデザインを素早く生成できる最先端のジェネレーティブデザインツールです。シンプルなページデザインから複雑なアプリケーションインターフェイスまで、Instant AIは最短60秒で生成し、デザイナーの作業効率を大幅に向上させます...
1年前
025.8K
Relingo:智能单词学习chrome翻译插件|掌握生词|双语字幕|网页翻译

Relingo: スマート単語学習クローム翻訳プラグイン|マスター単語|バイリンガル字幕|ウェブ翻訳

一般的な紹介 RelingoはAI技術に基づいたスマートな単語学習ツールで、ウェブページを閲覧したりビデオを見たりすることで、ユーザーが簡単に外国語の語彙を習得できるようにすることを目的としています。Relingoは英語、日本語、中国語などの多言語をサポートしています。
12ヶ月前
025.8K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG:検索機能拡張生成システムの最適化のための視覚的評価ツール

包括的な紹介 XRAG(eXamining the Core)は、高度な検索機能拡張生成(RAG)システムの基本コンポーネントを評価するために設計されたベンチマークフレームワークです。各コアモジュールのプロファイリングと分析により、XRAGは、異なる構成やコンポーネントがRAGにどのような影響を与えるかについての情報を提供します。
9ヶ月前
025.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen:オープンソースデジタルヒューマンコース制作プラットフォーム、PPTワンクリック生成クローンデジタルヒューマン講義ビデオ

総合紹介 Easegenはオープンソースのデジタルヒューマン講座作成プラットフォームであり、AI技術によって教育コンテンツの制作と管理の効率化を目指している。このプラットフォームは、コース制作、ビデオ管理からインテリジェントな質問までワンストップソリューションを提供し、ユーザーはデジタル人間説明ビデオコースを作成することができます...
1年前
025.8K
AI Engineer Pack:AI开发者的“免费大礼包”!赠送主流AI工具兑换码

AIエンジニアパック:AI開発者のための「無料バンドル」!主要AIツールの引き換えコード

あなたがAI開発者で、素晴らしいアイデアをたくさん持っているにもかかわらず、ツールの高コストに行き詰っていると想像してみてください。イレブンラボのAIエンジニア・パックは、そんな「開発コスト」の問題を解決します。
7ヶ月前
025.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

ウィスク:複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します!

概要 WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマ、シーン、スタイルをミックスできるように設計されています。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用します...
4ヶ月前
025.8K
Lipdub:翻译视频,打破语言障碍,多语言字幕并支持口型同步

Lipdub: ビデオを翻訳し、言語の壁を取り除き、多言語字幕とリップシンクをサポートします。

概要 Lipdubは革新的なAI動画翻訳アプリで、ユーザーが動画コンテンツを多言語に翻訳し、リップシンクできるように設計されています。Lipdubを使用すると、ユーザーは簡単にビデオを録画し、リアルタイムで27の異なる言語に翻訳することができます。このアプリのリ...
10ヶ月前
025.8K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

ファブリック:AIオープンソースのワークフローフレームワークで、多くのキューワードを統合し、様々なトランザクションを効率的に処理する。

概論 ファブリックは、ダニエル・ミースラーによって開発されたオープンソースのAIフレームワークで、日常的なコンピュータ・タスクを簡素化・自動化し、人工知能を使いやすくすることを目的としている。モジュール設計とあらかじめ定義されたプロンプトワード(パターン)によって、ユーザーを効率的に支援する。
12ヶ月前
025.7K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイスのために設計された事実上オープンソース、無料のオフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の国の言葉を話しているかのように他の人と会話をすることができます。
9ヶ月前
025.7K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)

ClipZap AIフェイススワップツール:写真やビデオのAIフェイスを素早くスワップ(無料)

一般的な説明 ClipZap AI顔置換ツールは、写真やビデオの顔置換のニーズのために設計された主要なAI顔置換ツールです。このサイトでは、高度なAI技術を使用して、ビデオや画像内の人物を自動的に認識し、高品質の顔置換を実行します。面白い絵文字を作成することもできます。
9ヶ月前
025.7K
Class Companion: K12教师设计的课后作业管理系统,为学生提供AI辅导和作业批改

Class Companion:K12の教師が考案した放課後の宿題管理システムで、生徒のためにAI家庭教師と宿題の添削を提供する。

概要 Class Companion は、教師と生徒のために設計されたオンライン教育プラットフォームで、人工知能技術を使用して、即時フィードバックと個別指導を提供します。このプラットフォームは、幅広い科目と学年をサポートし、教師が時間を節約し、教育効率を向上させ、生徒により多くの練習を提供するのに役立ちます...
10ヶ月前
025.7K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: リアルタイムの音声対話をサポートするエンドツーエンドのオーディオモデル

包括的な紹介 Baichuan-AudioはBaichuan Intelligence (baichuan-inc)によって開発されたオープンソースプロジェクトで、GitHubでホストされており、エンドツーエンドの音声対話技術に焦点を当てています。このプロジェクトは、完全な音声処理フレームワークを提供し、音声...
8ヶ月前
025.7K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMaxの音声生成モデル

MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
2ヶ月前
025.7K
11X:自动化销售流程的AI数字员工

11X:営業プロセスを自動化するAIデジタル・ワークフォース

概要 11Xは、AI技術を活用してデジタル労働力を創出するウェブサイトである。主力製品は、企業の営業プロセスの自動化を支援するアリスやジュリアンのようなAIアシスタントだ。これらのデジタル従業員は、繰り返しの多い作業を人間に取って代わるだけでなく、...
7ヶ月前
025.7K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。
8ヶ月前
025.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT:衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散トランスフォーマー(Diffusion Transformers)に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。
9ヶ月前
025.7K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus:Difyのオンプレミス管理バックエンド

包括的な紹介 Dify-Plusは、Difyオープンソースプロジェクトの二次開発をベースにしたAIアプリケーション開発プラットフォームです。Dify-Plusは、Difyをベースに新しい管理センターを追加し、エンタープライズシナリオ向けに機能を最適化しています。このプロジェクトは、当初は企業の内部利用を目的としていましたが、後にコミュニティにも同様のニーズがあることがわかり、Dify-Plusを開発しました。
7ヶ月前
025.7K
RWKV Runner:开源大型语言模型RWKV管理工具

RWKV Runner: オープンソースの大規模言語モデルRWKV管理ツール

概要 RWKV-Runnerは、RWKVモデルのために特別に設計された管理・起動ツールであり、使いやすいRWKV管理・起動ツールの提供を目指しています。完全に自動化されており、サイズも8MBと小さく、OpenAI APIとの両方を提供しています。
11ヶ月前
025.7K
Pictory:简化内容营销的视频创作平台|博客文章转视频

ピクトリー:コンテンツマーケティングを簡素化する動画作成プラットフォーム|ブログ記事から動画へ

はじめに Pictoryは、人工知能技術を使って動画を素早く作成・編集するためのプラットフォームです。YouTubeのホスト、コンテンツマーケター、ビジネスユーザーなど、Pictoryを使えば、スクリプト、ブログ記事、長編動画を数分で専門的な動画に変換することができます。
11ヶ月前
025.7K
PlayAI:提供流畅、富有情感的语音对话和语音合成服务(英文)

PlayAI:スムーズで感情的な音声対話と音声合成サービスの提供(英語)

概論 PlayAIは、音声生成と音声クローニングに特化したAIプラットフォームである。スムーズで感情的なダイアログを生成できる幅広い音声モデルを提供しています。ユーザーはこのプラットフォームを使って、対話体験を向上させるパーソナライズされた音声エージェントを作成することができます。
11ヶ月前
025.7K
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI:テキスト生成映画・TVナレーション・自動編集ツール

概論 NarratoAIは、映画やビデオのナレーション、自動編集、吹き替え、字幕生成を統合した完全自動化ツールです。大規模言語モデリング(LLM)技術により、コピーを自動生成し、対応するナレーションと字幕をビデオに自動編集し、ユーザーにワンストップを提供します。
1年前
025.7K
VocalRemover:免费分离歌曲人声与伴奏的在线工具

VocalRemover: 曲のバッキングトラックからボーカルを分離する無料オンラインツール

概要 VocalRemoverは無料のオンライン・オーディオ処理プラットフォームで、主に楽曲のボーカルとバッキング・トラックを分離するのに役立つ。ユーザーはオーディオファイルをアップロードするだけで、ウェブサイトは人工知能技術を使ってボーカルとバッキングトラックを素早く分析し、分離したトラックを生成します。このツールは、ボーカルとバッキングトラックを分離したい人に適しています。
6ヶ月前
025.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台

AliMamaクリエイティブセンター:タオバオエコロジーのインテリジェントマーケティングクリエイティブサポートプラットフォーム

総合紹介 Alimama Creative Centreはアリババのインテリジェントなマーケティングクリエイティブサポートプラットフォームで、タオバオやTmallなどのECプラットフォームの加盟店に、グラフィックから動画、ランディングページまで、あらゆるクリエイティブサポートを提供するように設計されています。AIによるインテリジェントなコピーライティング機能と膨大なテンプレートを組み合わせることで、Creative Centreはデザイン効率を飛躍的に向上させます。
1年前
025.7K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

Analytics GBI (XiYan-SQL): ChatBIのためのテキストからSQLへのインテリジェントデータ分析が簡単に

包括的な紹介 Analyse GBIは、Aliyun Bailianが立ち上げたビッグモデルに基づくインテリジェントなデータ分析製品である。この製品は高度な自然言語処理技術を使用しており、複雑なSQL構文をマスターすることなく、ユーザが自然言語を通じてデータを照会・分析できるようにします。Analytics GBIは、以下のような複数のデータソースをサポートしています。
10ヶ月前
025.7K
阿布量化交易系统:基于Python的开源量化交易平台

アブ・クオンツ取引システム:Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなどの様々な金融商品のバックテストと取引をサポートしています。これは...
7ヶ月前
025.7K
CSM(Cube):提供3D生成AI工具,支持从图像、文本生成3D模型

CSM(キューブ):3D生成AIツールを提供し、画像やテキストからの3Dモデル生成をサポート。

概論 Common Sense Machines(CSM)は、3DジェネレーティブAI技術に特化した企業で、画像やテキストから3Dモデルを生成するツールを提供している。ユーザーは、2D画像をアップロードしたり、テキストを入力することで、高品質な3Dモデルを素早く生成することができる。
12ヶ月前
025.7K
editGPT:专业的文章校对、编辑与内容变更追踪工具

editGPT:プロフェッショナルな記事校正・編集・コンテンツ変更追跡ツール

概説 editGPTはAIベースのオンライン校正・編集ツールで、20以上の言語に対応しています。ユーザーが記事のトーンや構造を改善し、特定の読者向けにコンテンツをカスタマイズし、業界特有のフォーマットや学術的なフォーマットで編集機能を提供するのに役立ちます。ユーザーはMicro...
1年前
025.7K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT:部屋の写真をアップロードし、AIを使ってリデザインする!

概要 RoomGPTは、GitHubユーザーのNutlopeによって開発されたオープンソースプロジェクトで、ユーザーが部屋の写真をアップロードすると、人工知能技術を使ってその部屋のリデザインバージョンを生成することができる。このプロジェクトは、高額なデザイナー費用を支払うことなく、プロ級のインテリアデザインを利用できるようにすることを目的としている。
11ヶ月前
025.7K
Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)

Hallo2: リップシンク/表情シンクされたポートレートビデオのオーディオ駆動型生成 (Windows用ワンクリックインストール)

概論 Hallo2は復旦大学と百度が共同開発したオープンソースプロジェクトで、音声駆動型の生成によって高解像度のポートレートアニメーションを生成することを目的としている。このプロジェクトでは、先進的なGenerative Adversarial Networks (GAN)とタイムアライメント技術を利用し、4K解像度と最長1時間の動画生成を実現しています。
9ヶ月前
025.6K
Slidesgo:免费PPT模板下载,辅助AI生成演示文稿,提供教育版工具

Slidesgo:ダウンロード無料のPPTテンプレート、プレゼンテーションを生成するためにAIを支援し、ツールの教育版を提供する。

一般的な紹介 Slidesgoは、無料でカスタマイズ可能なGoogleスライドとPowerPointプレゼンテーションのテンプレートを多数提供するプラットフォームです。ユーザーは、ビジネス、教育、医療トピックなどのニーズに応じて、異なるスタイルや色のテンプレートを選択することができます。このサイトでは、アイコン、文字...
1年前
025.6K
WriteWise:喜马拉雅推出的专业AI小说写作工具

WriteWise:ヒマラヤのプロフェッショナルAI小説執筆ツール

総合紹介 WriteWiseは、ヒマラヤが立ち上げた小説創作に特化したオンラインサービスプラットフォームです。ペルソナ設定、台詞設計、武術戦闘などをカバーし、プロフェッショナルなAIライティング支援を提供します。また、パソコン版もダウンロード可能で、豊富なエディタ形式をサポートし、安定...
1年前
025.6K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

テキスト生成ウェブUI:複数のバックエンド・サービスをサポートするGradioベースの大規模言語モデル・チャット・インターフェース

概論 テキスト生成ウェブUIは、大規模言語モデル(LLM)のために設計されたGradioベースのウェブUIです。Transformers、llama.cp...を含む様々なテキスト生成バックエンドをサポートしています。
11ヶ月前
025.6K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Copilotバックエンドプロキシサービス:他のモデルでGitHub Copilotプラグインサーバーを引き継ぐ

概要 Copilot Backend Agent Service は、DeepSeek などの他の FIM モデルを活用して GitHub Copilot プラグイン・サーバーを管理するために設計されたオープンソース・プロジェクトです。このサービスは、V...を含む様々なIDEをサポートしています。
10ヶ月前
025.6K
VidAU:视频换脸与视频多语言翻译工具

VidAU:ビデオ顔交換とビデオ多言語翻訳ツール

はじめに VidAU.AIは動画・音声生成のためのオールインワンAIツールで、動画スポーク、顔交換、多言語翻訳、字幕・透かし除去、動画ミキシング・編集など幅広い機能を提供します。スキット、広告、売り込み、ソーシャルメディアコンテンツ、トレーニングなどの動画作成をサポートします。
1年前
025.6K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: 遠隔技術面接を支援する目に見えないAIツール

一般的な紹介 Interviewcoderは、技術面接のために設計されたAI支援ツールで、ユーザーがプログラミング面接中に解答を素早く生成し、コードを最適化し、リアルタイムでデバッグできるように設計されています。ステルスデスクトップアプリケーションとして動作し、Zoom、Googl...
7ヶ月前
025.6K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る

一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...
7ヶ月前
025.6K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: プロフェッショナルオンラインオーディオ編集ツール|オーディオブック制作|テキストからスピーチへ|伴奏分離

概要 XAudioProは、プロフェッショナルかつポータブルな先進的なオンラインオーディオリアルタイム編集およびトランスコードツールです。カット、クロップ、コピー、削除、復元、振幅ゲインコントロールなどのプロフェッショナルなオーディオ編集機能をサポートします。また、スペクトルサブトラクションノイズ除去、ローパスノイズ除去などのノイズ除去サービスも提供します。
1年前
025.6K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait:静止画や動画からダイナミックなポートレートを生成するアニメーションツール

一般的な紹介 LivePortraitはRacer Technologyによって開発された先進的なAIダイナミックポートレートアニメーションツールです。革新的なAI技術を利用し、静止画像を鮮やかなビデオアニメーションに変換します。本物の写真でも、アニメーションスタイルでも、芸術的なポートレートでも、LivePo...
11ヶ月前
025.6K
ChatArt:覆盖完整写作场景的全能AI写作工具

ChatArt:ライティングシナリオを網羅したオールインワンAIライティングツール

ChatArtは、iMyFoneが開発したAIによるコンテンツ作成プラットフォームです。ブログ、ソーシャルメディア投稿、マーケティングコピー、さらには小説の執筆など、高品質な文章コンテンツを素早く作成することができます。このプラットフォームは、高度なAI技術を使用しています...
7ヶ月前
025.6K
Questgen:智能测验题目生成工具,AI生成多项选择题, 判断题, 填空题

Questgen:スマートクイズ問題ジェネレータ、AIが生成した複数の選択肢、判断、空白の質問の記入

一般的な紹介 QuestgenはAIを搭載したクイズ生成ツールで、あらゆるテキストから様々なタイプのクイズ問題を素早く生成することができます。多肢選択問題、判断問題、穴埋め問題、高次問題など、Questgenは数秒で問題を生成します。作業...
1年前
025.6K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
8ヶ月前
025.6K
Second Me:本地训练拥有个人记忆和习惯的AI分身

セカンド・ミー:個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や癖を学習し、あなたのことを理解する賢い人間になることができる。
7ヶ月前
025.6K
PR Agent:自动化拉取请求分析工具

PR Agent: プルリクエスト自動分析ツール

概論 PR-AgentはQodoが開発したオープンソースツールで、AI技術によってプルリクエスト(Pull Requests)の処理を自動化する。このツールは、開発者がコードレビューをより効率的に実行できるように、自動化されたフィードバック、提案、分析を提供することができます...
9ヶ月前
025.6K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

ARドローイング:ARとAI技術を使ってリアルな手描きのスキルを高めるアプリ

概要 AR Drawingは、拡張現実(AR)技術を使用して、ユーザーのデッサンスキルの向上を支援するアプリです。このアプリは、初級から上級レベルまでの様々な描画テンプレートをカバーする200以上のステップバイステップのガイド付き描画レッスンを提供しています。ユーザーは、携帯電話のカメラを使って画像を投影することができます...
11ヶ月前
025.6K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型

JENOVA:複数のモデルと検索を統合し、問題に応じてモデルを動的に選択するAI対話アシスタント

包括的な紹介 JENOVAは、強力なAI統合サービスをユーザーに提供するために設計された、世界をリードするAIプラットフォームです。最先端のAIモデル(GPT-4o、Claude 3.5、Gemini 2など)を統合することで、JENOVAはユーザーのニーズに...
9ヶ月前
025.6K
通义听悟:阿里通义音视频内容转录AI助手

Tongyi Listening and Understanding: Ali Tongyi 音声・動画コンテンツ書き起こしAIアシスタント

総合紹介 Tongyi Listening and Understandingは、Aliyunが発表した、音声や動画コンテンツの書き起こしや分析に特化した作業学習AIアシスタントです。AliCloudの強力なAIモデルを利用して、音声や動画コンテンツをリアルタイムでテキストに書き起こし、翻訳、要約、位置決めなどの機能を提供します。Tongyi Listening Wooは、複数の言語とシナリオをサポートしています...
1年前
025.6K
Vsub:输入文字或模板生成无需露脸的病毒营销视频

Vsub:テキストやテンプレートを入力し、顔出し不要のバイラル・マーケティング動画を生成する。

概要 Vsubは動画コンテンツ作成の自動化に焦点を当てたプラットフォームで、コンテンツクリエイターが顔のない動画(フェイスレスビデオ)を素早く作成できるように設計されています。人工知能技術を活用し、ユーザーがテキストを入力したり、YouT...
9ヶ月前
025.6K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。ワンクリックのデプロイと軽量なゲートウェイ機構により、開発者が複雑なAIアプリケーションを素早く構築できるよう支援し、面倒なエンジニアリングの設定を省きます。
8ヶ月前
025.6K
EmemeAI:创建并导出3D虚拟AI角色的互动平台

EmemeAI: 3DバーチャルAIキャラクタの作成とエクスポートのためのインタラクティブプラットフォーム

概 要 EmemeAIは、3DのAIキャラクターを作成するためのプラットフォームです。VRM形式の3Dモデルをアップロードし、キャラクターの性格を設定することで、自動でチャットや動きができるバーチャルキャラクターを生成することができます。キャラクターは会話だけでなく、状況に応じて表情やアクションを生成することができます。
6ヶ月前
025.6K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest:世界をリードする軽量・高性能エンドサイド・ビッグモデル

概要 ModelBestは、軽量かつ高性能な大型モデルの開発に注力する企業であり、先進的なAI技術をメインストリーム家電や日常生活のあらゆるエンドデバイスに応用することに専念している。同社のMiniCPMシリーズは、非常に高い演算能力とメモリ使用効率を備えたエンドサイドモデルです。
12ヶ月前
025.6K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。
10ヶ月前
025.6K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - オープンソースのAIビデオ生成モデル、アリが発表

Tongyi Wanphase Wan2.2は、アリババがオープンソース化した先進的なAI動画生成モデルで、総参照数は270億件に上る。このモデルには、テキスト生成ビデオ、グラフ生成ビデオ、統合ビデオ生成の3つのモードがあり、テキストの説明、画像、またはその両方の組み合わせに基づいて高品質のビデオを生成することができます。
3ヶ月前
025.6K
Folk:使用AI优化客户关系管理

フォーク:AIを使って顧客関係管理を最適化する

概 要フォークは、人工知能技術を組み合わせることで、よりスマートな顧客関係管理ソリューションをユーザーに提供します。AI機能は、ユーザーの生産性を向上させるために日常的なCRMタスクを自動化し、ユーザーがより正確なビジネス戦略を策定するのに役立つデータ分析を通じて洞察を提供します。
9ヶ月前
025.6K
Oliva:语音控制的多智能体产品搜索助手

Oliva:音声制御のマルチインテリジェンス製品検索アシスタント

概要 OlivaはDeluxerがGitHubで開発したオープンソースのマルチインテリジェンスアシスタントツールです。複数のAIインテリジェンスの連携により、Qdrantデータベースの商品情報検索を支援します。主な特徴は、音声操作に対応していることです...
7ヶ月前
025.6K
Zonos:高质量语音合成与语音克隆工具

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。
8ヶ月前
025.6K