最新のAIリソース

共 3143 篇文章

コース情報最新のAIリソース AI知識ベース AIニュース

順番に並べる

目を通すブックマーク

Cursorful：マウスに追従して画面動画を録画するChromeプラグイン

概要 Cursorfulは、魅力的な画面録画ビデオを作成するために設計された強力なブラウザ拡張機能です。自動ズームやパン機能を使って、プロ並みのビデオを簡単に作成できます。説明ビデオでも、製品デモでも、チームコミュニケーションでも...

最新のAIリソース

2年前

0121.1K

BISHENG：エンタープライズAIアプリケーション構築のためのオープンソースLLM DevOpsプラットフォーム

包括的な紹介 BISHENGは、次世代のエンタープライズAIアプリケーションのために設計されたオープンソースのLLM（大規模言語モデル）DevOpsプラットフォームです。このプラットフォームは、生成AIワークフロー、RAG（Retrieval Augmented Generation）、インテリジェントエージェント、統合モデル管理などの強力で包括的な機能を提供します。

2年前

0121K

Midscene.js：AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。

2年前

0121K

ChatLLM：複数のAIモデルをサポートするインテリジェントチャットツール

概要 ChatLLMは、Abacus.AIによって開発されたインテリジェントなチャットツールです。GPT-4o、Gemini、Grokなど、様々なトップクラスの言語モデルを統合しており、ユーザーは1つのプラットフォームを通して様々なAI機能を体験することができます。いいえ...

最新のAIリソース # AI統合マルチモデル対話プラットフォーム

1年前

0121K

Stability Matrix：一键部署主流Stable Diffusion UI和模型

安定性マトリックス：主流の安定拡散UIとモデルをワンクリックで展開

安定性マトリックス概要 Lykos AIは、安定性マトリックスと呼ばれる安定性拡散のワンクリックインストールを提供します。

最新のAIリソース # AI自己展開イメージ生成ツール

2年前

0120.9K

グラノーラ：会議の議論を書き起こし、AIで会議メモを強化するAI会議アシスタント

概要グラノーラは、人工知能技術を利用して会議の効率と記録の正確性を向上させるツールです。リアルタイムで会議を書き起こし、スマートノートを自動生成し、詳細な会議分析を提供します。Granolaは、ユーザーがより良い会議記録を管理し、作業を改善するために設計されています...

最新のAIリソース # AIテキストおよび音声/ビデオ要約ツール

2年前

0120.7K

Orpheus-TTS：自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成（TTS）システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。

1年前

0120.7K

WebSim AI: 一文でスタンドアロンのウェブアプリを生成するAIウェブエディタ

一般的な紹介 WebSim AIはNetwrckによって開発された先進的な人工知能ウェブエディタとシミュレータです。CSSとJavaScriptを使ってダイナミックなウェブページを作成できるユニークで直感的なプラットフォームを提供します。WebSimの助けを借りて、Webページを作成することができます。

最新のAIリソース # AIページデザイン # コード開発なし

2年前

0120.6K

TRV：スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。

1年前

0120.4K

RF-DETR：リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースにしており、リアルタイム性を特徴としています。このモデルはMicrosoft COCOデータセット上で初めて60APs以上のリアルタイム性を達成した。

1年前

0120.2K

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

Linly-Talker：デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル（LLM）と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。

1年前

0120.2K

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

概論 VITAは、オープンソースの対話型マルチモーダル大規模言語モデリング・プロジェクトのリーダーであり、真の完全なマルチモーダル対話を実現する能力を開拓している。プロジェクトは2024年8月にVITA-1.0を立ち上げ、初のオープンソース対話型フルモーダル大規模言語モデルを開拓した。

2年前

0120.1K

freebeat.ai：ワンクリックで音楽をダンスビデオやミュージックビデオに！

はじめに freebeat.aiは、音楽をワンクリックでダンスビデオ、ミュージックビデオ、歌詞ビデオに変換することに特化した無料のAIツールサイトです。ユーザーは、SpotifyやYouTubeなどのプラットフォームから音楽へのリンクをアップロードすることができ、AIは自動的にビートを生成します。

最新のAIリソース # AI動画生成ツール

1年前

0120K

Crawl4AI：LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル（LLM）と人工知能（AI）アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマットを提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0120K

Plate: 豊富なプラグイン拡張機能をサポートしたAI駆動型リッチテキストエディタ

概要 PlateはReactとTypeScriptで構築されたAI搭載のリッチテキストエディタで、高度にカスタマイズ可能で拡張性の高い編集体験を提供するように設計されています。Slate.jsをコアに利用し、モダンなUIと組み合わせている。

2年前

0120K

Trend Finder：实时追踪社交媒体趋势、热门话话题和新原文，助力营销决策

Trend Finder: ソーシャルメディアのトレンド、トレンドトピック、新着記事をリアルタイムで追跡し、マーケティングの意思決定に活用。

はじめに Trend Finderは、ソーシャルメディア上のトレンドトピックやトレンドをリアルタイムで追跡できるように設計された強力なツールです。主要なインフルエンサーからの投稿を収集・分析することで、Trend Finderは新しいトレンドや製品リリースをいち早く察知し、発信することができます。

2年前

0119.8K

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。

2年前

0119.7K

LiteAvatar：CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム（Aliの一部）によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム（fps）で動作し、特に...

1年前

0119.4K

Suno：想像力で音楽を創造する｜AI音楽生成ソフトウェア

多くのAI音楽アプリとは異なり、Suno（ヒンディー語で「聴く」という意味）は、人気アーティストのサウンドや楽曲のパクリや模倣ではなく、オリジナル曲とオリジナルボーカルの作成に重点を置いています。 Sunoの総合的な紹介 Suno（スノ）は、AI音楽アプリです。

最新のAIリソース # AIミュージック

2年前

0119.4K

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル（LLM）が音声を生成します。

1年前

0119.4K

Sora: テキストからAIビデオへ、ビデオ編集クリエイティブスイート

一般的な紹介 Soraは、OpenAIによる先進的なビデオ生成ツールで、人工知能技術によってユーザーが簡単に高品質なビデオコンテンツを作成できるように設計されています。Soraは、拡散モデルを使用して、静的ノイズから始まる多段階のノイズ除去プロセスによって完全なビデオを生成します。ユーザーは...

2年前

0119.3K

QuickMagic：AIモーションキャプチャー技術で高画質なアニメーション動画を簡単作成

概要 QuickMagic AIは、シンプルなビデオを高品質な3Dアニメーションに変換するために設計された、高度なAI駆動型モーションキャプチャツールです。アニメーター、ゲーム開発者、デジタルコンテンツ制作者など、QuickMagic AIは高速かつ正確なモーションキャプチャーを実現します。

最新のAIリソース # AI画像生成エイド # AI動画変換スタイル

2年前

0119K

RTranslator: Android用リアルタイム音声翻訳アプリ！

一般的な紹介 RTranslatorは、Androidデバイスのために設計された事実上オープンソース、無料のオフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の国の言葉を話しているかのように他の人と会話をすることができます。

2年前

0118.9K

DeepFace: 顔の年齢、性別、感情、人種認識のための軽量Pythonライブラリ

概要 DeepFaceは、顔認識と顔属性分析（年齢、性別、感情、民族を含む）のための軽量なPythonライブラリです。VGG-Face、FaceNet、OpenFace、De...といった先進的な顔認識モデルを統合しています。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0118.9K

AivisSpeech：情緒豊かな日本語音声合成ソフトウェアの開発

概要 AivisSpeechはVOICEVOXエディタのUIをベースにした日本語音声合成ソフトウェアです。AivisSpeech Engineを統合し、感情豊かな音声を簡単に生成することができます。

最新のAIリソース # AI音声合成

2年前

0118.8K

Tripo: AI駆動型3Dモデル生成プラットフォーム、3Dマテリアル、シーン、ビデオ生成ツール

概要 Tripo 3Dは、人工知能技術を利用して高品質な3Dモデルを素早く生成するプラットフォームです。ユーザーは、エンターテインメント、ゲーム、工業デザイン、建築など幅広い分野で、テキスト記述や画像入力により、テクスチャを含む詳細な3Dモデルを簡単に作成することができます。

最新のAIリソース # AIテキストとイメージを3Dへ

2年前

0118.7K

Graphiti: ダイナミックな知識グラフの構築とクエリーツール（時間を考慮したロングメモリプログラム）

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。

1年前

0118.7K

MemeGen AI：智能搞笑图片生成器，将照片转化为动态表情包，轻松创建搞笑图片

MemeGen AI: インテリジェントな面白い写真ジェネレーター、写真をダイナミックな顔文字に変え、面白い写真を簡単に作成できます！

一般的な紹介 MemeGen AIは、簡単な操作で様々な面白い写真を作成できる人工知能ベースの面白い写真ジェネレーターです。このサイトでは、高度なGPT-4ビジョンモデルを使用して、ユーザーに技術的な知識を必要とせずに、面白い写真とテキストを自動的に生成します。

最新のAIリソース # AIイメージスタイルコントロール

2年前

0118.5K

PapersGPT: 論文の読解と研究の効率を高めるZoteroのAIプラグイン

一般的な紹介 PapersGPT for Zoteroは、Zoteroユーザーのために設計されたAIプラグインで、論文の読解と研究の効率を向上させます。このプラグインには、ChatGPT、Claude、Ge...などの高度な言語モデルが統合されています。

最新のAIリソース # AI教育ツール

1年前

0118.2K

ナノブラウザ：ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概要 NanobrowserはオープンソースのChrome拡張機能で、AI主導のマルチエージェントシステムによってウェブタスクを自動化するように設計されています。OpenAI Operatorに代わる無償の拡張機能で、ユーザーはLLMを提供するだけです。

1年前

0118.1K

XiaohongshuのAI操作アシスタント：自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant（xhsaipublisher）は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...

2年前

0118K

Wan2.1：民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...

1年前

0118K

ボカライブ：AIインテリジェント・ライブストリーミング・プラットフォーム｜カスタムクローンデジタルピープル

BocaLive（ボカライブ）概要 BocaLive（ボカライブ）は、Flashcut傘下のアウトオブホーム製品であるAIデジタイザーのためのワンストップライブスタジオを提供するリーディングプラットフォームです。ユーザーはデジタルアバターの選択、AIスクリプトの生成、シーンの設定を10分で行うことができます。このプラットフォームは100以上の国際的なS級アバターを提供しています。

最新のAIリソース # AIデジタルマン # AIマーケティング

2年前

0117.9K

One API：マルチモデルのAPI管理と負荷分散、配信システム

総合紹介 One APIは、OpenAI ChatGPT、Anthropic Claude、Google PaLM 2、Geminiといった様々なビッグモデルをサポートするオープンソースのインターフェース管理・配布システムです。その ...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0117.9K

GPT4All：ローカリゼーションとデータ・セキュリティに焦点を当てたCPU上で動作する大規模言語モデル・クライアント

GPT4All 概要 GPT-4AllはNomicによって開発されたオープンソースプロジェクトで、ユーザーがローカルデバイス上で大規模言語モデル（LLM）を実行できるようにするものです。このプロジェクトは、プライバシー保護を重視し、インターネット接続なしで使用することができ、個人ユーザーとビジネスユーザーの両方に適しています...

最新のAIリソース # オープンソース大型モデルツールのローカル展開

1年前

0117.6K

WebDevアリーナ：AIのWebプログラミング能力を比較するツール、LMArenaがリリース

一般的な紹介 WebDev Arenaは、LMArenaチームによって開発されたリアルタイムのAIプログラミング競技プラットフォームであり、人工知能言語モデル（LLM）同士を戦わせることで、ウェブ開発の課題をクリアすることに重点を置いています。ユーザは、「ウェブデザインの作成」などの特定のウェブデザインタスクを入力することができます。

最新のAIリソース # AIオープンサービス

1年前

0117.6K

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍を整理したいユーザのためにGitHubでホストされています。このツールは、以下の方法で動作します。

1年前

0117.6K

データベースクエリをサポートしたDifyプラグイン

一般的な紹介 dify-plugin-tools-dbqueryは、Dify 1.0プラットフォーム用に設計されたオープンソースのプラグインで、開発者のjunjiemがGitHubで公開しています。このプラグインは、データベースクエリ機能を提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0117.5K

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。

2年前

0117.4K

Open WebUI: ローカルでホストされるAIチャットWebUI

概論 Open WebUI（旧称Ollama WebUI）は、LLM（大規模言語モデル）のために設計された、フレンドリーなAI対話型ユーザー・インターフェースです。Open WebUIの優れた特徴は以下の通りです。

最新のAIリソース # AIローカライズチャットアプリケーション

2年前

0117.2K

pure.md：URLの前に "pure.md/"を挿入して、きれいなテキストを取り出す。

一般的な紹介 pure.mdはAIエージェントや開発者のためのツールで、ウェブコンテンツやファイルを素早くMarkdown形式に変換することに重点を置いています。プロキシサービスによるクローラー対策の制限を回避し、ウェブページのコアデータを抽出し、クリーンなMarkdownを出力します。

1年前

0117.2K

Linly-Dubbing：インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...

2年前

0117.1K

AudioX: 参照されたテキスト、画像、ビデオからオーディオと音楽を生成

概要 AudioXはZeyue TianらによるGitHub上のオープンソースプロジェクトである。AudioXはDiffusion Transf...

1年前

0117K

キャラクターAI：バーチャルキャラクター用の安全なチャットインテリジェンスツール

一般的な紹介キャラクターAIは、ユーザーがバーチャルキャラクターと対話できるAIベースのチャットプラットフォームである。元Googleのエンジニアによって開発され、その中核技術は大規模な言語モデリングである。ウェブサイトは2022年9月にパブリックベータ版として公開され、モバイルアプリは2023年5月にリリースされた。

最新のAIリソース # AIロールプレイ

1年前

0116.9K

Firebender：Android開発者のためのAIプログラミング・アシスタント

概要 Firebenderは、Android Studio（jetbrainsサポート）用に設計されたAIコーディングアシスタントで、開発者のプログラミング効率を劇的に向上させるように設計されています。高度なAIを統合してコード生成を行います。

最新のAIリソース # AIプログラミング

1年前

0116.7K

SynthLight：ポートレート画像の自然光レンダリング（未発表）

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは、物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します...

2年前

0116.6K

Meshy：無料で使える画像生成3Dモデルツール

一般的な説明 Meshyは、アーティスト、ゲーム開発者、クリエイターが高品質の3Dモデルを素早く生成できるように設計された、強力なAI 3Dモデル生成ツールです。テキストや画像を入力するだけで、数秒で魅力的な3Dモデルを作成することができます。

最新のAIリソース # AIテキストとイメージを3Dへ

2年前

0116.6K

アグノ：記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。

1年前

0116.5K

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...

2年前

0116.5K

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0116.5K

Bailing：自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

包括的な紹介ベイリング（Bailing）は、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)および音声合成(TTS)技術を組み合わせて...

2年前

0116.4K

Tomatoオーサリングツール：ライセンスされた小説や短い劇の脚本をビデオに変換し、プロモーションやトラフィック生成のための短いビデオを生成する。

総合紹介 Tomato Darling CentreのCopy to Video Creation Toolは、コンテンツ制作者が文章で書かれたコピーを素早く動画に変換できるように設計された、強力なAIGC（Artificial Intelligence Generated Content）ツールです。このツールは、意味解析、イラスト生成、動画エクスポートなどの機能により、コピーから動画への制作を簡素化します。

2年前

0116.4K

Noisee AI：音楽のメロディを使った、スタイルに一貫性のあるMVモーションビデオの生成

概論 Noiseeは、Dark Side of the Moonの子会社であるTranquilitatis Inc.によって開発されたAIミュージックビデオ生成ツールで、音楽制作やビジュアルアートの分野で大きな力と幅広い用途を発揮しています。 Noisee AIは革新的な...

最新のAIリソース # AI動画生成ツール

2年前

0116.4K

Qwen Chat：Qwenファミリーの全モデルを使用し、画像生成、文書処理、ウェブ検索を行う。

総合紹介 Qwen Chat（同義銭海外版）は阿里雲社が開発した多機能AIアシスタントプラットフォームで、ユーザーに総合的なAIサービスを提供することを目的としている。このプラットフォームは、チャットボット、画像・動画理解、画像生成、文書処理、ウェブ検索統合、ツールリ...

最新のAIリソース # AIビッグモデルネイティブダイアログツール

1年前

0116.3K

シグマAIブラウザー：主流のビッグモデルを使用するための無料のAIブラウザー

概要 Sigma AI BrowserはSigmaBrowser OÜによって開発された先進的なブラウザで、人工知能技術を活用し、より高速でスマートなブラウジング体験をユーザーに提供します。このブラウザは、スピードと効率性だけでなく、セキュリティの強化やパーソナル...

最新のAIリソース # AI統合マルチモデル対話プラットフォーム

1年前

0116.3K

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成（RAG）、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...

1年前

0116.3K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk：完全なデジタルヒューマンビデオ生成フレームワーク｜ポートレートからビデオへ｜ポーズからビデオへ｜リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。

2年前

0116.2K

Deep Live Cam：开源的实时AI换脸工具，一张照片就能实现实时换脸直播

ディープライブカム：オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。

2年前

0116.2K

OpenAvatarChat：モジュール設計されたデジタル人間対話ツール

概論 OpenAvatarChatはHumanAIGC-Engineeringチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。モジュール式のデジタル人間対話ツールで、1台のPCで動作させることができます...

1年前

0116.2K

Cicada Mirror：何百ものデジタル人体テンプレートと専用デジタル人体イメージのクローンを備えたデジタル人体ビデオ作成プラットフォーム（有料）

概論 Cicadaはデジタル人体映像制作に特化したプラットフォームで、AI技術を利用して映像制作プロセスを簡素化する。ユーザーは、さまざまなデジタル人物の画像を選択し、コピーを入力し、多言語ダビング付きのビデオを生成することができます。また、豊富なテンプレートや素材ライブラリが用意されており、広告やマーケティング、教育やトレーニングなど、様々な分野に適しています。

最新のAIリソース # AIデジタルマン

2年前

0116.2K

SkyReels：自然な動きのあるパノラマポートレートの生成に特化したAI動画スキット作成プラットフォーム

はじめに SkyReelsは、AIによる動画作成に特化したオンラインプラットフォームで、ユーザーがテキストスクリプトやクリエイティブなアイデアを高品質なショートビデオに素早く変換できるように設計されています。コンテンツ制作者、マーケティング担当者、一般ユーザーに関わらず、テキストを入力するだけで、プラットフォームが自動的に動画を生成します。

最新のAIリソース # AIテキストからビデオへ

1年前

0116.1K

LibreChat: ChatGPTインターフェイスを模倣したAI対話オープンソースプロジェクト

概要 LibreChat は、カスタマイズオプションが豊富で、複数のAIプロバイダー、サービス、統合をサポートする、無料のオープンソースAIチャットプラットフォームです。使い慣れたインターフェースと革新的な機能を備え、複数のAIモデル、プラグイン、多言語をサポートすることで、すべてのAI会話を一つの場所に集約します。バイ...

2年前

0116.1K

TurboScribe: オーディオやビデオを素早くテキストに変換するオンラインツール

概要 TurboScribeはAIベースのテープ起こしツールで、音声やビデオを素早くテキストに変換することに重点を置いています。98以上の言語をサポートし、99.8%の精度を持つため、音声コンテンツを効率的に処理する必要があるユーザーに適しています。ユーザーはファイルをアップロードしたり、テキストメモを生成したりすることができます...

最新のAIリソース # AI音声合成

1年前

0116K

Smolagents：AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

包括的な紹介 Smolagentsは、HuggingFaceによって開発された軽量インテリジェントエージェントライブラリで、AIエージェントシステムの開発プロセスを簡素化することに重点を置いています。このプロジェクトは、約1000行のコアコードしかないシンプルな設計思想で知られていますが、強力な機能統合機能を提供しています。このライブラリの最も ...

2年前

0116K

LocalAI：开源的本地AI部署方案，支持多种模型架构，WebUI统一管理模型和API

LocalAI: オープンソースのローカルAIデプロイメントソリューション、複数のモデルアーキテクチャのサポート、モデルとAPIのWebUI統合管理

概要 LocalAIは、OpenAIやClaudeなどと互換性のあるAPIインターフェースを提供するように設計された、オープンソースのローカルAI代替ソフトウェアです。コンシューマーグレードのハードウェアで動作し、GPUを必要とせず、テキスト、オーディオ、ビデオ、画像生成、複数の音声クローンが可能です。

最新のAIリソース # オープンソース大型モデルツールのローカル展開

2年前

0115.9K

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。

1年前

0115.7K

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所（OpenGVLab）によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0115.6K

ComfyUI-Copilot：テキスト記述生成のためのAIアシスタント ComfyUIワークフロー

包括的な紹介 ComfyUI-Copilotは、ComfyUIフレームワークのために設計されたAI駆動のカスタムノードで、自然言語対話を通じてAIアルゴリズムのデバッグとデプロイの効率を向上させることを目的としています。AIDC-AIチーム（Alibaba）によって開発され、GitHu...

1年前

0115.6K

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。

1年前

0115.6K

AutoDev：多言語対応のコード自動生成・デバッグツール

概要 AutoDevは、Unit Meshチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、人工知能技術によって開発者のプログラミング効率を向上させることを目的としています。強力なコーディングアシスタントであり、Ja...を含む複数のプログラミング言語をサポートしている。

1年前

0115.5K

Outlier：AIモデルのトレーニングに参加するためのタスク公開プラットフォーム

概要 Outlierは、世界中の専門家を結びつけ、ユーザーがAIモデルのトレーニングや最適化に取り組めるよう支援するオンライン・プラットフォームである。ユーザーは専門知識を活用し、柔軟な収入を得ながらタスクをこなすことで、AI開発に貢献することができる。このプラットフォームは、様々なドメインのタスクをサポートしています...

最新のAIリソース # AI副業お金儲けプロジェクト

1年前

0115.3K

Artificial Analysis：AI模型和API提供商PK排行榜，性能分析|质量评估|价格比较

人工分析：AIモデルとAPIプロバイダーのPKランキング、パフォーマンス分析｜品質評価｜価格比較

概論 Artificial Analysisは、AIモデルとAPIプロバイダーの独立した分析に焦点を当てたオンラインモデルコンペティションプラットフォームです。このサイトは、開発者、ユーザー、研究者、その他のユーザーが情報に基づいた選択をするのに役立つ詳細なデータとチャートを提供します。を通じて...

最新のAIリソース # AIオープンサービス

2年前

0115.2K

PixVerse: テキストや画像でユニークなスタイルのビデオクリップを生成します。

PixVerse AI 総合紹介 pixverseは革新的なAI動画作成プラットフォームです。強力なジェネレーティブAIを使って動画作成の可能性を最大限に引き出し、あなたのコンテンツを素晴らしく印象的なものにします。pixverseはインテリジェントなアルゴリズムとディープラーニング技術を使って...

最新のAIリソース # AI画像から動画へ # AIテキストからビデオへ

1年前

0115.2K

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。

2年前

0115.2K

レポ・プロンプト：ローカル・フォルダー・コンテキストに依存した記述、対話、最適化されたコード

概要 Repo PromptはmacOSプラットフォーム用に作られたネイティブアプリケーションで、高度なAI言語モデルを使用してネイティブコードを扱う開発者のプロセスを簡素化することに特化しています。このツールは、開発者がインテリジェントな方法でコードファイルを管理・修正するのを支援し、開発効率を大幅に向上させます...

2年前

0115.2K

NeoAI：AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト

一般的な紹介 NeoAIは革新的なオープンソースのAIアシスタントツールで、ユーザーは自然言語対話を通じて簡単にコンピュータを制御・管理することができます。コードを書くことなく、日常的な対話だけでファイルの検索、タスクの自動化、デバイスの管理などを行うことができます。

2年前

0115K

ライトバンブーPPT：PPTのAIワンキー生成、オンラインPPT制作、Word、PDFドキュメントをPPTに

総合紹介 Light Bamboo PPT (QZOffice)は、人工知能技術を利用して、プロ級のプレゼンテーションを素早く作成できるオンラインサービスプラットフォームです。テーマやポイントを入力することで、PPTテンプレートを自動生成し、オンラインで編集・共有することができます。

最新のAIリソース # AI生成プレゼンテーション/PPT

2年前

0115K

Cog-ComfyUI：APIを使ったComfyUIワークフローの実行

一般的な紹介 Cog-ComfyUIは、APIを介してComfyUIワークフローを実行するために設計されたオープンソースプロジェクトです。GitHubユーザーのfofrによって作成されたこのプロジェクトは、ComfyUIワークフローを統合して実行する効率的な方法を提供します。

2年前

0114.9K

J.A.R.V.I.S.：具有上下文感知的智能代码助手，生成和修改代码，多IDE支持

J.A.R.V.I.S.：コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

概論 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的なディスカッションを支援するように設計されたインテリジェントなコード・アシスタントです。

2年前

0114.8K

Copilot：Microsoft Copilo智能AI助手，生产力工具| 微软Copilo国内访问

Copilot: Microsoft Copilo Intelligent AI Assistant, 生産性向上ツール | Microsoft Copilo 国内アクセス

Copilotの概要 Copilotは、Microsoft 365に統合可能な人工知能支援としてMicrosoftによって導入された。Copilotは、ユーザーの自然言語を理解し、ユーザーが情報をより迅速に入手し、生産性を向上できるよう支援します。

2年前

0114.8K

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...

2年前

0114.6K

智谱清言：GLM模型驱动的智能对话工具，支持创建智能体、长文档解读、AI数据分析

Smart Spectrum Clear Speech: インテリジェンス作成、長文文書解釈、AIデータ分析をサポートするGLMモデル駆動型インテリジェント対話ツール

包括的な紹介智谱清言（chatglm.cn）のウェブサイトは、GLM（生成言語モデル）技術に依存して、インテリジェントなコミュニケーションプラットフォームを提供します。このプラットフォームは、複数回の対話、コンテンツ作成、メッセージ要約をサポートし、高度な...

1年前

0114.3K

ViMax - 香港大学のオープンソースマルチインテリジェントボディビデオ生成フレームワーク

ViMaxは、香港大学のデータサイエンス研究所が開発したオープンソースのマルチインテリジェンス・ボディ・ビデオ生成フレームワークで、クリエイティブな入力からビデオ出力までの全プロセスを自動化することができます。スクリプト生成、シーンデザイン、ショットプランニング、ビデオレンダリング機能を統合し、自然言語記述による首尾一貫した映画・テレビグレードのビデオ生成をサポートします。

最新のAIリソース

8ヶ月前

0114.3K

Xunfei Painted Mirror：入力コピーAIは自動的に短いビデオ、AIショートビデオ作成プラットフォームを生成する

総合紹介 Xunfei Painted Mirror (Typemovie)はXunfei Selection (Huangshan) Technology Co., Ltd.が開発したAI動画作成プラットフォームである。このプラットフォームは、コンテンツクリエイター、マーケティング担当者、教育者に適しており、ショートドラマ、予告編からミュージックビデオまで、多様な作成オプションを提供しています。ユーザーが必要なのは...

最新のAIリソース # AI動画生成ツール

1年前

0114.3K

Goose：全工程のプログラミング作業を自動化する、オープンソースのスケーラブルなプログラミング・インテリジェンス

一般的な紹介 GooseはBlock社によって開発されたオープンソースのAIエージェントツールで、開発者が日常的な開発作業を自動化できるように設計されています。さまざまな大規模言語モデル（LLM）をサポートし、コマンドラインやデスクトップアプリケーションのインターフェースを介してユーザーと対話します。

2年前

0114.3K

Smart Composer：引用本地笔记智能写作和语义搜索的Obsidian插件

Smart Composer: ローカルノートを参照するためのスマートライティングとセマンティック検索のためのObsidianプラグイン

概論 Smart ComposerはObsidianノート作成ソフトウェア用に設計されたスマートライティングアシスタントプラグインです。人工知能技術を使って、文脈を意識したチャットアシスタント、スマートライティングアシスタント、ワンクリック編集機能を提供します。このプラグインは、ユーザーの...

最新のAIリソース # AIノート

2年前

0114.2K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成（TTS）APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。

2年前

0114.2K

Zoo: テキストから3Dモデリングが可能なハードウェア設計用CADソフトウェア

概論 Zooは最新のハードウェア設計のために構築されたCADソフトウェアプラットフォームです。Zooの主な機能には、Text-to-CADインターフェース、モデリングアプリケーション、差分ビューアーなどがあります。

最新のAIリソース # AIテキストとイメージを3Dへ

2年前

0114.2K

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。

1年前

0114.2K

OpenArt: フリーAIアート画像ジェネレーター｜ComfyUI共有コミュニティ

概論 OpenArtは、ユニークなアート画像を素早く作成するためのAI画像生成プラットフォームです。OpenArtは、100種類以上のモデルやスタイルから選ぶことができ、パーソナライズされたモデルをトレーニングすることもできます。アーティスト、デザイナー、あるいは趣味の人であろうと、OpenArtを利用すること...

2年前

0114K

AnimateAI：AIでキャラクターを統一したアニメ動画を生成、子供向けアニメ動画生成ツール

包括的な紹介 AnimateAI は、アニメーションのビデオシリーズを作成するために設計された、包括的な AI ビデオ生成ツールです。高度なAI技術により、ユーザーは高品質なビデオシリーズを素早く作成し、時間とコストを節約することができます。アニメーションのストーリー、映画の予告編、感動的なショートムービーなど、さまざまな動画を作成できます。

最新のAIリソース # AI画像から動画へ # AI動画生成ツール

2年前

0113.8K

Dify-WebUI：基于Dify API的桌面智能对话客户端，提供企业级AI对话能力

Dify-WebUI: Dify APIをベースとしたデスクトップインテリジェントダイアログクライアントで、エンタープライズグレードのAIダイアログ機能を提供します。

包括的な紹介 Dify-WebUIは、Dify APIに基づいた最新のデスクトップインテリジェント対話アプリケーションで、企業に強力なAI対話機能を提供するように設計されています。このアプリケーションは、企業の個々のニーズを満たすために、様々なプリセットテーマカラーをサポートし、ナレッジベース管理機能をサポートします。

2年前

0113.7K

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。

2年前

0113.6K

SP-MangaEditer：プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...

2年前

0113.6K

Wasitai：画像がAIによって生成されたかどうかをチェックするシンプルなツール。

はじめに Wasitaiは、AIによって生成された画像かどうかを簡単に検出できる強力で便利なツールです。画像生成分野におけるAIの進歩に伴い、テキストやスケッチ、その他の画像からリアルで高品質な画像を生成するためのツールやプラットフォームが数多く提供されている。しかし、すべての...

最新のAIリソース # AI画像生成エイド # AIオープンサービス

2年前

0113.3K

Anima：Figmaのデザイン・ドラフトをクリーンなフロント・エンド・コードに変える

概要 Animaは、デザイナーや開発者がデザインをコードに変換するのを支援するプラットフォームです。Figma、Adobe XD、Sketchのようなデザインツールから直接React、Vue、またはHTMLコードを生成し、フロントエンド開発を...

最新のAIリソース # AIページデザイン

1年前

0113.2K

キミ・リサーチャー - キミによるディープリサーチエージェントモデル

Kimi-Researcherは、Dark Side of the Moon社の子会社であるKimi社が開発した、エンドツーエンドの自律強化学習（エンドツーエンドのエージェントRL）技術で学習させた新世代のエージェントモデルで、深層研究タスク向けに設計されています。このモデルは自律的に...

最新のAIリソース

1年前

0113.1K

bilive：教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...

2年前

0113.1K

flowith：ライティングとイラストレーションを自動化するキャンバスオーケストレーションAIコンテンツ作成プラットフォーム

概論 FlowithはGPT-4を搭載したAI生産性ツールです。従来のチャットベースのAIツールとは異なり、ノードベースのAIオーサリングアプローチを提供することで、マルチスレッドで分散された方法でAIと対話し、簡単に作業することができます。

2年前

0113K