最新のAIリソース

共 2832 篇文章
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
7ヶ月前
040.1K
Heck.ai:免登录使用ChatGPT和DeepSeek

Heck.ai:ログインなしでChatGPTとDeepSeekにアクセス可能

一般的な紹介 Heck.aiは、ユーザーが登録なしで使用できる完全無料のオンラインChatGPT会話プラットフォームです。このプラットフォームは、多言語をサポートし、特に英語を話すユーザーのために最適化された便利なAI会話体験をユーザーに提供するように設計されています。
10ヶ月前
040.1K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章

Refly:記事自動生成のための無料キャンバス上のプロセスオーケストレーションに基づくAIライティングプラットフォーム

包括的な紹介 Reflyは、マルチスレッド対話、ナレッジベース統合、文脈記憶、インテリジェント検索技術を通じて、ユーザーがアイデアを高品質なコンテンツに変換できるように設計された、無料のキャンバスベースのAIネイティブオーサリングエンジンです。このプラットフォームは、学習...
10ヶ月前
040.1K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音

Hume AI: 感情認識でAIを強化する|音と表情から感情を認識する|感情のある音声を生成する

概論 ヒュームAIは感情知能に特化したAI企業で、人間の感情を理解し反応するマルチモーダルAI技術を開発している。同社の主力製品であるEmpathic Voice Interface(EVI)は、ユーザーの感情を認識し、それに応答することができる。
1年前
040K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。
12ヶ月前
040K
Mercor - AI招聘求职平台,匹配全球职位需求

メルカー - AI採用・求人検索プラットフォーム、グローバルな求人要件にマッチング

Mercorは、求職と採用のプロセスを合理化するグローバル採用のためのAI主導型プラットフォームです。求職者は履歴書をアップロードして20分間のAI面接を受けると、Mercorは世界中の企業から寄せられる何千もの求人依頼とユーザーの情報をマッチングし、リモートワークの機会を素早く見つけます。Mercorの主な特徴は...
6ヶ月前
040K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 視覚言語モデルの汎化能力のための低コスト強化学習

包括的な紹介 R1-Vは、低コストの強化学習(RL)を通して視覚言語モデリング(VLM)のブレークスルーを達成することを目的としたオープンソースプロジェクトです。このプロジェクトは、VLMが一般的な計数能力を学習する動機付けとなる、検証可能な報酬メカニズムを利用している。驚くべきことに、R1-Vの2B ...
10ヶ月前
040K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: シンプルなLLMモデルの微調整とデータ合成ツール!

包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxシステムをサポートする直感的なデスクトップアプリケーションを提供し、LLMのゼロコード実装を可能にします。
10ヶ月前
040K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: 実物理ベースの4Dダイナミックワールドシミュレーションのためのオープンソース生成物理エンジン

一般的な紹介 Genesisは、汎用ロボティクスと具現化AI学習のために設計された生成物理ワールドです。Genesisは、様々な材料や物理現象のシミュレーションをサポートする統一されたシミュレーション・プラットフォームを提供します。
11ヶ月前
040K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手

Highlight AI: 音声と画面分析を使ってデスクトップタスクをこなすAIアシスタント

概要 Highlight AIはWindowsおよびmacOS向けのデスクトップAIアシスタントで(モバイル版は開発中)、音声コマンドと画面コンテンツの分析を通じて、ユーザーがあらゆるアプリケーションでタスクを素早く完了できるよう支援する。画面のコンテンツをキャプチャし、生成します。
6ヶ月前
040K
Privatemode:提供端到端加密的AI聊天应用,保护企业数据隐私

Privatemode:企業データのプライバシーを保護するエンドツーエンドの暗号化を提供するAIチャットアプリ

一般的な紹介 Privatemode AIは、データプライバシーとセキュリティに焦点を当てたジェネレーティブAIサービスプラットフォームであり、ユーザーがプライバシー漏洩を恐れることなく機密データを処理できるように設計されています。データの送信、保存、処理中は、機密コンピューティング技術により常に暗号化されます。
9ヶ月前
040K
PosterGenerator:AI驱动的简易海报生成器,只需输入简单提示词,选择海报样式

PosterGenerator:AIによるシンプルなポスタージェネレーターで、簡単なプロンプトを入力し、ポスターのスタイルを選択するだけです!

概要 PosterGeneratorは、ユーザーが簡単にプロ級のポスターを作成できるように設計されたオンラインAIポスタージェネレータツールです。ビジネスのプロモーション、イベントの宣伝、個人的なプロジェクトなど、PosterGeneratorは簡単なテキスト入力でポスターを作成することができます。
1年前
040K
Kokoro:高效语音合成模型,生成自然流畅的语音

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、より少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0の下でライセンスされています。
11ヶ月前
040K
Dia:生成超现实多人对话的文本转语音模型

Dia:超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。
7ヶ月前
040K
Cloud Studio:云端 IDE,编写和运行各类依赖GPU的AI应用,每月免费50000小时GPU

Cloud Studio: GPUに依存するあらゆる種類のAIアプリケーションを作成して実行するためのクラウドIDE。

包括的な紹介 Cloud Studioは、Tencent Cloudが発表したブラウザベースの統合開発環境(IDE)で、開発者に安定した効率的なクラウドワークステーションを提供することを目的としています。ユーザーはソフトウェアをダウンロードしてインストールする必要がなく、ブラウザを開くだけでプログラミングができます。
10ヶ月前
040K
Speak:AI对话练习英语口说,提升语言能力

話す:AIダイアログで英語を口頭で話す練習をし、語学力を向上させる。

概要 Speakは、AIとの対話を通じて英語のスピーキングスキルを向上させることを目的とした革新的なAI英語学習アプリです。最先端のAI技術を駆使し、パーソナライズされたレッスンと即時フィードバックを提供することで、短期間で飛躍的な上達を目指します。
11ヶ月前
039.9K
glhf.chat:运行几乎(所有)开源大模型,免费使用GPU资源和API服务(测试期)

glhf.chat:ほとんど(すべて)のオープンソースのビッグモデルを実行し、GPUリソースとAPIサービスに無料でアクセスできる(ベータ期間)。

概要 good luck have fun (glhf.chat)は、オープンソースのビッグモデルチャットサービスを提供するウェブサイトです。このプラットフォームでは、vLLMとカスタムの自動スケーリングGPUスケジューラを使用して、ほとんどすべてのオープンソースのビッグモデルを実行することができます。ユーザは単に ...
1年前
039.9K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use:AIインテリジェントがブラウザを簡単に操作するためのインテリジェント・ウェブ・オートメーション・ツールの構築

包括的な紹介 Browser-Useは、言語モデル(LLM)がウェブサイトと自然に対話できるように特別に設計された、革新的なオープンソースのウェブ自動化ツールです。強力で柔軟なフレームワークを提供し、GPT-4、Claud...などの主流の言語モデルを幅広くサポートします。
11ヶ月前
039.9K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件

ハッピースクライブ:音声書き起こし・ビデオ字幕作成プラットフォーム|無料ビデオ字幕作成ソフト

ハッピースクライブ概要 ハッピースクライブは、高精度で音声をテキストに変換し、複数の言語とフォーマットをサポートする、自動および手動の音声書き起こしサービスを提供します。インタラクティブエディタ、コラボレーションツール、複数のエクスポートフォーマット、機械翻訳、その他の機能が含まれています。
1年前
039.9K
Zep:构建AI应用的长期记忆层,抽取并更新用户信息、业务数据

ゼップ:AIアプリケーション用の長期記憶レイヤーを構築し、ユーザー情報、ビジネスデータを抽出・更新する。

Zepは、AIアシスタントが継続的に学習し、ユーザーとのやり取りを記憶し、ユーザーのナレッジグラフを構築するのに役立ちます。Zepは、Python、TypeScrip...など、複数のプログラミング言語とフレームワークをサポートしています。
11ヶ月前
039.9K
ChatMCP:实现MCP协议的AI聊天客户端,支持多种LLM模型

ChatMCP: MCPプロトコルを実装し、複数のLLMモデルをサポートするAIチャットクライアント

ChatMCPの概要 ChatMCPはModel Context Protocol (MCP)を実装するために設計されたオープンソースのAIチャットクライアントです。GitHubユーザーのdaodao97によって開発されたこのプロジェクトは、O...のような様々な大規模言語モデル(LLM)をサポートしています。
12ヶ月前
039.9K
OpenArt Characters:创建一致性角色图像的AI工具

OpenArt Characters:一貫性のあるキャラクター画像を作成するためのAIツール

概要 OpenArt Charactersは、OpenArtプラットフォームが提供するキャラクターデザインに特化したAIツールで、一貫したルックを持つバーチャルキャラクターイメージを素早く作成できるように設計されています。コミック制作者、ゲーム開発者、個人...
9ヶ月前
039.9K
POE:整合主流文字、图像生成大模型的Bot集成平台

POE:大規模モデルを生成するために主流のテキストと画像を統合するボット統合プラットフォーム

POE一般紹介 POEは、様々なAIを搭載したボットに質問したり、即座に回答を得たり、会話をしたりすることができる、高速で便利なAIチャットプラットフォームです。ユーザーは、ChatGPT、GPT-4、Cla...などの複数のAIモデルとテキストを介してチャットすることができます。
1年前
039.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: YouTubeダウンローダー、YouTubeビデオを無料ダウンロード、音声抽出、字幕取得

概要 YTSageは、クリーンなPyQt6インターフェイスを備えたモダンなYouTubeダウンロードツールです。ユーザーはYTSageを使って、あらゆる画質の動画をダウンロードし、音声を抽出し、字幕を取得し(自動生成字幕を含む)、動画のメタ情報を表示することができます。
11ヶ月前
039.8K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所(OpenGVLab)によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。
7ヶ月前
039.8K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty:AIを搭載したコードエディターを体験しよう!

概論 Meltyは、チャットによる会話とGitによるバージョン管理を組み合わせた画期的なAIコードエディターである。ReplicateのCharlieとJacksonによって開発されたこのツールは、従来のAIコーディングツールのペインポイントを解決することを目指している。最大の特徴は...
11ヶ月前
039.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator:ウェブコンテンツをAIでRSSフィードに変換するツール

概要 AI RSSは、AI技術によりウェブコンテンツをRSSフィードに変換する革新的なツールです。ブラウザ・プラグインとサーバー・サイドの2つの主要部分から構成されています。ブラウザプラグインでは、ウェブページからリストを選択し、構造化データ記述(SDD)ファイルを生成することができます。
10ヶ月前
039.8K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces:AIワークフロー自動化、非技術者向けタスクスケジューリングツール、Zapier代替オープンソース

概要 Activepiecesは、企業や個人ユーザーに直感的で強力な自動化ソリューションを提供することに焦点を当てた、オープンソースのオールインワン自動化ワークフロープラットフォームです。TypeScriptで開発されたこのプラットフォームは非常にスケーラブルで、200以上の統合サービスをサポートしています。
11ヶ月前
039.8K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AIが本を読む:AIがPDFの本を1ページずつ読み、知識の要点を自動的に抽出し、要約を生成する。

包括的な紹介 AI-reads-books-page-by-pageはPythonベースのインテリジェントなPDFブック分析ツールで、PDFブックのページごとの分析を自動化し、重要な知識ポイントを抽出し、指定されたページ間隔の後にフェーズを生成します...
11ヶ月前
039.8K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE:歌詞を完全な曲のベースモデルに変換し、幅広い音楽スタイルをサポートします。

概要 YuEは、歌詞をフルソングに変換することに重点を置いた、オープンソースのフルソング生成ベースモデルです。ボーカル以外の短いスニペットしか生成しない他のモデルとは異なり、YuEはリードボーカルとバッキングボーカルを含む、長さ数分のフルソングを生成することができます。YuEは、歌詞から曲への変換に特化したモデルである。
10ヶ月前
039.8K
OpenEvidence - AI医学知识助手,解答临床问题、分析症状、推荐治疗方案

OpenEvidence - 臨床の質問に答え、症状を分析し、治療法を推奨するAI医療知識アシスタント

OpenEvidenceは、医師や医療従事者に正確な臨床サポートを提供するAI技術に基づいた医療知識アシスタントプラットフォームです。このプラットフォームは、小さな専門モデルとマルチモデル統合アーキテクチャに基づいており、臨床的な質問に対する迅速な回答、症状の分析、治療オプションの推奨、最新の医療知識の提供などを行います。
5ヶ月前
039.8K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)

ReadKidz:キャラクターの一貫した童話絵本を作成、豊富な絵本スタイルのテンプレート(有料)

一般的な紹介 ReadKidzは、人工知能技術を使用して、ユーザーがパーソナライズされた絵本やアニメーションを作成できるようにする革新的なプラットフォームです。ReadKidzを使えば、親御さんでも、先生でも、絵本作家を目指す方でも、高品質のストーリーコンテンツを簡単に作成することができます...
10ヶ月前
039.8K
Playground:免费使用的全功能AI绘画、图像编辑平台

Playground: 無料で使えるフル機能のAIペイント、画像編集プラットフォーム

Playgroundの概要 Playgroundは、Stable Diffusionモデルへのオンラインアクセスを提供する、無料のAI描画・編集プラットフォームです。ユーザーは、簡単な記述で画像を生成したり、二次拡散のために画像をアップロードすることができます...
6ヶ月前
039.8K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: Perplexity AIの機能とインターフェイスを1対1で再現したオープンソースのAI検索エンジン

概要 Perplexicaは、インターネットを深く掘り下げた答えを提供するために設計されたオープンソースのAI駆動型検索エンジンです。類似検索や埋め込み技術などの高度な機械学習アルゴリズムを使用し、検索結果を最適化し、引用元とともに明確な回答を提供します。
1年前
039.8K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1:自然言語による画像ターゲットの位置決定のための視覚言語モデル

包括的な紹介 VLM-R1は、Om AI Labによって開発され、GitHubでホストされているオープンソースの視覚言語モデリングプロジェクトです。このプロジェクトは、DeepSeekのR1アプローチとQwen2.5-VLモデルを強化学習によって組み合わせたものです。
9ヶ月前
039.8K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台

GeekAI: マルチモデルAPI運用バックエンドに完全にアクセス可能な商用多機能AIアシスタントのセルフデプロイメント

包括的な紹介 GeekAIは、AIビッグ言語モデルのAPI実装に基づくAIアシスタントのためのオープンソースソリューションのフルセットです。このプロジェクトは、ChatGPT、Azure、ChatGLM、Xunfei Starfire、Wenxin Yiyinおよび他の多くのp...と統合された運用管理バックエンドが付属しています。
1年前
039.7K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。

LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...
10ヶ月前
039.7K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論 透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...
10ヶ月前
039.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak:LLMの脆弱性を検出し、安全な生成AIを実現するオープンソースツール

包括的な紹介 NVIDIA Garakは、大規模言語モデル(LLM)の脆弱性を検出するために特別に設計されたオープンソースツールです。静的、動的、適応的なプロービングを通して、イリュージョン、データリーク、ヒントインジェクション、エラーメッセージ生成、有害コンテンツ生成などの複数の弱点がないかモデルをチェックします。
1年前
039.7K
Le Chat Mistral:MISTRAL打造智能聊天机器人,免费大语言模型

Le Chat Mistral: MISTRALはインテリジェントなチャットボット、無料の大規模言語モデルを構築する

概要 LE CHAT MISTRALは、フランスのMistral AI社による多言語対話アシスタント・プラットフォームです。このプラットフォームでは、Mistral AIのさまざまなモデルを体験し、教育的で楽しい方法で対話することができます。ユーザは、Mistral AIに従うことができます...
1年前
039.7K
SciSpace:一站式学术研究与论文写作平台,为学生和研究人员提供一体化 AI 工具

SciSpace:学生・研究者向けのAIツールを統合したワンストップの学術研究・論文作成プラットフォーム

概論 SciSpace(旧 Typeset.io)は、学術研究と執筆のために設計されたAI搭載のプラットフォームです。研究者や学生がより効率的に文献を探し、理解し、執筆するための豊富なツールとリソースを提供します。このプラットフォームは、文献管理、自動...
1年前
039.7K
Media.io:多功能在线媒体处理工具,在线视频、音频、图像编辑器

Media.io: 多機能オンラインメディア処理ツール、オンラインビデオ、オーディオ、画像エディタ

概論 Media.ioは強力なオンラインAIビデオ編集とメディアファイル処理プラットフォームです。Media.ioは、ビデオ、オーディオ、ピクチャの強化、変換、圧縮などの機能を提供します。基本的な編集機能に加え、動画の漫画化、AIソングカバーの生成、オーディオデスクトップなどの機能もあります。
8ヶ月前
039.7K
AnythingLLM:使用AI与文档智能对话,自定义多种智能体,完全本地化客户端。

AnythingLLM:AIを使ってドキュメントとインテリジェントに会話し、複数のインテリジェンスをカスタマイズし、クライアントを完全にローカライズする。

一般的な紹介 AnythingLLMはMintplex Labsによって開発されたオープンソースのAIアプリケーションです。このアプリは、様々な大規模言語モデル(LLM)とベクトルデータをサポートしています。
1年前
039.7K
Llamao:手机上运行离线且私密的AI聊天机器人

Llamao:携帯電話上でオフラインかつプライベートで動作するAIチャットボット

一般的な紹介 Llamaoは、インターネットに接続せずにインテリジェントなアシスタントサービスをユーザーに提供するために設計された、プライベートでオフラインで動作するLlama AIチャットボットです。ChatGPTとは異なり、Llamaoは完全にユーザーのデバイス上で動作し、ユーザーデータの絶対的なプライバシーとセキュリティを保証します。いいえ...
10ヶ月前
039.7K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot:ニュースプッシュ、AI対話、グループチャット管理のためのWeChatボット

包括的な紹介 NGCBotはWeChatロボットオープンソースプロジェクトの開発に基づくHOOKメカニズムであり、開発者ngc660sec(Yunshan/eXM)によって作成され、GitHub上でホストされている 反復の2年後、V2.3の現在のバージョンは、最初のシンプルな機能から...
9ヶ月前
039.7K
Anatomy 360:3D人体艺术参考图

アナトミー360:3Dボディアート・リファレンス・チャート

概要 Anatomy 360は、アーティストやクリエーターに高品質な3D人体解剖リファレンスモデルを提供するプラットフォームです。全身3Dスキャン、フルライティングコントロール、ドローイングツール、ダイナミックスケッチモードを提供します。ユーザーはモデルをあらゆる角度から見ることができ、テクスチャ付きモデルとそうでないモデルを切り替えることができます。
1年前
039.7K
Fitten Code:集成到VS Code提升编程效率的AI助手,非十大模型支持

Fitten Code:プログラミング効率を向上させるためにVS Codeに統合されたAIアシスタント。

概要 フィッテンコードは、フィッテンLLMモデルによるAIプログラミングアシスタントで、自動コード生成、コード補完、デバッグ機能により、開発者のプログラミング生産性を大幅に向上させるように設計されています。このツールは80以上のプログラミング言語をサポートしています。
1年前
039.7K
Akool:生成图像和视频营销素材|视频换脸|视频翻译|人像说话

Akool:画像・動画マーケティング素材作成|動画顔交換|動画翻訳|似顔絵会話

一般的な紹介 アクールは、パーソナライズされたビジュアル・マーケティングと広告に焦点を当てている。高度なAI技術により、ユーザーは広告、オンライン教育、アート制作、Eコマースなど幅広い分野で、高品質でパーソナライズされたビデオコンテンツを簡単に作成することができます。 AKOOLは、顔変換機能を提供します。
1年前
039.7K
Data Formulator:AI驱动的数据可视化工具

Data Formulator:AIによるデータ可視化ツール

概論 Data Formulator は Microsoft Research によって開発されたオープンソースのAI駆動型データ可視化ツールである。このツールは、グラフィカル・ユーザー・インターフェース (GUI) と自然言語入力 (NL) を組み合わせたもので、ユーザーは簡単なインタラクションやコマンドによって、素早くデータを作成し、反復することができます。
10ヶ月前
039.7K
Edraw.AI(亿图):在线协作白板工具,AI生成流程图和多种图表

Edraw.AI:オンライン共同ホワイトボードツール、AIが生成するフローチャートと複数のダイアグラム

包括的な紹介 Edraw.AIは、40以上のインテリジェントツールと入念にデザインされたテンプレートライブラリを統合した、AIを搭載した画期的なオンラインビジュアルホワイトボードコラボレーションプラットフォームです。Edraw.AIは、高度なAI技術を駆使し、ユーザーのテキストによる思考を素早くプロフェッショナルなビジュアル図に変換します。このプラットフォームは...
11ヶ月前
039.7K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator:オープンソースのロゴジェネレーター、AIインテリジェンスを使用してプロフェッショナルなブランドロゴを生成します。

一般的な紹介 LogoCreatorは、Together AIとFluxモデルに基づいたオープンソースのロゴ・ジェネレーターで、企業や個人に迅速でプロフェッショナルなロゴ・デザイン・サービスを提供することに焦点を当てています。このプロジェクトは、開発者Nutlopeによって開発され、Gitでオープンソース化されています...
11ヶ月前
039.6K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: 効率的な数学的推論とコード生成のための小さなオープンソースモデル

一般的な紹介 MiMoはXiaomiによって開発されたオープンソースの大規模言語モデリングプロジェクトであり、数学的推論とコード生成に焦点を当てている。コアプロダクトはMiMo-7Bファミリーのモデルで、ベースモデル(Base)、教師あり微調整モデル(SFT)、ベースモデルから学習された強力な化学モデル(Strong Chemical)を含んでいます。
7ヶ月前
039.6K
Warp:内置人工智能和开发团队知识的终端命令行工具

Warp:AIと開発チームの知識を内蔵したターミナルのコマンドラインツール

Warpは、開発者の生産性を向上させるために設計された、モダンでインテリジェントなターミナルツールです。人工知能とチームの知識を組み合わせ、自動補完コマンド、スマートサジェスト、複数のカスタム設定をサポートする統合開発環境(IDE)ライクな入力エディタを提供します。
11ヶ月前
039.6K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...
10ヶ月前
039.6K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。
9ヶ月前
039.6K
Elmo:快速总结网页、PDF和视频的浏览器插件

Elmo: ウェブページ、PDF、ビデオを素早く要約するブラウザ・プラグイン

一般的な紹介 Elmo ChatはLepton AIチームによって開発されたAIブラウザプラグインで、ユーザーのオンラインブラウジングやリサーチの効率を向上させます。このプラグインは、そのすっきりとしたデザインと強力な機能でユーザーから支持されています。
8ヶ月前
039.5K
实时语音转文字的开源工具

リアルタイム音声テキスト化のためのオープンソースツール

概要 realtime-transcription-fastrtcは、音声をリアルタイムでテキストに変換することに特化したオープンソースプロジェクトです。FastRTC技術を使って低遅延の音声ストリームを処理し、ローカルのWhisperモデルと組み合わせて効率的なテキスト変換を実現します。
8ヶ月前
039.5K
阿布量化交易系统:基于Python的开源量化交易平台

アブ・クオンツ取引システム:Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなどの様々な金融商品のバックテストと取引をサポートしています。これは...
8ヶ月前
039.5K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル(LLM)を微調整するために特別に設計されたオープンソースツールで、GitHubでホストされています。ファイルのアップロード、コンテンツの自動セグメント化、質問と回答の生成、そして最終的に適切なLLMの出力を可能にする、使いやすいインターフェースを提供します。
8ヶ月前
039.5K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)

Heeyo:子供たちの学習体験を向上させる知的AIパートナー、子供たちに寄り添うAIコンパニオン(有料)

概要説明 Heeyoは、3歳から11歳のお子様を対象に、インタラクティブなゲームや会話を通じて学習体験を高めるために設計されたAIアプリです。ハーバード大学とスタンフォード大学の教育専門家によって設計されたHeeyoは、数学、科学、社会的情操スキルをカバーする2000以上の学習ゲームを提供しています。子供...
11ヶ月前
039.5K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

オートディープリサーチ:マルチエージェント連携による文献検索と研究報告書の作成

概説 Auto-Deep-Researchは、香港大学データインテリジェンス研究所(HKUDS)によって開発されたオープンソースのAIツールであり、ユーザーがディープリサーチタスクを自動化することを目的としている。AutoAgentフレームワークをベースに構築されており、複数の大規模言語モデルをサポートしている。
8ヶ月前
039.5K
Vocal Remover:AI驱动的免费在线人声分离工具

ボーカルリムーバー:AI駆動の無料オンラインボーカルセパレーションツール

概要 Vocal Removerは、人工知能技術に基づいて設計されたオンラインツールで、ユーザーが音楽からボーカルと楽器を分離するのに役立ちます。ユーザーはオーディオファイルをアップロードするだけで、システムは自動的に処理し、カラオケバージョン(無伴奏)とアカペラバージョン(純粋なボーカル)を生成します。この ...
1年前
039.5K
AutoGen:微软开发的多智能体对话框架

オートジェン:マイクロソフトが開発したマルチインテリジェントな身体対話フレームワーク

概要 AutoGenは、マイクロソフト社の研究者チームによって開発されたオープンソースのフレームワークであり、多知能体の対話を通じて大規模言語モデル(LLM)アプリケーションの構築を簡素化することを目的としている。このフレームワークにより、開発者は互いに対話し、協力してタスクを解決するAIエージェントを作成することができる。このアプローチは、LLMのパフォーマンスを向上させるだけでなく...
10ヶ月前
039.5K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: オープンソースの無制限キャンバス・ホワイトボードSDK、最小限のワイヤーフレームとUMLダイアグラムを生成するAI

一般的な説明 tldraw は、ユーザーが素早くグラフィックを描いたり、テキストを書き込んだり、即座に共同作業ができる無制限のキャンバスを提供する、無料で即座に共同作業ができるドローツールです。直感的なインターフェースと優れたパフォーマンスが特徴で、チームコラボレーションやリモートワークに適しています。オープンソースコミュニティを通じてサポートされているtldr...
1年前
039.4K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Meta AIの次世代自己教師付き視覚ベースモデル

DINOv3は、Meta AIが開発した次世代の自己教師付き視覚ベースモデルであり、自己教師付き学習パラダイムを使用して、ラベル付けデータなしで画像の特徴を学習する。データ準備の改善とGramアンカリングの導入により、特徴量の劣化問題を解決し、汎化能力を向上させている。
4ヶ月前
039.4K
AiPPT:全智能AI一键生成PPT|在线PPT制作|智能PPT工具(付费)

AiPPT:フルインテリジェンスAIワンクリックPPTジェネレーション|オンラインPPTメーカー|インテリジェントPPTツール(有料)

包括的な紹介 AiPPTは、人工知能技術に基づくオンラインPPT生成ツールです。AiPPTは、豊富なテンプレートリソースを提供し、インポートするさまざまなドキュメント形式をサポートし、迅速にニーズに沿ったプロフェッショナルを生成することができます。
11ヶ月前
039.4K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NVインジェスト:複雑なフォーマットのドキュメントを解析し、マルチモーダルデータをメタデータとテキストに抽出する。

包括的な紹介 NV Ingest (NVIDIA Ingest)は、何十万もの複雑で厄介な非構造化PDFやその他の企業ドキュメントを解析するために設計された、早期アクセス可能なマイクロサービス群です。これらのドキュメントをメタデータとテキストに変換し、検索に埋め込むことができます...
11ヶ月前
039.4K
Slidesgo:免费PPT模板下载,辅助AI生成演示文稿,提供教育版工具

Slidesgo:ダウンロード無料のPPTテンプレート、プレゼンテーションを生成するためにAIを支援し、ツールの教育版を提供する。

一般的な紹介 Slidesgoは、無料でカスタマイズ可能なGoogleスライドとPowerPointプレゼンテーションのテンプレートを多数提供するプラットフォームです。ユーザーは、ビジネス、教育、医療トピックなどのニーズに応じて、異なるスタイルや色のテンプレートを選択することができます。このサイトでは、アイコン、文字...
1年前
039.3K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
7ヶ月前
039.3K
HIX.AI:全能AI写作助手,从日常写作、营销文案到学术论文

HIX.AI:日常文書、マーケティングコピーから学術論文まで、オールラウンドなAIライティングアシスタント

概論 HIX.AIは強力なオールインワンAIライティングアシスタントで、120以上のAIツールを提供することにより、ユーザーのライティング、コミュニケーション、生産性を向上させるように設計されています。このプラットフォームはGPT-3.5/4によって駆動され、ユーザが素早く文章を作成できるように多言語をサポートしています。
1年前
039.3K
Harvey:法律行业处理合同分析与研究案例

ハーヴェイ:契約分析・調査事例を扱う法律業界

概論 Harveyは、弁護士やプロフェッショナル・サービス組織の生産性向上を支援するために、法律業界向けに構築されたAIプラットフォームである。契約分析、デューデリジェンス、リーガルリサーチ、文書作成などの複雑な法務タスクを処理できる強力なジェネレーティブAIテクノロジーをベースにしています。
9ヶ月前
039.3K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースにした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Wh...
1年前
039.3K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑

FreeTTS:無料オンライン音声合成ツール|オーディオエンハンスメント|オーディオクリップ

FreeTTS 概要 FreeTTSは、テキストを自然な音声ファイルに変換できる無料のオンライン音声合成ツールです。複数の言語とサウンドオプションをサポートし、ユーザーはテキストをMP3、WAV、OGG、ACC形式に変換することができます...
1年前
039.3K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: 複数言語とアクセントをサポートするリアルタイム音声対話フレームワーク。

はじめに Moshi Chatは、フランスの非営利AI研究所Kyutaiが開発したエンドツーエンドのリアルタイムAI音声アシスタントです。リアルタイムで話を聞くだけでなく、自然な会話を行い、見る、聞く、話すといったマルチモーダルなインタラクションをサポートします。
1年前
039.3K
MOKI:美图公司AI短片创作工具,适合动画短片, 网文短剧, 儿童故事绘本

MOKI:MeituのAIショートフィルム作成ツールで、ショートアニメ、ショートウェブシリーズ、童話、絵本に対応。

総合紹介 MOKIはMeituが発表したAIショートフィルム制作ツールで、ユーザーに便利で効率的なショートフィルム制作体験を提供することに重点を置いている。このツールは、ショートアニメ、オンラインショートドラマ、ストーリー絵本、MVなど、幅広い動画コンテンツ制作に対応しています。ユーザーはストーリーのあらすじを入力したり、既存のショートムービーをインポートしたりすることができる。
1年前
039.3K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Kolorsバーチャル試着:効率的なバーチャル試着/モデル着せ替え、テキストから画像生成モデル

概要 Kolors Virtual Try-Onは、Kwai-KolorsチームによるHugging Faceプラットフォーム上のバーチャル試着アプリです。このアプリは、高度な人工知能技術を使って、ユーザーがバーチャル試着をするのを手助けします。
11ヶ月前
039.2K
Chance AI:通过AI技术实现图像识别与视觉故事讲述

チャンスAI:AI技術による画像認識とビジュアル・ストーリーテリング

はじめに Chance AIは、ビジュアル・インテリジェンス技術に特化した革新的な企業であり、人工知能によるユニークな画像認識とビジュアル・ストーリーテリング体験を提供することに専念している。主力製品である「Chance AI Lens」は、AIを活用したビジュアル検索ツールです。
9ヶ月前
039.2K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI:マルチモーダルAIサービスを統合した商用ウェブアプリケーション(無料オープンソース)

包括的な紹介 99AIはオープンソースのAIウェブアプリケーションプロジェクトで、導入が容易で敷居の低い統合AIサービスプラットフォームを提供することを目的としています。このプロジェクトは、インテリジェントな対話、マルチモーダルモデル、アプリケーションプラザ、ネットワーク検索をサポートし、AI絵画、音楽、ビデオを統合します。
1年前
039.2K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D(Hunyuan3D):高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー

包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。
10ヶ月前
039.2K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall:大規模モデルのためのエンタープライズクラスのメモリフレームワークを提供するオープンソースツール

包括的な紹介 Deep Recallは、大規模言語モデル(LLM)のために設計されたオープンソースのエンタープライズクラスのメモリフレームワークです。効率的な文脈検索と統合により、超パーソナライズされた応答性を提供します。このフレームワークは、メモリサービス、推論サービス、コーディネータを含む3層アーキテクチャを採用しており、...
7ヶ月前
039.2K
QAnything:高度集成RAG处理流程的本地知识库问答系统

QAnything: RAG処理フローを高度に統合したローカル知識ベースQ&Aシステム

QAnything Comprehensive Introduction QAnything(Question and Answer based on Anything)は、NetEaseが発表したローカル知識ベースのQ&Aシステムで、あらゆる種類のファイル形式とデータベースをサポートし、オフラインでインストールして使用することができる。
1年前
039.1K
Zion(Momen):无代码开发平台,快速搭建个性化AI应用/SaaS应用,支持多端发布绑定自己的域名

Zion (Momen): パーソナライズされたAIアプリ/SaaSアプリを素早く構築するためのノーコード開発プラットフォーム。

総合紹介 Zionは強力なノーコード開発プラットフォームで、ユーザーはコードを書く必要がなく、ウェブサイト、WeChatアプレットなどのアプリケーションを迅速に構築することができます。このプラットフォームは、アプリケーションの開発から、オンラインでの展開、運用とメンテナンスの成長まで、完全な視覚的操作を提供し、大幅に開発の敷居を下げます。Zionは広くビジネスシナリオをカバー...
1年前
039.1K
PhotoPrism:AI 驱动的去中心化照片管理应用,轻松管理和查找照片

PhotoPrism:写真を簡単に管理・検索できるAI搭載の分散型写真管理アプリ

一般的な説明 PhotoPrismは、ユーザーに分散型の写真保存・管理ソリューションを提供するために設計された、AIを搭載したオープンソースの写真管理アプリです。最新のテクノロジーを駆使して自動的に画像にタグ付けし、自宅やプライベートサーバー、クラウドでの運用をサポートします。
1年前
039.1K