AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis:AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。
1年前
063.2K
自动解析PDF内容并提取文字与表格的开源服务

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。
1年前
062.8K
AI-Scientist-v2:自主完成科研研究与论文撰写

AI-Scientist-v2:自律的な科学研究と論文執筆

概論 AI-Scientist-v2は、日本のサカナアイ社によって開発された知的システムであり、科学研究を最初から最後まで機械によって自動化することを目的としている。研究のアイデアを思いつき、実験を設計し、コードを実行し、データを分析し、最終的に科学論文を書くことができる。
1年前
096.2K
Kozy:用文字描述快速剪辑短视频的在线工具

Kozy:短い動画をテキスト説明付きで素早く編集できるオンラインツール

Kozyは、テキスト説明付きの短い動画を素早く編集するためのツールです。その核心は、ユーザーが「面白いペットのビデオをカットする」といった簡単な口頭入力で、プロ並みのショートビデオを数秒で生成できることだ。Tunde Alaoによって開発されたこのサイトは、2025...
1年前
063.8K
Internet.io:聚合多AI模型答案的智能工作平台

Internet.io:複数のAIモデルからの回答を集約する知的作業プラットフォーム

はじめに Internet.ioは、複数のトップAIモデルの回答を集約するインテリジェント・プラットフォームである。単一のAIの回答が不正確であったり、一貫性がないという問題を解決することを目的としています。ユーザーは一つの質問をすると、複数のトップAIモデルから同時に回答を得ることができ、簡単に比較することができる。
1年前
060.4K
Exponent:在任何环境中执行自动化编程任务

Exponent: あらゆる環境でプログラミング作業を自動化

一般的な紹介 Exponentは、コードの探索から最終的なデプロイまで、あらゆるソフトウェアエンジニアリングのタスクでユーザーと協力するように設計された強力なAIプログラミングエージェントです。ローカル開発環境、端末操作、または継続的インテグレーション(CI)プロセスで実行することができ、ユーザーを様々な...
12ヶ月前
051.3K
Recall:浏览网页时显示个人知识库相关信息

リコール:ウェブ閲覧時に個人的な知識ベースに関する情報を表示する

Comprehensive Introduction Recallは、ウェブページ、ビデオ、PDFなどを素早く要約し、個人の知識ベースに保存することで、ブラウジング体験を向上させる人工知能ツールです。中心的な機能は、ブラウジング中に関連情報をリアルタイムで表示し、断片的なコンテンツを順序付けられた知識ネットワークに整理することを支援することです。構成は ...
1年前
058.8K
Dolphin:面向亚洲语言识别与语音转文本模型

ドルフィン:アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。
1年前
065.5K
魔法打败魔法:用正反示例过朱雀AI检测的提示词

マジックはマジックを打ち負かす:ジュビリー合格のためのヒント・ワード 前後例によるAI検出

Jubileeの大規模なモデルのAIコンテンツ検出を突破しようとして以来、技術記事は、 "洗濯 "プロンプトワードをリリースしました。JubileeのAI検出で "人工的な "と識別された上記の2つの割合は高くありません。 その理由は非常に簡単で、前提の元の構造と情報内容を破壊することなく記事を書き換えることで、基本的にAIの上で行うことは困難である。
12ヶ月前
076.9K
WeClone:用微信聊天记录和语音训练数字分身

WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。
1年前
075.7K
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: MCPプロトコルに基づいたクリーンなAIチャットインターフェース

包括的な紹介 mcp-uiは、開発者machaojin1917939763によって作成されたオープンソースプロジェクトであり、構築するためのモデルコンテキストプロトコル(MCP)プロトコルに基づき、Webおよびデスクトップ環境のためのサポートです スマート ...
1年前
068.1K
专属“AI 伙伴”:微软 Copilot 发布记忆、行动等多项重要新功能

専用「AIパートナー」:マイクロソフト・コパイロットがメモリ、アクション、その他の重要な新機能をリリース

マイクロソフトは、AIアシスタント「Copilot」の一連の重要なアップデートを発表し、パーソナライゼーションとタスク実行の強化を通じて、汎用AIツールからユーザーに寄り添う「パーソナルAIパートナー」への転換を目指す。マイクロソフトのAI責任者であるMust...
1年前
053.2K
KOAH:为AI应用提供原生广告解决方案

KOAH: AIアプリケーション向けネイティブ広告ソリューション

KOAHは、AIアプリケーションの広告ソリューションを提供することを目的としたウェブサイトです。Koah Labs, Inc.によって開発され、カリフォルニア州サンフランシスコに拠点を置いています。このサイトの主な目的は、AIアプリの開発者がネイティブ広告を埋め込むことで収益を上げられるようにすることであり、同時にユーザー体験が...
1年前
062K
Shamaze:用自己的声音给孩子讲睡前故事

Shamaze: 自分の声で読む子供のためのベッドタイム・ストーリー

一般的な紹介 Shamazeは、親が子供のためにパーソナライズされた就寝前の物語を作るのを手助けするウェブサイトである。人工知能技術を使って、子供の興味に基づいたユニークなストーリーを生成し、また親の声を真似てストーリーを読み上げる。親はテーマと登場人物を設定するだけで、Shamaze ...
1年前
060.6K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム

概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。
1年前
078.2K
GTR 框架:基于异构图和分层检索的跨表问答新方法

GTRフレームワーク:異種グラフと階層検索に基づくクロステーブルQ&Aの新しいアプローチ

1.はじめに 今日の情報爆発では、大量の知識がウェブページ、ウィキペディア、リレーショナ ルデータベースのテーブルの形で保存されている。しかし、従来の質問応答システムは、複数のテーブルにまたがる複雑なクエリを処理するのに苦労することが多く、人工知能の分野では大きな課題となっている。この課題に対処するため、研究者たちは...
1年前
050.9K
文生图提示词扩展框架:提升 AI 图像生成效果

ヴァンセンヌのキューワードを拡張するフレームワーク:AI画像生成の改善

近年、さまざまなTTI(Text-to-Image)AI技術が急速に発展している。しかし、初心者からプロのクリエイターまで、これらのツールを活用する際にしばしば直面するのが、頭の中にあるクリエイティブなビジョンを、明確であれ曖昧であれ、いかに洗練されたものに変換するかという課題だ。
1年前
068.3K
AmyMind:一句话生成思维导图并导出多种格式

AmyMind: 一文でマインドマップを作成し、複数のフォーマットで書き出す

一般的な紹介 AmyMindは、主にAI技術を使って素早くマインドマップを作成できる無料のオンラインツールである。使い方は簡単で、ソフトウェアのインストールは必要なく、ブラウザで開くと動作する。ユーザーはテキストを入力したり、Markdown、PDF、Wor...
1年前
081.7K
结合 AI 的网页内容捕捉工具——Obsidian Web Clipper

AI搭載ウェブコンテンツキャプチャツール - Obsidian Web Clipper

ウェブコンテンツを効果的に取り込み、整理し、活用することは、デジタル情報がますます豊かになる今日、重要なスキルとなっている。Notion、Instapaper、Readwiseなどのツールを試したことがあるユーザーの多くは、不完全なコンテンツの取り込み、不便な検索管理...に遭遇するかもしれない。
1年前
085.6K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ワンクリックで翻訳とダビングができる動画用多言語グローバル化ツール

包括的な紹介 KrillinAIは、ユーザーがビデオを翻訳し、自動的にそれらをダビングするために人工知能を使用することに焦点を当てたオープンソースのビデオ処理ツールです。ビデオのダウンロードから始まり、様々なプラットフォームに適応した完成品の生成まで、全てのプロセスは数クリックで完了します。開発者はGitHubで公開されている。
12ヶ月前
098K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark:多フォーマット文書のインテリジェント翻訳のためのオープンソースツール

一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式(PDF、Word、TXT、Markdo...など)をサポートしています。
1年前
053.7K
Headshotly:快速生成职业装头像的AI工具

Headshotly:プロのヘッドショットを素早く作成するAIツール

一般的な紹介 Headshotlyは、AI技術を使ってプロフェッショナルなヘッドショットを素早く生成するオンラインツールである。ユーザーが普通の自撮り写真を数枚アップロードするだけで、AIがそれを処理し、高品質のプロフェッショナルなヘッドショットを生成する。このウェブサイトは、シンプルな操作と効率的なエクスペリエンスに重点を置いています。
1年前
060.5K
Ogilvy:辅助创作高转化文案的AI写作编辑器

オグルヴィ:高コンバージョンのコピー作成を支援するAIライティング・エディター

一般的な紹介 Ogilvy(オグルヴィ)は、広告の第一人者であるDavid Ogilvy(デビッド・オグルヴィ)にインスパイアされた、高コンバージョンのコピーを作成するために設計されたテキストエディタです。あなたの代わりに書くのではなく、むしろあなたのアシスタントとして、白紙のページ上でコピーの下書きを完成させる手助けをします。このコピーの中核となるゴールは、「コピーライターが、あなたの代わりに文章を書く」ことではありません。
1年前
056.8K
CloneMyTrips:从社交媒体克隆旅行计划的AI工具

CloneMyTrips:ソーシャルメディアから旅行プランをクローンするAIツール

概要 CloneMyTripsは、AI技術によりソーシャルメディア上の旅行コンテンツからインスピレーションと旅程を抽出することを支援する機能を中核とする革新的な旅行計画サイトである。ユーザーがお気に入りの旅行に関する短い動画や投稿を簡単に共有でき、パーソナライズされた旅行プランを自動的に生成します。
1年前
055.6K
Zola:支持文档上传与多模型的开源AI聊天Web应用

Zola:ドキュメントのアップロードとマルチモデルをサポートするオープンソースのAIチャット・ウェブアプリ

一般的な紹介 Zolaは、開発者のJulien Thibeaut(GitHubユーザー名ibelick)によって開発され、GitHubでホストされているフリーでオープンソースのAIチャットアプリである。最大の特徴は、複数のAIモードをサポートしていることです。
1年前
075.4K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher:複雑な問題を研究する強化学習ベースのドライビングAI

包括的な紹介 DeepResearcherは、上海交通大学のGAIR-NLPチームによって開発されたオープンソースプロジェクトです。強化学習(RL)によって実際のウェブ環境でエンドツーエンドで学習された大規模言語モデル(LLM)に基づくインテリジェントな研究ツールです。プロジェクト...
1年前
058.9K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: 言語コマンドでアニメ動画とキャラクターのインタラクションを生成するオープンソースツール

AnimeGamerはテンセントのARC Labが開発したオープンソースツール。ユーザーは、「宗介が紫の車でドライブする」といった簡単な言語コマンドでアニメ動画を生成したり、「魔法少女の冒険」のキキや「スカイシティ」...といった異なるアニメキャラクターを相互作用させたりすることができる。
1年前
067.1K
使用扣子即梦3.0模型方便的生成文章配图和中文海报

Button i.e. Dream 3.0モデルを使って、記事グラフィックや中国語ポスターを簡単に作成できる。

その夢が提供する3.0画像生成モデル枠は常に十分ではなく、今日のストレートテストは使い切ることはありません。また、その夢を直接記事の表紙を生成する日常的な使用もやや不便である。 そこで、その夢の3.0画像モデル(標準名はseedream3.0...)を参考にバックルを使うことを考えた。
1年前
068.3K
Agent S:像人类一样操作电脑的开源智能体框架

エージェントS:人間のようにコンピュータを操作する知的体のためのオープンソース・フレームワーク

一般的な紹介 エージェントSは、Simular AI社によって開発されたオープンソースのフレームワークであり、グラフィカル・ユーザー・インターフェース(GUI)を通じて人間のようにコンピュータを操作することができる。マルチモーダル大規模言語モデルと経験的学習技術を使用して、ウェブの閲覧、文書の編集、ソフトウェアの使用などのタスクを実行する。
1年前
099.6K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...
1年前
060.3K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: PollinationsパッケージをベースにしたフリーのAIツール。

概要 FreeAIは、Pollinations.AI APIをベースとしたオープンソースのAIアプリケーションプラットフォームで、無料で無制限のAIチャットアシスタント、画像生成、音声合成サービスを提供している。このプロジェクトは、開発者のAzad-slによってG...
1年前
081.3K
如何让小红书封面更加吸引眼球

リトル・レッド・ブックの表紙をより人目を引くものにする方法

黒板の前で講義をしているピチピチのプロフェッショナルな服(OLスタイル)を着た女性教師の写真を生成し、全体はただ黒板と女性教師が必要で、女性教師は25歳くらいで、メガネをかけていて、セクシーな体つきをしていて、アジアの美学に沿ったルックスで、現実的なスタイルである必要があり、黒板には「よく勉強し、毎日...」と書かれている。
1年前
060.4K
ChatLLM:支持多种AI模型的智能聊天工具

ChatLLM:複数のAIモデルをサポートするインテリジェントチャットツール

概要 ChatLLMは、Abacus.AIによって開発されたインテリジェントなチャットツールです。GPT-4o、Gemini、Grokなど、様々なトップクラスの言語モデルを統合しており、ユーザーは1つのプラットフォームを通して様々なAI機能を体験することができます。いいえ...
1年前
098.9K
Motionvid.ai:用文字或草图快速生成演示动画视频

Motionvid.ai:テキストやスケッチからプレゼンテーション用のアニメーションビデオを素早く生成

一般的な紹介 Motionvid.aiは人工知能を使用して、ユーザーが素早くプロフェッショナルなアニメーションビデオを作成できるオンラインツールです。このツールの最大の特徴は、テキストの説明や手描きのスケッチを使って、滑らかなダイナミクスと高品質の視覚効果を持つアニメーションを数秒で生成することです。ユーザーは複雑な操作をマスターする必要はありません。
1年前
059.9K
Viva Labs:用AI快速生成高转化率视频广告

ビバラボ:AIで高コンバージョンの動画広告を素早く生成

はじめに ビバラボは、AI技術を利用して、コンバージョンの高い動画広告を素早く作成できるオンラインツールです。ユーザーは製品URLを提供するだけで、AIがターゲットオーディエンスを調査し、リアルなAIアバターと多言語ナレーションを備えたプロフェッショナルな広告スクリプトを生成し、自動化することができます。
1年前
055.6K
Langflow Desktop:Langflow桌面版客户端下载

Langflow Desktop: Langflowデスクトップクライアントのダウンロード

概論 Langflow Desktopは、開発者がAIインテリジェンスやアプリケーションを素早く構築するためのデスクトップツールです。Langflowチームによって開発され、ドラッグ&ドロップで複雑なワークフローを設計できる直感的なインターフェースを提供します。主な機能
1年前
063.2K
AutonomyAI:将Figma设计转化为干净的React代码

AutonomyAI: FigmaのデザインをクリーンなReactコードに変換する

AutonomyAIは、人工知能を使ってフロントエンド開発の効率を向上させるオンラインツールです。AutonomyAIは、"コンテキストを認識するエージェント "技術を使って、開発者がデザインを制作可能なフロントエンドコードに変換するのを支援することを主な目的とするチームによって開発された。このサイトのメインプロダクトであるThe M...
1年前
064.2K
Waxwing:AI与真实专家协作完成营销内容创作的服务平台

Waxwing: マーケティング・コンテンツ制作においてAIが本物のエキスパートと協業するためのサービス・プラットフォーム

Waxwing 2.0は、AIと人間の専門家を組み合わせたタスク・サービス・プラットフォームである。米国デラウェア州ウィルミントンに本社を置くWaxwing AI Ltd.によって開発され、「人間+AI」モデルに焦点を当てている。このプラットフォームは、専門家が設計した500以上のAIタスクを提供している。
1年前
051.9K
OpenAvatarChat:模块化设计的数字人对话工具

OpenAvatarChat:モジュール設計されたデジタル人間対話ツール

概論 OpenAvatarChatはHumanAIGC-Engineeringチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。モジュール式のデジタル人間対話ツールで、1台のPCで動作させることができます...
1年前
080.9K
Supaboard:自动生成数据可视化图表的智能分析工具

Supaboard: データ可視化チャートとグラフを自動生成するインテリジェントな分析ツール

概要 Supaboardは、複雑なデータを直感的なダッシュボードやチャートに素早く変換できるように設計された、AIベースのデータ分析プラットフォームです。簡単な操作で複数のデータソースに接続し、ユーザーはコードを書くことなく、自然言語で質問するだけでデータインサイトを生成することができます...
1年前
070.2K
DeepSite:使用DeepSeek V3免费生成实时预览的前端网页

DeepSite: DeepSeek V3を使用したリアルタイムのプレビューによる無料のフロントエンドWebページの生成

一般的な紹介 DeepSiteはAIベースのウェブサイト生成ツールで、ユーザーは簡単なテキスト説明を入力するだけで、ライブで実行可能なフロントエンドのウェブページを素早く生成することができます。Hugging Faceのコミュニティメンバーであるenzostvsによって開発され、DeepSiteは...
1年前
0119.6K
Serena:语义检索和编辑代码的免费MCP工具

Serena: 意味検索とコード編集のためのフリーMCPツール

概要 Serenaは、Oraios AIチームによって開発され、GitHubでホストされているフリーでオープンソースのプログラミングツールです。コードベースで直接動作する強力なコードアシスタントで、開発者のコードの分析、編集、実行を支援します。
1年前
0194.5K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl:ポートレートをジブリ風に変身させる無料ツール

概要 EasyControlはオープンソースプロジェクトであり、効率的で柔軟な画像生成制御を提供する拡散変換器(DiT)アーキテクチャに基づいています。その中でも、ジブリ・コントロールLoRAは特別な機能の一つで、たった100個のサブ...
1年前
058.2K
挑战奥赛级难题:7款主流LLM中文数学性能基准评测

オリンピアード・レベルの問題への挑戦:LLM中国数学のパフォーマンス・ベンチマーク7つのレビュー

数式導出、論理連鎖の構築、抽象的思考を包含する数学的能力は、人工知能(AI)、特に大規模言語モデル(LLM)の能力をテストするための重要な分野と考えられてきた。これは、計算能力をテストするだけでなく、複雑な問題を推論し、理解し、解決するモデルの能力をより深く掘り下げるためである。
1年前
051.6K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

ジェンスパーク:ジェンスパーク・インテリジェンスに基づく調査レポートの深い検索と執筆

はじめに Gensparkは人工知能ベースの検索ツールである。バイドゥの元幹部によって2023年に設立され、カリフォルニア州パロアルトを拠点としている。従来の検索エンジンとは異なり、Gensparkは複数のAIインテリジェンスを使用して、カスタマイズされた検索をリアルタイムで生成する。
12ヶ月前
088.7K
MCP 配置与实战:连接 AI 与常用应用教程

MCP設定とハンズオン:AIと共通アプリケーションの接続チュートリアル

最近、MCP(Model Context Protocol)が技術愛好家や開発者コミュニティで注目を集めている。この技術は、ラージ・ランゲージ・モデル(LLM)が様々な外部ツールやサービスと相互作用する方法を簡素化することを目的としたもので、私たちのやり方を再構築することが期待されている。
1年前
076.1K
ChatGPT使用json结构化提示词生成3D图标

ChatGPTはjson構造化キューワードを使って3Dアイコンを生成する

楽しくて便利なgpt-4oマッピングのプロンプトをミニマルな3Dイラストスタイルで。 いくつかテストして安定した結果が得られたので、最後の画像はオリジナルの一押しから。 適切に使えば、資料(記事、ウェブサイト、販促物)に多くのポイントを加えることができるはずだ。 プロム...
1年前
073.4K
防范 AI 抄袭:从教学设计入手的预防策略与实践

AIにおける剽窃の防止:インストラクショナル・デザインからの防止戦略と実践

人工知能(AI)の普及は教育界に変革の機会をもたらしたが、同時に深刻な課題も伴っており、その最たるものがアカデミック・インテグリティへの影響である。AIツールがテキストを生成できるようになったことで、伝統的な意味での剽窃の境界が曖昧になり、教育者にとってかつてない困難が生じた。
1年前
060.3K
人工智能进课堂:从风险管理到教学赋能

教室における人工知能:リスク管理から教育的エンパワーメントへ

ロボットが世界を征服するというジョークを耳にしたことがある人は多いだろう。このようなジョークは、かつては一見実現不可能な現実に基づいていたが、今日ではその背後に現実的な不安が潜んでいる。人工知能(AI)はもはやSFの概念ではなく、現実の、そしてますます強力になっているテクノロジーなのだ。しかし、C...
1年前
050K
运用 ChatGPT Projects 和 GPTs 提升工作效率

ChatGPTプロジェクトとGPTで生産性向上

ChatGPTは単なる対話アシスタントではなく、ユーザーが反復的なタスクやプロジェクトを体系的に処理できるよう、より高度な機能を提供しています。今回はChatGPTのプロジェクトとGPT(カスタマイズGPT)を紹介します ...
1年前
074.7K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: リアルタイムのビデオ検出と物体分割のためのオープンソースツール

YOLOEは清華大学ソフトウェア学院のマルチメディア・インテリジェンス・グループ(THU-MIG)が開発したオープンソースプロジェクトで、正式名称は「You Only Look Once Eye」。PyTorchフレームワークをベースにしており、YOLOシリーズの拡張機能に属している。
1年前
074.9K
集成多种先进语音合成服务的开源运营项目

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...
1年前
062.5K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: ダイアログ付きローカルAIインテリジェンス生成クライアント(内部テスト中)

概論 LibraはGreenbit.aiの革新的なツールで、その中核機能は自然言語対話を通じてローカルに動作するAIインテリジェンスを生成することである。バイブエージェント "と呼ばれるこのツールは、ユーザーが自分のニーズを簡単な言葉で説明し、素早く...
1年前
079.7K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind:タイムスタンプによるビデオ位置決めコンテンツとQ&Aオープンソースプロジェクト

概論 VideoMindは、長い動画の推論、Q&A、要約生成に焦点を当てたオープンソースのマルチモーダルAIツールである。香港理工大学のYe Liuとシンガポール国立大学のShow Labのチームによって開発された。このツールは人間の動画理解を模倣している。
12ヶ月前
062.3K
SuperCoder:命令行终端运行的智能代码助手

SuperCoder: コマンドライン・ターミナル実行のためのインテリジェント・コード・アシスタント

一般的な紹介 SuperCoderはターミナルで動作するインテリジェントなツールで、プログラマーのために設計されています。AI技術を使って、ユーザーがコードを検索したり、プロジェクトの構造を見たり、ファイルを編集したり、バグを修正したりするのを手助けします。このプロジェクトはGitHubのhuytdによってオープンソース化されており、...
1年前
061.7K
Emigo:在Emacs中使用AI完成复杂编程任务的助手

Emigo:EmacsのAIを使った複雑なプログラミング作業のアシスタント

概論 EmigoはEmacs用に設計されたオープンソースのAIプログラミング・アシスタントで、MatthewZMDによってGitHub上で開発されています。大規模言語モデル(LLM)を統合することで、プログラマがEmacs上でコード解析を完了するのを支援します...
1年前
075.3K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツール

概要 SegAnyMoは、カリフォルニア大学バークレー校と北京大学の研究者チームによって開発されたオープンソースプロジェクトで、Nan Huangなどのメンバーが参加している。このツールはビデオ処理に重点を置いており、ビデオ内の任意の動く物体、例えば人、動物、...を自動的に識別し、セグメント化することができる。
1年前
067.9K
GeminiCode:基于Gemini 2.5在终端运行的AI编程助手

GeminiCode: ターミナルで動作するGemini 2.5ベースのAIプログラミングアシスタント

一般的な紹介 GeminiCodeは、開発者が週末の余暇に開発した、端末で動作するAIプログラミングアシスタントである。GoogleのGemini 2.5 Proモデルに基づいており、コンピュータのカレントディレクトリ内のファイルを読み込んで変更することができる。これは...
1年前
061.3K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: 任意の3Dおよび4Dシーンのビデオを生成するためのオープンソースフレームワーク

一般的な紹介 GenXDは、シンガポール国立大学(NUS)とMicrosoftチームによって開発されたオープンソースプロジェクトです。GenXDは、任意の3Dおよび4Dシーンを生成することに重点を置き、データ不足やモデル設計の複雑さによる現実世界の3Dおよび4D生成の問題を解決する。このプロジェクトは、...
1年前
062.6K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone:写真から半身のデジタル人物ビデオを生成するツール

はじめに ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトです。人工知能技術を用いて、1枚の写真と音声入力から、上半身の動きを含むデジタル人物ビデオを生成する。このプロジェクトは、頭の動きを生成する階層的な動き拡散モデルに基づいています...
1年前
064.8K
ChatGPT生成手写笔记风格图像

ChatGPTが手書きメモ風画像を生成

追記:リトルレッドブックのノートカバーやマルチイメージノートを作成するには、やはりかなり便利です。 プロンプト・ワード・クリエイト・ピクチャー A4サイズの紙の上に、次の文章のコンセプトを説明する中国語の独白をペンと青インクで書いてください。その上に赤いマーカーペンで印を書き、他の人の参考になるようにする。
1年前
084.7K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)技術によって大規模言語モデル(LLM)を学習し、モデルが自律的に学習することを可能にします...
1年前
084.7K