AIパーソナル・ラーニング
と実践的なガイダンス
TRAE

AIツール 12ページ

GenXD:生成任意3D和4D场景视频的开源框架-首席AI分享圈

GenXD: 任意の3Dおよび4Dシーンのビデオを生成するためのオープンソースフレームワーク

一般的な紹介 GenXDは、シンガポール国立大学(NUS)とMicrosoftチームによって開発されたオープンソースプロジェクトです。任意の3D・4Dシーンの生成に重点を置き、データ不足やモデル設計の複雑さに起因する現実世界の3D・4D生成を解決する。このプロジェクトでは、カメラやオブジェクトの動きを分析し、その動きから、3Dや4Dシーンの生成に必要なデータを抽出します。

ChatAnyone:从照片生成半身数字人肖像视频的工具-首席AI分享圈

ChatAnyone:写真から半身のデジタル人物ビデオを生成するツール

はじめに ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトです。人工知能の技術を用いて、1枚の写真と音声入力から、上半身の動きを含むデジタル人物のポートレート動画を生成する。このプロジェクトは、頭の動き、ジェスチャー、表情を生成する階層的動作拡散モデルに基づいています。

Search-R1:强化学习训练大模型搜索与推理的工具-首席AI分享圈

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)のテクニックを使って大規模言語モデル(LLM)を学習し、モデルが自律的に推論を学習し、問題を解決するために検索エンジンを呼び出すことを可能にします。このプロジェクトはQwen2.5をサポートしています。

OctoComics:用AI快速生成BL漫画的创作平台-首席AI分享圈

OctoComics:AIでBLコミックを素早く生成する創作プラットフォーム

OctoComics(オクトコミックス)は、AIを活用したBLコミックの生成に特化したオンラインプラットフォームです。ユーザーはテキストを入力することで、BLテーマ、オリジナル連載、OCキャラクターコミックを生成することができ、様々な描画スタイルと柔軟なサブシーン編集が可能です。BL ...

FluxGen:在代码编辑器中直接生成AI图像的工具-首席AI分享圈

FluxGen:コードエディタでAI画像を直接生成するツール

一般的な紹介 FluxGenは、Black Forest Labsによって開発者向けに設計されたAI画像生成ツールです。FluxGenの主な機能は、他のデザインソフトウェアに切り替えることなく、コードエディタ上で高品質な画像を直接生成できることです。開発者は、テキストによる説明を素早く入力することができます。

Purposewrite:用AI快速生成高质量原创内容的写作工具-首席AI分享圈

Purposewrite:AIで高品質なオリジナルコンテンツを素早く生成するライティングツール

概要 Purposewriteは、人工知能を利用したオンラインライティングツールで、高品質なオリジナルコンテンツを素早く作成することができます。簡単な操作で、ブログ、メール、広告コピーなどのコンテンツを瞬時に作成することができます。AI技術を取り入れることで、ユーザー一人ひとりに合ったライティングアドバイスを提供することが特徴です。

HeroUI Chat:将网页设计转为React代码的AI工具-首席AI分享圈

HeroUI Chat:ウェブデザインをReactコードに変えるAIツール

概要 HeroUI Chatは、人工知能に基づいたオンラインプラットフォームです。ユーザーが簡単なテキスト記述やアップロードされたスクリーンショットを使って、美しく制作可能なReactコードを素早く生成するのに役立ちます。このツールは、オープンソースのHeroUIコンポーネントライブラリ(以前はNextUIとして知られていた)に依存しています。

DeepGemini:多模型编排任务并封装为API接口-首席AI分享圈

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、主な特徴は、様々なAIモデルを柔軟に組み合わせる能力であり、OpenAI互換のAPIインターフェースを通じて呼び出される。プロジェクトはPython 3.11と...をベースにしている。

Avcado AI:扫描食品标签并分析成分的健康助手-首席AI分享圈

Avcado AI:食品ラベルをスキャンして成分を分析する健康アシスタント

概要 Avcado AIは、ユーザーが食品の内容を理解するのに役立つスマートなツールである。核となる機能は、食品ラベルを撮影しスキャンすることで、原材料、栄養成分、添加物を素早く特定することである。ユーザーは携帯電話でパッケージのラベルを撮影するだけで、ウェブサイトが食品に関する詳細な情報を分析し、表示します。

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するためにAIを訓練することです。このプロジェクトには、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリが含まれており、ユーザは...

II-Researcher:深度搜索与分步推理解答复杂问题-首席AI分享圈

II-Researcher: 複雑な問題に答えるための深層探索と段階的推論

一般的な紹介 II-Researcherは、Intelligent-Internetチームによって開発され、GitHubでホストされているオープンソースの人工知能研究ツールです。深層検索と複雑な推論のために設計されており、インテリジェントなウェブ検索とマルチステップ分析を通じて複雑な質問に答えることができます。プロジェクトは2025年3月27日に開始された。

Cua:让AI代理在macOS/Linux沙盒中安全执行应用-首席AI分享圈

Cua: AIエージェントがmacOS/Linuxサンドボックスで安全にアプリケーションを実行できるようにする

一般的な紹介 Cuaは、Computer-Use Agent(「クーア」と発音)と呼ばれるオープンソースプロジェクトで、Apple Siliconデバイス向けに設計されており、ネイティブデバイス90%に近い速度で高性能なmacOSとLinuxの仮想マシンを作成し、実行することができます。CuaはApple Siliconデバイス用に設計されており、ネイティブデバイスの90%に近い速度で、高性能なmacOSとLinuxの仮想マシンを作成して実行することができます。 CuaはAp...

vdspeak:为YouTube视频生成多语言配音-首席AI分享圈

vdspeak:YouTube動画用の多言語ボイスオーバーを生成する

概要 vdspeakは、YouTube動画の多言語翻訳・ダビングサービスを提供するオンラインツールです。高度なAI技術を活用し、動画コンテンツを150以上の言語に自動翻訳・吹き替えすることで、世界中の視聴者に簡単にリーチすることができます。操作は簡単で、ユーザーは動画のリンクを入力するだけです。

Paper to Podcast:把学术论文转换为多人对话播客-首席AI分享圈

論文からポッドキャストへ:学術論文を多人数会話のポッドキャストに変換する

はじめに Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変えることに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物(ホスト、学習者、専門家)の対話に変えることで、複雑な学術的内容を簡単に理解できるようにします。この ...

アヌビス:作業負荷の証明を通じてAIクローラーのクローリングを妨害する

一般的な紹介 Anubisは、AIクローラーからウェブサイトを保護するためにTecharoHQチームによって開発されたオープンソースツールです。HTTPリクエストにSHA256 Proof-of-Workチャレンジを追加し、訪問者に計算タスクを完了させることで、非準拠のWebサイトをブロックします。

OmniSQL:将自然语言转化为高质量SQL查询的模型-首席AI分享圈

OmniSQL: 自然言語を高品質なSQLクエリに変換するモデル

概論 OmniSQLはRUCKBReasoningチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。このプロジェクトの中心的な機能は、ユーザが入力した自然言語の質問を高品質なSQLクエリ文に変換し、ユーザがデータベースを簡単に操作できるようにすることである。このプロジェクトは、自動化されたテキスト...

LatentSync:用音频直接生成唇形同步视频的开源工具-首席AI分享圈

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。音声を通して動画内のキャラクターの唇の動きを直接駆動し、口の形を音声に正確に一致させることができます。このプロジェクトは、Stable Diffusionの潜在拡散モデルに基づいています。

Morphik Core:处理多模态数据的开源 RAG 平台-首席AI分享圈

Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォーム

一般的な紹介 Morphik Coreはmorphik-orgチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。以前はDataBridge Coreと呼ばれていましたが、現在はMorphik Coreと改名されています。このツールはAIアプリケーションのために設計されたデータベースで、テキスト、画像、PDF、動画、その他様々なデータを扱うことができます。

Logome:快速生成专业品牌Logo的AI工具-首席AI分享圈

ロゴーム:プロフェッショナルなブランドロゴを素早く生成するAIツール

概要 Logomeは、人工知能技術を使い、プロフェッショナルなブランドロゴを素早く作成できるオンラインプラットフォームである。起業家、中小企業、個人向けに設計されており、デザインの経験がなくてもユニークなロゴと完全なブランドキットを生成します。ユーザーはブランド名と業界情報を入力するだけで、A...

ja日本語