AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計920記事

タグ: AIのオープンソースプロジェクト 2ページ目

DeepGemini:多模型编排任务并封装为API接口-首席AI分享圈

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、主な特徴は、様々なAIモデルを柔軟に組み合わせる能力であり、OpenAI互換のAPIインターフェースを通じて呼び出される。プロジェクトはPython 3.11と...をベースにしている。

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するためにAIを訓練することです。このプロジェクトには、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリが含まれており、ユーザは...

II-Researcher:深度搜索与分步推理解答复杂问题-首席AI分享圈

II-Researcher: 複雑な問題に答えるための深層探索と段階的推論

一般的な紹介 II-Researcherは、Intelligent-Internetチームによって開発され、GitHubでホストされているオープンソースの人工知能研究ツールです。深層検索と複雑な推論のために設計されており、インテリジェントなウェブ検索とマルチステップ分析を通じて複雑な質問に答えることができます。プロジェクトは2025年3月27日に開始された。

Cua:让AI代理在macOS/Linux沙盒中安全执行应用-首席AI分享圈

Cua: AIエージェントがmacOS/Linuxサンドボックスで安全にアプリケーションを実行できるようにする

一般的な紹介 Cuaは、Computer-Use Agent(「クーア」と発音)と呼ばれるオープンソースプロジェクトで、Apple Siliconデバイス向けに設計されており、ネイティブデバイス90%に近い速度で高性能なmacOSとLinuxの仮想マシンを作成し、実行することができます。CuaはApple Siliconデバイス用に設計されており、ネイティブデバイスの90%に近い速度で、高性能なmacOSとLinuxの仮想マシンを作成して実行することができます。 CuaはAp...

Paper to Podcast:把学术论文转换为多人对话播客-首席AI分享圈

論文からポッドキャストへ:学術論文を多人数会話のポッドキャストに変換する

はじめに Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変えることに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物(ホスト、学習者、専門家)の対話に変えることで、複雑な学術的内容を簡単に理解できるようにします。この ...

アヌビス:作業負荷の証明を通じてAIクローラーのクローリングを妨害する

一般的な紹介 Anubisは、AIクローラーからウェブサイトを保護するためにTecharoHQチームによって開発されたオープンソースツールです。HTTPリクエストにSHA256 Proof-of-Workチャレンジを追加し、訪問者に計算タスクを完了させることで、非準拠のWebサイトをブロックします。

OmniSQL:将自然语言转化为高质量SQL查询的模型-首席AI分享圈

OmniSQL: 自然言語を高品質なSQLクエリに変換するモデル

概論 OmniSQLはRUCKBReasoningチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。このプロジェクトの中心的な機能は、ユーザが入力した自然言語の質問を高品質なSQLクエリ文に変換し、ユーザがデータベースを簡単に操作できるようにすることである。このプロジェクトは、自動化されたテキスト...

LatentSync:用音频直接生成唇形同步视频的开源工具-首席AI分享圈

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。音声を通して動画内のキャラクターの唇の動きを直接駆動し、口の形を音声に正確に一致させることができます。このプロジェクトは、Stable Diffusionの潜在拡散モデルに基づいています。

Morphik Core:处理多模态数据的开源 RAG 平台-首席AI分享圈

Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォーム

一般的な紹介 Morphik Coreはmorphik-orgチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。以前はDataBridge Coreと呼ばれていましたが、現在はMorphik Coreと改名されています。このツールはAIアプリケーションのために設計されたデータベースで、テキスト、画像、PDF、動画、その他様々なデータを扱うことができます。

基于Workers AI免费将多种文件转为Markdown格式-首席AI分享圈

Workers AIに基づいて、無料で複数のファイルをMarkdown形式に変換する

一般的な紹介 serverless-markdown-convertorは、Cloudflare WorkerとWorkers AI開発に基づいて、様々なファイルをMarkdown形式に変換することができる無料のオープンソースツールです。PDF、画像、Office文書、HTML、その他の一般的なファイル形式をサポートしており、自分で変換する必要はありません。

EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具-首席AI分享圈

EditorJumper:Cursor/Trae/WindsurfとJetBrainsのシームレスな切り替えツール

概要 EditorJumperは、JetBrains IDE用に設計されたプラグインで、GitHubユーザーのwanniwaによって開発されました。このプラグインを使うと、開発者はJetBrains IDE(IntelliJ IDEAやPyCharmなど)とVS Code、Cursor、Trae、Windsurfなどのエディタとの間を素早く行き来することができます。

VirtualWife:支持B站直播和语音互动的二次元数字人-首席AI分享圈

バーチャル・ワイフ:Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン

VirtualWifeは、開発者yakami129によって作られたオープンソースのバーチャルデジタルパーソンプロジェクトである。現在インキュベーション段階にあり、「魂」を持ったバーチャル・キャラクターを作成することが目標で、ユーザーは友人のように交流することができる。このプロジェクトはBステーションのライブストリーミングをサポートし、中国語の音声とテキストでコミュニケーションすることができます。

GPT-Crawler:自动爬取网站内容生成知识库文件-首席AI分享圈

GPT-Crawler: ウェブサイトコンテンツを自動的にクロールして知識ベースドキュメントを生成

一般的な紹介 GPT-Crawlerは、BuilderIOチームによって開発され、GitHubでホストされているオープンソースツールです。1つ以上のウェブサイトのURLを入力することで、ページのコンテンツをクロールし、カスタムGPTやAIアシスタントを作成するための構造化ナレッジファイル(output.json)を生成します。ユーザーは...

MegaTTS3:合成中英文语音的轻量模型-首席AI分享圈

MegaTTS3:中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは0.45Bのパラメータしかなく、軽量で効率的です。プロジェクトはGitHubでホストされており、...

KBLaM:为大模型嵌入外部知识的开源增强工具-首席AI分享圈

KBLaM:大規模モデルに外部知識を埋め込むためのオープンソース拡張ツール

KBLaMはMicrosoftによって開発されたオープンソースプロジェクトで、知識ベース拡張言語モデル(KBLaM)として知られている。KBLaMは、外部の知識をベクトルに変換し、大規模なモデルのアテンションレイヤーに埋め込みます。

LangGraph CodeAct:複雑なタスクを解決する知能を支援するコード生成

概要 LangGraph CodeActは、LangChain AIチームによってGitHubでオープンソース化されたフレームワークで、CodeActアーキテクチャに基づいています(詳細は論文arXiv:2402.01030を参照)。Pythonコードを生成・実行することで、インテリジェンスが複雑なタスクを効率的に処理できるようにする。このツールはManus...

BrowserTools MCP:实时监控浏览器活动的MCP服务-首席AI分享圈

BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス

概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがログ、ネットワークリクエスト、スクリーンショットを含むブラウザのアクティビティをリアルタイムで監視し、ChromeエクステンションやNode.jsサービスを通じてウェブパフォーマンス、SEO、アクセシビリティを分析することを可能にします。

AgentLaboratory:利用智能代理完成科研全流程的开源工具-首席AI分享圈

AgentLaboratory: 知的エージェントによる科学研究の全プロセスを完了するオープンソースツール

概要 AgentLaboratoryは、Samuel Schmidgallによって開発された、GitHubでホストされているオープンソースツールです。大規模言語モデル(LLM)によって駆動されるインテリジェントエージェントを使用し、文献レビュー、実験デザイン、レポート作成を含む科学研究の全プロセスにおいて研究者を支援します。このツールの...

Kilo Code:具有简洁使用体验的Roo Code分支-首席AI分享圈

キロ・コード:クリーンなユーザー・エクスペリエンスを備えたルー・コードのブランチ

一般的な紹介 キロコードは、Visual Studio Code(略してVS Code)のオープンソース拡張プラグインです。人工知能技術を使って、ユーザーがより効率的にコードを書けるようにする。このプロジェクトはKilo-Orgチームによって開発され、当初はRoo Codeからフォークされ、その後、より多くの機能を追加しています。

ja日本語