AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計992記事

タグ: AIのオープンソースプロジェクト 45ページ

文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具-首席AI分享圈

テキスト抽出 API (text-extract-api): テキスト情報の視覚的抽出、匿名化 PDF 抽出ツール

概要 テキスト抽出API(text-extract-api)は、様々な文書形式(PDF、Word、PPTXなど)からコンテンツを抽出・解析するために設計された強力なツールです。このAPIは、最先端の光学式文字認識(OCR)技術とOllamaがサポートするモデルを利用し、あらゆる文書や画像を...

OmniGen:统一图像生成模型,多模态输入生成人物一致性图像-首席AI分享圈

OmniGen:マルチモーダル入力を用いた統一的な画像生成モデルによる、文字の一貫性を保った画像生成

概論 OmniGenはVectorSpaceLabによって開発された "ユニバーサル "な画像生成モデルであり、ユーザーはシンプルなテキストプロンプトやマルチモーダル入力で、多様でコンテクストに富んだ視覚効果を作成することができる。特に、文字認識や一貫した文字レンダリングを必要とするシーンに適しています。

PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架-首席AI分享圈

PantoMatrix(Emage):全身ジェスチャー生成フレームワーク、音声から全身ジェスチャーを生成する3Dアニメーションフレームワーク

包括的な紹介 PantoMatrixは、音声と顔、体の一部、手、全身の動きを含む部分的なジェスチャーから、完全な人間の動きを生成できる先進的なフルボディジェスチャー生成フレームワークです。このフレームワークは、最新のマルチモーダルデータセットとディープラーニング技術を活用し、高品質な3Dモーションキャプチャデータを提供します。

Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手-首席AI分享圈

Continue:VSコードと統合し、モデルと埋め込みをカスタマイズするオープンソースのAIコードアシスタント

Continueは、ソフトウェア開発者の効率を向上させるために設計されたオープンソースのAIコードアシスタントです。主な機能として、コードの自動補完、コードの最適化、VS CodeやJetBrains IDE向けのインテリジェントなコード提案があります。Continueは複数の言語モデルをサポートしているだけでなく、ユーザーがカスタマイズすることもできます。

AI蜂巢:基于 Java 的多功能 AI聊天集成平台-首席AI分享圈

AI Hive: Javaベースの汎用AIチャット統合プラットフォーム

総合紹介 AIビーハイブ(ai-beehive)は、Spring Boot 3とJDK 17を搭載したJavaで構築された多機能AIプラットフォームである。このプロジェクトは、ChatGPT、OpenAI画像生成、Midjourney、NewBing、Baidu Wenshin Yiyin...など、様々なAI技術を統合しています。

Zed:Rust开发的高性能多人协作代码编辑器-首席AI分享圈

Zed: Rustによって開発された高性能なマルチプレイヤー共同コードエディタ

一般的な紹介 Zedは、AtomとTree-sitterの作成者によって開発された、高性能なマルチユーザー・コラボレーティブ・コードエディタです。ZedはRust言語で書かれており、高速で流動的なコーディング体験を提供するように設計されています。主な機能として、リアルタイムのマルチユーザーコラボレーションのサポート、クロスプラットフォーム互換性(現在...

Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)-首席AI分享圈

Pieces OS: Pieces-OSのGRPCをOpenAIインターフェイスに逆変換(失敗)

一般的な紹介 Pieces-OSは、オープンソースのプロジェクトであり、Pieces-OS GRPCストリームを反転し、標準的なOpenAI APIインタフェースに変換することを目的とし、クロード、GPT、Geminiをサポートしています プロジェクトはNekohyによって開発され、GPL-3.0プロトコルに基づいてオープンソース、主に学習や通信のために、商業用ではありません...

uni-api: 軽量なビッグモデルAPIをOpenAIインターフェイスに変換。

包括的な導入フロントエンドなし、純粋な設定ファイルの設定APIチャネル 。ただ、自分のAPIステーションを実行するためにファイルを記述し、ドキュメントには、詳細な設定ガイドを持っている、白フレンドリー。 uni-apiは、大規模なモデルのAPIプロジェクトの統一管理、統一されたAPIインターフェイスは、複数のポストを呼び出すことができます...

IC-Light(V2):图像照明控制神器,控制图像光影和背景-首席AI分享圈

IC-Light(V2):画像照明制御マジック、画像の光と影、背景を制御する

包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、テキスト条件付き再点灯モデルと背景条件付きモデルの2つの主要モデルを提供する。ユーザは、単純なテキストプロンプトまたは...

Screenshot to Code:将截图转换为干净前端代码的AI工具-首席AI分享圈

スクリーンショットをコードに:スクリーンショットをクリーンなフロントエンドコードに変換するAIツール

概要 Screenshot-to-Codeは、人工知能を使用してスクリーンショット、デザインドラフト、Figmaデザインをクリーンで機能的なコードに変換するオープンソースツールです。このツールは、HTML、Tailwind CSS、React、Vueなど、複数のフロントエンド技術スタックをサポートしています。

Ortlin:与所有OpenAI模型和API交互的Web图形用户界面-首席AI分享圈

Ortlin:すべてのOpenAIモデルとAPIを操作するためのウェブGUI

Ortlinはウェブベースのグラフィカル・ユーザー・インターフェースで、技術的なユーザーもそうでないユーザーも、誰でも簡単にOpenAIのAPIや基礎モデルと対話できるように設計されています。Ortlinは完全にフリーでオープンソースであるため、ユーザーは何の苦労もなくOpenAIのパワーを利用することができます。

AigoTools:自动收录网站并支持多语言的开源AI工具导航站-首席AI分享圈

AigoTools: ウェブサイトの自動組み込みと多言語オープンソースAIツールナビゲーションサイトのサポート

一般的な紹介 AigoToolsは、オープンソースのAIウェブサイトナビゲーションで、ユーザーが素早くナビゲーションサイトを作成・管理できるように設計されています。サイト管理、AIベースの自動インクルージョン機能、多言語サポート、ダーク/ブライトテーマ切り替え、SEO最適化を内蔵しています。AigoToolsは、このサイトを含む様々な画像保存ソリューションを提供しています。

GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型-首席AI分享圈

GPT4Free: 複数のGPTモデルを自由に使用するためのAI対話ウェブサイトのインターフェイスをデコンパイルします。

GPT4Freeは、GPT-3.5、GPT-4、Llama、Gemini-Pro、Bard、Claudeを含む様々な強力な言語モデルを無料で提供することを目的とし、開発者xtekkyによってGitHubで公開されているオープンソースプロジェクトです。このプロジェクトは、複数のAPIリクエストを集約することで、...

Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)-首席AI分享圈

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは、明示的な音声合成情報を必要とせず、2段階の生成アプローチを採用しています。

Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)-首席AI分享圈

クアンタ・クエスト:エンドサイドのビッグモデルと個人データのためのローカライズされたAI検索プラットフォーム(プレビュー)

はじめに Quanta Questは「エンド側ビッグモデル+C側データローカリゼーション」を核心進化の方向とする世界初の製品であり、ユーザーがGmail、Notion、Dropboxなどのすべてのデータをローカルに保存し、ベクトルデータベース処理を通じてセキュリティとプライバシーを確保することを支援します。Gmail、Notion、Dropboxなどのすべてのデータをローカルに保存し、ベクターデータベース処理によってデータのセキュリティとプライバシーを確保することができます。

ローカル・ファイル・オーガナイザー:AIが自動的にファイルを整理するローカル・ファイル・オーガナイザー・アシスタント

一般的な説明 Local File Organizerは、ユーザーがコンピュータ上のファイルを整理・分類できるように設計された、AIを搭載したローカルファイル管理ツールです。このツールは、Nexa SDKを介してLlama3.2 3BやLlava v1.6などの高度なAIモデルを利用し、ファイルのインテリジェントなスキャン、リ...

PDF to Podcast:PDFをポッドキャストに変換するユーティリティ

概論 Notebook LMのポッドキャスト生成機能と、最近のOpen Notebook LMのオープンソース実装に触発されました。このレシピでは、PDFからポッドキャストへのパイプラインを構築する方法を、ステップバイステップで実装します。 任意のPDFが与えられたら、ホストとゲストが議論し説明するセグメントを生成します。

Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现-首席AI分享圈

Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装

一般的な紹介 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。Kyle Corbittによって開発されたこのプロジェクトは、ユーザが物理的にコンピュータを制御できる軽量なソリューションを提供することを目的としています。

MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!-首席AI分享圈

MindSearch: オープンソースのAI検索エンジンフレームワーク!

包括的な紹介 MindSearchは、上海人工知能研究所(SAL)が立ち上げたオープンソースのAI検索エンジンフレームワークであり、複雑な情報収集と統合のための人間の思考プロセスをシミュレートすることを目的としている。このツールは、大規模言語モデリング(LLM)と検索エンジンの高度な技術をマルチインテリジェンス体のフレームワークと組み合わせることで、...

ja日本語