AIオープンソースプロジェクト

合計1020記事
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin: NoneBotとDeepSeekをベースにしたカスタマーサービス用のインテリジェントな対話。

一般的な紹介 NoneBot DeepSeek プラグインは、DeepSeek モデルを統合し、インテリジェントな対話と Q&A 機能を提供するように設計された NoneBot プラグインです。DeepSeek モデルにアクセスすることで、ユーザは NoneBot ...
8ヶ月前
023.8K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

はじめに GitPodcastは、GitHubのリポジトリをポッドキャストに変える革新的なツールで、開発者はいつでもどこでもコードの更新を聞くことができます。OpenAIとAzure Speech SDKを使って、GitPodca...
9ヶ月前
023.8K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: 複数のフロントエンドフレームワークをサポートするAI駆動型リッチテキストエディタの作成

包括的な紹介 AIEditorは、Webコンポーネント開発に基づいて、Vue、React、Angularおよび他のほとんどすべての主流のフロントエンドフレームワークをサポートしているAI駆動型の次世代リッチテキストエディタです。PCのWebと...
10ヶ月前
023.8K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。
8ヶ月前
023.8K
Rankify:支持信息检索与重排序的Python工具包

Rankify: 情報検索と並び替えをサポートするPythonツールキット

一般的な紹介 Rankifyは、オーストリアのインスブルック大学のデータサイエンスグループによって開発されたオープンソースのPythonツールキットである。情報検索、並べ替え、検索拡張生成(RAG)に焦点を当て、統一されたフレームワークを提供している。このツールキットには40の検索済みベンチマークが組み込まれている。
7ヶ月前
023.8K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo:ソースコード閲覧ツール。LLMを使ってコードを分析し、詳細なコード解説を提供する。

一般的な紹介 askrepoは、LLM(Large Language Model)に基づいたソースコードリーディングツールです。指定されたディレクトリにあるGitで管理されたテキストファイルの内容を読み込み、Google Gemini APIに送信して、指定されたプロンプトに基づいた質問への回答を提供することができます...
11ヶ月前
023.8K
RAIN:实时捕捉真人表情生成动漫形象视频流

RAIN:アニメ映像のビデオストリームを生成するためのリアルタイムの人間の表情のキャプチャ

概論 RAIN(Real-time Animation Of Infinite Video Stream)は、無限のビデオストリームのアニメーション効果をリアルタイムで生成するために設計されたオープンソースプロジェクトである。このプロジェクトはPscgylottiによって開発されました。
9ヶ月前
023.7K
集成多种先进语音合成服务的开源运营项目

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...
6ヶ月前
023.7K
自动解析PDF内容并提取文字与表格的开源服务

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。
6ヶ月前
023.7K
オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

Orchestraは革新的な軽量Pythonフレームワークで、大規模言語モデル(LLM)に基づくマルチインテリジェンス協調システムの構築に重点を置いています。複数のAI知能が交響楽団のように調和して動作するように、知能を配置する独自の方法を採用している。モデル化することで ...
9ヶ月前
023.7K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: 500以上の研究ツールを統合し、研究と科学的タスクを自動化するインテリジェンス

包括的な紹介 SciToolAgentは、杭州にある浙江大学のイノベーションセンター(HICAI-ZJU)によって開発されたオープンソースのツールプラットフォームです。ナレッジグラフ(SciToolKG)とビッグランゲージモデリング技術を通じて500以上の科学ツールを統合し、研究者が...
7ヶ月前
023.7K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统

VideoReTalking:音声駆動型リップシンクロ・ビデオ編集システム

一般的な紹介 VideoReTalkingは、ユーザーが入力音声に基づいてリップシンクロナイズされた顔のビデオを生成し、異なる感情であっても高品質でリップシンクロナイズされた出力ビデオを生成できる革新的なシステムです。このシステムは、この目標を3つの連続したタスクに分割します。
10ヶ月前
023.7K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。
8ヶ月前
023.7K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件

MarkPDFDown: マルチモーダルモデルに基づくPDFからMarkdownへの変換

概要 MarkPDFDownはオープンソースのツールです。Multimodal Big Language Modelを使ってPDFファイルをMarkdown形式に変換します。開発者はGitHubユーザーのjorbenです。このツールの目的はシンプルです:PDFドキュメントを...
7ヶ月前
023.6K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat:カスタムイメージとトーンクローニングによるリアルタイムの音声対話型デジタルパーソンは、エンドツーエンドの音声ソリューションとカスケードソリューションをサポートします。

概要 VideoChatは、オープンソース技術に基づくリアルタイム音声対話デジタルパーソンプロジェクトで、エンドツーエンドの音声スキーム(GLM-4-Voice - THG)とカスケードスキーム(ASR-LLM-TTS-THG)の両方をサポートしています。このプロジェクトでは、ユーザーがデジタルパーソンをカスタマイズすることができます。
11ヶ月前
023.6K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム

一般的な紹介 PrivateGPTは、インターネットに接続せずに大規模言語モデル(LLM)を使って文書をクイズすることを可能にする、本番環境で利用可能なAIプロジェクトです。このプロジェクトは、100%のデータプライバシーを保証し、すべてのデータはユーザの実行環境で処分されます...
10ヶ月前
023.6K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。

AIチャットボット Supabase: オープンソースのNext.jsとSupabaseで構築されたAIチャットボットをVercelに迅速に導入。

概要 AIチャットボット Supabaseは、Next.jsとSupabaseで構築されたオープンソースのAIチャットボットテンプレートです。Vercelによって開発されたこのプロジェクトは、完全に機能的でカスタマイズ可能なチャットボットソリューションを提供することを目的としています。...
11ヶ月前
023.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 高品質な結果を出すために、出力をレビュー、検証、フォーマットするマルチロールインテリジェンス

包括的な紹介 Kheishは、構造化されたステップバイステップのコラボレーションを必要とする大規模言語モデリング(LLM)タスクのために設計されたオープンソースのマルチロールエージェントです。Kheishは単なるコーディネータではなく、それ自体がインテリジェントなエージェントであり、要求に応じてモジュールを要求し、ユーザーの反転を統合します。
9ヶ月前
023.6K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: 画像解像度の質を向上させるオープンソース画像超解像プロジェクト

一般的な紹介 InvSRは、低解像度画像を高品質な高解像度画像に変換できる拡散インバージョン技術に基づいた革新的なオープンソースの画像超解像プロジェクトです。このプロジェクトは、事前に訓練された大規模拡散モデルに埋め込まれた豊富な画像事前知識を利用し、柔軟なサンプリングメカニズムを通じて、...
10ヶ月前
023.6K
Docs:开源的协作笔记和文档管理工具

Docs: オープンソースの共同ノート・文書管理ツール

概要 Docs は、suitenumerique チームによって開発されたオープンソースの共同ノート作成および文書管理プラットフォームです。DjangoとReactの技術を使って構築されており、ユーザーがメモを取ったり、ドキュメントを管理したりするのに役立つ使いやすいツールを提供することを目標としています。
7ヶ月前
023.6K
AI Podcast Generator:自动抓取新闻生成音频播客

AIポッドキャスト・ジェネレーター:ニュースを自動クロールして音声ポッドキャストを生成

概論 AI Podcast Generatorは、高度なAI技術を利用してウェブソースから魅力的なオーディオコンテンツを自動的に作成するインテリジェントなポッドキャスト生成ツールです。このシステムは、ニュース・コンテンツをキャプチャし、オーディオ・ポッドキャストに変換することで、自然な流れのナレーションを生成します。このプロジェクトはNext...
11ヶ月前
023.6K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA:下書きメール(Gmail)の返信を迅速に生成するローカライズされたAIメール自動化システム

概要 LAMBDA(Local Auto MailBox Draft Assistant)は、ユーザーのメールスタイルから学習し、Gmailの受信トレイにある未読メールすべてに下書きを生成するように設計された、ローカライズされたAIメール自動化システムです...
10ヶ月前
023.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: 統一されたOpenAIインターフェーススタイルで複数のビッグモデルを呼び出し、高速なモデル切り替えと比較テストを実現

包括的な紹介 aisuiteは、開発者が複数の生成AIプロバイダーのサービスを簡単に呼び出せるように設計された、シンプルで統一されたインターフェースです。OpenAIに似たインターフェースを持つaisuiteは、最も人気のあるLLM(大規模言語モデル)との対話を容易にします...
11ヶ月前
023.6K
Memobase:为AI应用提供基于用户画像的长期记忆方案

メモベース:AIアプリケーションのためのユーザープロファイルに基づく長期記憶ソリューション

はじめに Memobaseは、生成的なAIアプリケーションのための長期的なユーザー記憶をサポートするように設計された、ユーザープロファイルに基づく記憶システムです。バーチャルコンパニオン、教育ツール、パーソナライズされたアシスタントなど、Memobaseは、AIが記憶し、理解し、成長するのを支援します。
8ヶ月前
023.6K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...
8ヶ月前
023.6K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 自然言語記述によるビデオ検索、編集、生成ワークフローのためのインテリジェントビデオエージェントフレームワーク

概要 Directorは、インテリジェントなビデオエージェントを構築することで、ビデオインタラクションとワークフローを簡素化し、最適化するために設計されたオープンソースのフレームワークです。このフレームワークは、VideoDBの "video-as-data "インフラストラクチャに基づいており、検索、編集、コンパイル、生成などの複雑なビデオタスクを処理することができます。
10ヶ月前
023.6K
Weebo:实时语音聊天机器人,提供自然语言对话体验

Weebo: 自然言語での対話体験を提供するリアルタイム音声チャットボット

はじめに Weeboは、音声認識にWhisper Small、自然言語生成にLlama 3.2、音声合成にKokoro-82Mを利用したオープンソースのリアルタイム音声チャットボットです。このプロジェクトはAman...によって開発されました。
9ヶ月前
023.6K
DevDocs:快速抓取并整理技术文档的MCP服务

DevDocs:技術文書を素早くクロールして整理するMCPサービス

概要 DevDocsは、CyberAGIチームによって開発され、GitHubでホストされている完全に無料のオープンソースツールです。プログラマーやソフトウェア開発者のために設計されたこのツールは、技術文書のURLから始まり、関連するページを自動的にクロールし、簡潔なMa...
6ヶ月前
023.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル(LLM)とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。
8ヶ月前
023.5K
LLM API Engine:通过自然语言快速生成和部署API

LLM API Engine: 自然言語によるAPIの迅速な生成とデプロイメント

一般的な紹介 LLM API Engineは、開発者がAIを搭載したAPIを迅速に構築し、デプロイできるように設計されたオープンソースプロジェクトです。このプロジェクトは、Large Language Model(LLM)とインテリジェントなウェブクローリング技術を活用し、ユーザーが自然言語記述によってカスタムAPIを作成できるようにします。
9ヶ月前
023.5K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具

ジョイジェン:音声駆動型3D奥行き認識型トーキングビデオ編集ツール

包括的な紹介 JoyGenは、音声による表情生成の問題を解決することに焦点を当てた、話す顔のための革新的な2段階映像生成フレームワークである。Jingdong Technologyのチームによって開発されたこのフレームワークは、高度な3D再構成技術と音声特徴抽出法を用いて、話し手のアイデンティティ特性と表情を正確に捉えます。
9ヶ月前
023.5K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon:ネイティブの多言語モデルチャット用iOSアプリ

一般的な説明 FullmoonはiOSデバイス用に設計されたアプリで、ネイティブの大規模な言語モデルとのプライベートチャット機能を提供することを目的としています。このアプリはApple Siliconに最適化されており、iPhone、iPad、Macに対応しています。チャットのユーザー...
9ヶ月前
023.5K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG:人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

はじめに GraphAgentは、Ji-Catherによって開発され、GitHubでホストされているオープンソースのフレームワークです。Large Language Model (LLM)を使用して人間の行動をシミュレートし、テキスト属性を持つダイナミックなソーシャルグラフを生成します。このツールは、オンライン・ソーシャル・メディア...
7ヶ月前
023.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
8ヶ月前
023.5K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT:画像パーツから完全な画像をつなぎ合わせるツール(未開封)

概論 PiT(Piece it Together)はGitHubでホストされているオープンソースツールで、テルアビブ大学のエラッド・リチャードソンなどの研究者によって開発された。羽のような断片化された画像パーツを入力することができる。
7ヶ月前
023.5K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api:様々な無料の大規模モデルAPIをワンクリックで統合、統一された外部OpenAIインターフェース

総合紹介 simple-one-apiは、複数のビッグモデルAPIの統合を簡素化するために設計されたオープンソースプロジェクトです。Thousand Sails Big Model Platform、Xunfei Starfire Big Model、Tencent Mixed Element、MiniMax、Deep-Seek...などのOpenAI互換APIをサポートしています。
11ヶ月前
023.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net:写真やビデオをスタイリッシュなアニメに変換するオープンソースツール

概説 DCT-Netは、DAMOアカデミーと北京大学王宣コンピューター技術研究所によって開発されたオープンソースプロジェクトで、画像のアニメスタイル変換を目的としている。このプロジェクトは、ディープラーニング技術を活用し、ドメインキャリブレーション翻訳(Domain-Calibrat...
9ヶ月前
023.5K
LM Speed:快速测试大模型API性能

LMスピード:大規模モデルAPIのパフォーマンスを迅速にテストする

概要 LM Speed は、AI 開発者向けに設計されたツールであり、lmspeed.net でオンラインサービスとしても提供されている。主な機能は、言語モデル API のパフォーマンスをテスト・分析し、スピードのボトルネックを素早く特定し、呼び出し戦略を最適化することである。これは...
6ヶ月前
023.5K
CSM Voice Cloning:利用CSM-1B快速克隆声音

CSMボイスクローニング:CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。
7ヶ月前
023.5K
GaiaNet node:安装和运行自己的本地模型在线代理服务

GaiaNetノード:独自のローカルモデル・オンラインプロキシサービスをインストールし、実行します。

概要 GaiaNet-AI/gaianet-nodeは、Mac、Linux、Windows WSLにデフォルトのノード・ソフトウェア・スタックを1つのコマンドで素早くインストールできるオープンソースプロジェクトです。ユーザはノードの初期化、設定のカスタマイズ、ダウンロード...
1年前
023.5K
Agentarium:複数のAIインテリジェンス間の相互作用の管理と調整

Agentarium:複数のAIインテリジェンス間の相互作用の管理と調整

概要 Agentariumは、AIインテリジェントエージェント(Agent)の管理とオーケストレーションに特化した強力なPythonフレームワークです。このフレームワークは、複数のAIエージェント間のインタラクションを作成、管理、オーケストレーションするための柔軟で直感的な方法を提供します。A...
9ヶ月前
023.5K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: PyAutoGUIライブラリでデスクトップ操作のインテリジェンスを自動化する

一般的な紹介 Clevrr Computerは、PyAutoGUIライブラリを使用してシステム操作を自動化することを目的としたオープンソースプロジェクトです。このプロジェクトはAnthropicにインスパイアされ、PyAutoGUIライブラリを使用して正確かつ効率的に操作を実行できる自動化エージェントを設計しました。
10ヶ月前
023.5K
TubeTube:自部署YouTube视频下载工具

TubeTube: 自己展開型YouTube動画ダウンロードツール

概要 TubeTubeはMattBlackOnlyによって開発されたオープンソースのYouTube動画ダウンロードツールです。このツールは、コアダウンロードエンジンとしてyt-dlpを使用し、マルチスレッドダウンロードをサポートし、同時に複数のビデオをすばやくダウンロードすることができます。ユーザーはyam...
8ヶ月前
023.4K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: FP8行列演算を効率的にサポートするオープンソースライブラリ (DeepSeek Open Source Week 3日目)

包括的な紹介 DeepGEMMは、DeepSeekチームによって開発されたオープンソースのFP8 GEMM (Generalised Matrix Multiplication)ライブラリで、行列演算の効率的なサポートを提供することに重点を置いています。特にNVIDIA HopperアーキテクチャのTensor ...
8ヶ月前
023.4K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
5ヶ月前
023.4K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成(RAG)ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG(Retrieval Augmented Generation)用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。
11ヶ月前
023.4K
TableGPT2:表格数据集成的多模态模型

TableGPT2: 表形式データ統合のためのマルチモーダルモデル

包括的な紹介 TableGPT2は浙江大学のチームによって開発されたマルチモーダルモデルで、表形式データの統合と処理に焦点を当てている。このモデルは、強力な汎用言語とコーディング能力を維持しながら、表データ関連のタスクで優れた性能を発揮できるよう、事前に訓練され、微調整されている。
11ヶ月前
023.4K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos:オープンソースのスマートAI写真ID作成ツール

包括的な紹介 HivisionIDPhotosは、オープンソースの軽量AI文書写真制作ツールであり、インテリジェントに様々な仕様に沿って標準的な文書の写真を生成するために、ユーザーの写真のシーンとキーイングを識別することができます。このツールは、カスタムの背景色とサイズをサポートし、将来的には、美しさと...
1年前
023.4K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge:大規模言語モデルヒントの有効性をテスト・評価するオープンソースのビジュアルプログラミング環境

概要 ChainForgeは、大規模言語モデル(LLM)のキューの有効性をテスト・評価するために設計されたオープンソースのビジュアルプログラミング環境です。データフローキューイングエンジニアリング環境を提供し、LLM応答における様々なキューの品質を素早く探索・分析することができます。
11ヶ月前
023.4K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。

Markdown To Poster: オンライン編集とワンクリック配備サポートで、Markdownをソーシャルメディアや小赤字ポスターに変換します。

概要 Markdown to Imageは、Markdownテキストを視覚的に魅力的なソーシャルメディア画像にレンダリングするためのReactコンポーネントです。このプロジェクトには、オンラインのMarkdown to posterエディタとして使用できる組み込みのWebエディタも含まれています...
11ヶ月前
023.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPTエージェント:複雑な表形式データを分析するために設計されたインテリジェントツール

包括的な紹介 TableGPTエージェントは、GitHubオープンソースプロジェクトに基づくインテリジェントなツールで、表形式データの処理と分析のために設計されています。TableGPT2 Big Language Model に依存し、自然言語インタラクションを使用して、ユーザが簡単にクエリ、操作...
8ヶ月前
023.4K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序

GeminiCoder: LlamaCoderプロジェクトに基づき、Gemini APIを使用してWebアプリケーションを素早く生成する。

包括的な紹介 GeminiCoderは、Google Gemini APIに基づいて開発された革新的なWebアプリケーション生成ツールです。このプロジェクトは、LlamaCoderの優れた機能を継承し、最新のGemini 1.5 Prを統合しています。
10ヶ月前
023.3K
R1-Onevision:支持多模态推理的开源视觉语言模型

R1-Onevision:マルチモーダル推論をサポートするオープンソースの視覚言語モデル

包括的な紹介 R1-Onevisionは、Fancy-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロ言語モデルです。視覚と言語の深い組み合わせに焦点を当て、画像やテキストなどのマルチモーダル入力を処理し、視覚的推論、画像理解、数学的解決などの分野で活躍することができます。
8ヶ月前
023.3K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

ライトカード:HTML5カードジェネレーターツール、シンプルなツールで美しいコンテンツカードを作る

概要 lightcard は、ユーザーが簡単に美しいコンテンツカードを作成できるように設計された、シンプルでエレガントなカード生成ツールです。このツールは、カスタムテキストコンテンツ、複数のテーマスタイル、QRコードに対応しており、作成がより簡単で楽しくなります。ユーザーは、タイトル、本文、作者を編集できます。
10ヶ月前
023.3K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent:AIインテリジェンスを迅速に構築するためのTypeScriptオープンソースフレームワーク

概要 VoltAgentはオープンソースのTypeScriptフレームワークで、AIインテリジェンスの迅速な構築とオーケストレーションを支援するために開発者向けに設計されている。モジュール化されたツールと標準化された開発モデルを提供することで、大規模な言語モデル(LLM)、ステート...
5ヶ月前
023.3K
无服务器快速部署Grok3国内镜像站

サーバーレス高速デプロイ Grok3国内ミラーサイト

概要 Grok Playgroundは、"Technical Crawling Shrimp "のチームによって開発されたオープンソースプロジェクトである。このツールの主な機能は、ユーザーがGrok3の国内ミラーサイトを10秒でデプロイできるようにすることです。 Grok3はxAIによって導入された人工知能モデルで、...
7ヶ月前
023.3K
TestDriver:使用AI自动测试软件的智能工具

TestDriver:AIを使った自動ソフトウェアテストツール

一般的な紹介 TestDriver は、人工知能技術を使用して開発者のソフトウェア・テストを支援するウェブサイトです。マウスをクリックしたり、テキストを入力したりといった人間の動作をシミュレートすることで、ソフトウェアのテスト作業を自動化する。サイトの中心には、本物の人間のように動作する「AIエージェントを使用したコンピュータ」がある...
6ヶ月前
023.3K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone:写真から半身のデジタル人物ビデオを生成するツール

はじめに ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトです。人工知能技術を用いて、1枚の写真と音声入力から、上半身の動きを含むデジタル人物ビデオを生成する。このプロジェクトは、頭の動きを生成する階層的な動き拡散モデルに基づいています...
7ヶ月前
023.3K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务

Bambo: 軽量で柔軟なインテリジェント・ボディのためのフレームワーク。役割とツールをシンプルに構成し、複数の負荷タスクを処理する。

一般的な紹介 Bamboは新しいタイプのプロキシフレームワークであり、主流のフレームワークよりも軽量で柔軟性が高く、様々な負荷タスクに対応できる。Bamboはツールカタログに全てのツールを定義し、非同期のカスタム関数を使用することで、効率的なプロキシ機能を実現している。ユーザーはllm_c...
10ヶ月前
023.3K
Austen:分析书籍角色关系并生成图表的AI工具

オースティン:本の登場人物の関係を分析し、グラフを生成するAIツール

概要 AustenはオープンソースのAIツールで、AngularフレームワークとAnalogjsの初期化、Mermaidjsの技術を組み合わせ、書籍の登場人物の関係を分析するためのチャートを生成します。ユーザーはOpen...
6ヶ月前
023.3K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFAビデオ:静止画を動画に変換するモーション・フィールド・アダプテーション技術

概論 MOFA-Videoは、生成的運動場適応技術を利用して静止画像を動的動画に変換する最先端の画像アニメーション生成ツールである。東京大学とTencent AI Labとの共同研究により開発され、2024年のEuropean Conference on Computer Vision (EV)で発表される。
9ヶ月前
023.3K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツール

一般的な紹介 MIDI-3DはVAST-AI-Researchチームによって開発されたオープンソースプロジェクトで、開発者、研究者、クリエイターのために1つの画像から複数のオブジェクトを含む3Dシーンを素早く生成します。このツールはマルチインスタンス拡散モデリング技術に基づいています。
7ヶ月前
023.3K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具

Feeds.Fun:自動的にタグ付けとフィルタリングを行うRSSフィード

一般的な紹介 Feeds.Funは、ユーザーが効率的にニュースを読むためのツールであり、自動的にニュースにタグを付けたり、ユーザーの好みに基づいてコンテンツをフィルタリングするなどのコア機能を備えています。開発者のAliaksei Yaletski(スクリーンネームTiendil)によって作成され、...
7ヶ月前
023.3K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档

クラウド文書変換:Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

概要 Cloud Document Converterは、Flying Bookのクラウド文書をMarkdown形式に変換するためのChrome拡張機能です。ユーザーはフライングブックのクラウド文書を簡単にダウンロードまたはコピーしてMarkdo...
11ヶ月前
023.3K
Deep Research Web UI:支持多语言深度研究的AI助手

ディープリサーチWeb UI:多言語でのディープリサーチをサポートするAIアシスタント

包括的な紹介 Deep Research Web UIは、AI技術に基づいたオープンソースのリサーチアシスタントツールであり、ユーザーがあらゆるトピックについて深い反復研究を行うことを支援するように設計されています。直感的なウェブインターフェースを通じて、検索エンジン、ウェブクローリング、大規模言語モデリングのパワーを組み合わせています...
7ヶ月前
023.3K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール

概要 Sketch-Genは、アーティストやデザイナーが高品質な線画やスケッチを素早く生成できるように設計された、AI技術ベースの線画・スケッチ生成ツールです。Paints-UNDOプロジェクトから生まれたこのツールは、高度な機械学習モデルを使用しています。
10ヶ月前
023.3K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

フラグメント:AnthropicのClaude Artifacts、Vercel v0、GPT Engineerのようなアプリケーションのオープンソース版。

概論 Fragments by E2Bは、Next.jsをベースとした、AIのみで生成されるアプリケーションを構築するためのテンプレートを提供するオープンソースプロジェクトです。このプロジェクトは、AIアプリケーションの開発プロセスを簡素化し、高速化するためにE2Bによって開発されました。このプロジェクトには、さまざまな現在のAIが統合されています。
11ヶ月前
023.3K
Go-Proxy:Docker集成的高性能反向代理服务器

Go-Proxy:Docker統合のための高性能リバースプロキシサーバー

包括的な紹介 Go-ProxyはGo言語を使って開発された高性能なプロキシサーバーで、主にさまざまなネットワーク環境でプロキシサービスを提供するために使用されます。HTTP、HTTPS、SOCKS5、WebSocket、TCP、UDPを含む様々なプロトコルをサポートし、プロキシサーバーとして使用することができます。
8ヶ月前
023.3K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

シンバ:文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG(Retrieval Augmentation Generation)システムとシームレスに統合できるように設計されたポータブルな知識管理システム(KMS)です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。
8ヶ月前
023.3K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
10ヶ月前
023.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine:オープンソースエンジン、FLUXの低既存デプロイメント用、Wan 2.1

一般的な紹介 DiffSynth-EngineはModelScopeによって立ち上げられたオープンソースプロジェクトで、GitHubでホストされています。拡散モデリング技術に基づいており、画像や動画を効率的に生成することに重点を置き、開発者が本番環境でAIモデルを展開するのに適しています...
7ヶ月前
023.2K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: 個別のプログラミング指導を提供するインテリジェントなティーチング・アシスタント

一般的な紹介 Coding-Tutorは、GitHubでホストされているオープンソースプロジェクトで、開発者のiwangjianによって作成され、学習者にパーソナライズされたプログラミング教育の経験を提供します。会話型AI技術を使用し、ユーザーの知識背景と...
8ヶ月前
023.2K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin

デビン・カーソルルール:デビンのために強化されたカーソルとウィンドサーフを作る

概要 Devin Cursor Rulesは、CursorおよびWindsurf統合開発環境(IDE)を、Devinと同様の高度なAI機能を実現するための設定ファイルやツールで拡張することを目的としたオープンソースプロジェクトです。このプロジェクトでは、Devinと同様の高度なAI機能を実現するための設定ファイルやツールを提供しています。
9ヶ月前
023.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: Ollamaのネイティブ・モデルと対話するためのクリーンなチャット・インターフェース

概論 HiOllamaは、PythonとGradioで構築されたユーザーフレンドリーなインターフェースで、Ollamaモデルと対話するために設計されています。リアルタイムのテキスト生成とモデル管理機能をサポートし、シンプルで直感的なウェブインターフェースを提供します。ユーザーは、温度などのパラメーターを調整することができます。
11ヶ月前
023.2K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain:リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。
8ヶ月前
023.2K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

リサーチラビット:ネイティブのLLMを使用し、ユーザーが指定したトピックに自動的にドリルダウンし、サマリーを生成するWebリサーチとレポート作成。

はじめに Research Rabbitは、LLM(Large Language Model)ベースのウェブリサーチおよび要約アシスタントです。ユーザがリサーチトピックを提供すると、Research Rabbitは検索クエリを生成し、関連するウェブ結果を取得し、これらの結果を要約します...
7ヶ月前
023.2K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: テキストフォーマットを維持したまま、PDFをHTMLにロスレス変換。

包括的な紹介 pdf2htmlEXは、PDFファイルをHTML形式に変換するために設計されたオープンソースのツールであり、PDFファイルの内容を分析し、HTML + CSSを使用して正確にその視覚効果を復元することにより、PDF文書は、ブラウザに変換されます。
11ヶ月前
023.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
5ヶ月前
023.2K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの核心は、人間のデモ・データを使って、コンピュータ・タスク、特にウェブ・ページ操作をこなすAIを訓練することである。このプロジェクトには3つのコードライブラリが含まれている。
7ヶ月前
023.2K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo:異なるAIインテリジェンスフレームワークをリアルタイムで連携させる統合プラットフォーム

Mahiloは、開発者Jayesh SharmaによってGitHubで公開されたオープンソースのマルチインテリジェンス統合プラットフォームであり、ユーザーが異なるフレームワークのAIインテリジェンスを接続し、リアルタイムのコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。この ...
8ヶ月前
023.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight:ポートレート画像の自然光レンダリング(未発表)

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは、物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します...
9ヶ月前
023.2K