最新のAIリソース

共 2759 篇文章
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

ARドローイング:ARとAI技術を使ってリアルな手描きのスキルを高めるアプリ

概要 AR Drawingは、拡張現実(AR)技術を使用して、ユーザーのデッサンスキルの向上を支援するアプリです。このアプリは、初級から上級レベルまでの様々な描画テンプレートをカバーする200以上のステップバイステップのガイド付き描画レッスンを提供しています。ユーザーは、携帯電話のカメラを使って画像を投影することができます...
11ヶ月前
025.6K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。
10ヶ月前
025.6K
Oliva:语音控制的多智能体产品搜索助手

Oliva:音声制御のマルチインテリジェンス製品検索アシスタント

概要 OlivaはDeluxerがGitHubで開発したオープンソースのマルチインテリジェンスアシスタントツールです。複数のAIインテリジェンスの連携により、Qdrantデータベースの商品情報検索を支援します。主な特徴は、音声操作に対応していることです...
7ヶ月前
025.6K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。ワンクリックのデプロイと軽量なゲートウェイ機構により、開発者が複雑なAIアプリケーションを素早く構築できるよう支援し、面倒なエンジニアリングの設定を省きます。
8ヶ月前
025.6K
Zonos:高质量语音合成与语音克隆工具

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。
8ヶ月前
025.6K
Folk:使用AI优化客户关系管理

フォーク:AIを使って顧客関係管理を最適化する

概 要フォークは、人工知能技術を組み合わせることで、よりスマートな顧客関係管理ソリューションをユーザーに提供します。AI機能は、ユーザーの生産性を向上させるために日常的なCRMタスクを自動化し、ユーザーがより正確なビジネス戦略を策定するのに役立つデータ分析を通じて洞察を提供します。
9ヶ月前
025.6K
Spline:交互式3D设计工具,在浏览器中生成专业级3D数字体验

Spline: ブラウザ上でプロ級の3Dデジタル体験を生成するインタラクティブな3Dデザインツール

概要 Splineは、デザイナーがブラウザ上で直接プロ仕様の3Dコンテンツを作成、編集、共有できる画期的なウェブベースの3Dデザインプラットフォームです。このプラットフォームは、直感的なユーザーインターフェイスと強力な機能セットを提供することで、従来の3Dデザインツールの複雑さを打破します。このプラットフォームを通じて...
10ヶ月前
025.6K
Glarity AI:对网页和视频快速总结的AI阅读助手

Glarity AI:ウェブページやビデオを素早く要約するAIリーディングアシスタント

Glarity 概要 Glarityは、動画やウェブコンテンツの要約と翻訳を効率的に行うAI搭載のリーディングアシスタントです。YouTube、Google検索、Twitter投稿、PDF、あらゆるウェブページの要約生成をサポートし、要約の質を高めます。
6ヶ月前
025.6K
VEED.IO:AI驱动的简单视频编辑平台

VEED.IO:シンプルなビデオ編集のためのAI搭載プラットフォーム

概論 VEED.IOはブラウザベースのビデオ編集プラットフォームで、AI技術により、プロフェッショナルなビデオを素早く作成することができます。初心者からプロのチームまで、直感的なインターフェースを提供し、複雑なソフトウェアを使わずに編集、字幕の追加、エフェクトの最適化を行うことができます。主な機能には、自動...
6ヶ月前
025.6K
Wrtn:优秀简洁的智能写作助手,提供常用写作模板与防御AI检测功能(韩语)

Wrtn:一般的な文章テンプレートと防御AI検出機能を提供する、優れたシンプルなインテリジェント文章アシスタント(韓国語)

概論 WrtnはAIベースのコンテンツ生成プラットフォームで、ユーザーが高品質なテキストコンテンツを素早く作成できるようデザインされています。学術論文であれ、ビジネス文書であれ、ソーシャルメディアへの投稿であれ、WrtnはパワフルなAIテクノロジーによってインテリジェントなライティングをサポートします。ユーザーはただ...
11ヶ月前
025.5K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます!

概論 Raycast-G4F(GPT4Free)は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...
9ヶ月前
025.5K
Luma Labs:Luma 系列视觉模型,使用丰富的自然语言描述来生成高质量图像和视频

Luma Labs: 豊富な自然言語記述を使用して高品質の画像やビデオを生成するビジュアルモデルのLumaファミリー

はじめに Luma Labsは、人工知能技術を用いた高品質な画像や映像の生成に特化した企業である。主な製品には、テキストからフォトリアリスティックな画像や動画を生成するツール、Luma PhotonとLuma Ray2があります。
8ヶ月前
025.5K
OpenAI Translator:多平台翻译增强工具|全局划词翻译

OpenAI Translator:マルチプラットフォーム翻訳強化ツール|グローバルストローク翻訳

概論 openai-translatorはOpenAIのChatGPT APIをベースに開発された翻訳支援ツールです。ブラウザプラグインとクロスプラットフォームのデスクトップアプリケーションがあります。翻訳、タッチアップ、要約の3つのモードをサポートし、55の異なる翻訳をカバーします。
1年前
025.5K
堆友:AI设计工具箱与创意平台

ヒープフレンド:AIデザイン・ツールキットとクリエイティブ・プラットフォーム

総合紹介 PileYouはアリババのデザインチームによって構築されたオンラインプラットフォームで、デザイナーやクリエイティブワーカーのために設計された様々なAIデザインツールを統合しています。このプラットフォームは、テキストから画像までのAI生成ツールを提供し、垂直産業デザインツール、PileYouカメラ、鹿クラスマーケティングチャート、AIアートキャラクター、モデルチェンジ...を含む。
1年前
025.5K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概論 Auto_Jobs_Applier_AIHawkは、人工知能技術を用いた求人検索の自動化ツールである。短時間で大量の履歴書を自動配信し、個人情報や求職の意図に応じてパーソナライズすることができます。このツールは、求職者の転職意欲を...
10ヶ月前
025.5K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star:画像とビデオの生成品質を向上させるオープンソースツール

包括的な紹介 CFG-Zero-starは、Weichen Fanと南洋理工大学のS-Labチームによって開発されたオープンソースプロジェクトです。誘導戦略とゼロ初期値を最適化することで、ストリーム・マッチング・モデルにおけるクラシファイア・フリー・ガイダンス(CFG)技術を改善することに焦点を当てています。
7ヶ月前
025.5K
Consensus:优秀的学术论文搜索引擎

コンセンサス:学術論文のための優れた検索エンジン

Consensusは、AI技術を使って科学研究論文を検索し、要約する検索エンジンである。このプラットフォームでは、ユーザーが「クレアチンは筋肉増強に役立つか?や「ポジティブシンキング瞑想は睡眠を改善できるか?といった質問をし、2億以上の科学論文から洞察を得ることができる。
1年前
025.5K
Relevance AI:让企业轻松创建AI助手的无代码平台

Relevance AI:企業がAIアシスタントを簡単に作成できるコード不要のプラットフォーム

概要 Relevance AIは、企業がAIアシスタントを簡単に作成できるプラットフォームである。プログラミングは不要で、誰でも電子メールの返信、データの整理、コンテンツの生成など、日常的なタスクのためのAIを設計するために使用することができる。このウェブサイトの目的は、企業がAIによって時間を節約し、効率を向上させることである。
7ヶ月前
025.5K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツール

概要 SegAnyMoは、カリフォルニア大学バークレー校と北京大学の研究者チームによって開発されたオープンソースプロジェクトで、Nan Huangなどのメンバーが参加している。このツールはビデオ処理に重点を置いており、ビデオ内の任意の動く物体、例えば人、動物、...を自動的に識別し、セグメント化することができる。
7ヶ月前
025.5K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...
8ヶ月前
025.5K
Blooper:智能生成脚本与分镜画面的创作工具

Blooper:スクリプトと分割画面をインテリジェントに生成するオーサリングツール

概論 BlooperはAIベースのオーサリングプラットフォームで、ビデオスクリプトやスプリットスクリーンの作成を支援することに重点を置いている。ツーク州バールに拠点を置くスイスのBlooper AI社によって開発され、広告、映画、テレビ業界のプリプロダクションをサポートするように設計されている。ネット...
7ヶ月前
025.5K
魔音工坊:专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

マジック・ボイス・ワークショップ:プロフェッショナル・ボイスオーバー&ショートビデオ・ナレーション作成プラットフォーム|リアル・パーソン・ボイスオーバー|クローン・ボイス|ワンクリックで映像化

総合紹介 マジックボイス工房は、ソフトウェアアフレコ、リアルアフレコ、サウンドライブラリ、クローンサービスなどの情報をワンストップで提供するショートビデオ・AIアフレコプラットフォームです。このプラットフォームは、音声編集、AIコピー生成、ビデオ編集、音声関連サービスやコンテンツ制作のためのコラボレーションツールを統合しています。ユーザーはオーディオ編集を体験...
1年前
025.5K
FliFlik:AI图片处理客户端,一键图像高清化、放大、降噪与水印去除

FliFlik:AI画像処理クライアント、ワンクリックで画像HD、拡大、ノイズ除去、透かし除去が可能

概要 FliFlikは効率的で便利なデジタル処理サービスを提供するマルチメディアソリューションプラットフォームです。写真、オーディオ、ビデオなど、FliFlikは高度なAI技術でそれらを最適化し、向上させることができます。このプラットフォームはWindows...
10ヶ月前
025.5K
Hyperspace(aiOS):分布式AI算力共享网络,aiOS生成式浏览器,深度知识智能体

ハイパースペース(aiOS):分散型AI演算共有ネットワーク、aiOSジェネレーティブ・ブラウザ、ディープ・ナレッジ・インテリジェンス

概要 Hyperspaceは、世界最大のピアツーピアAIネットワークに基づく革新的なジェネレーティブ・ブラウザ(aiOS)であり、深い研究と分析のための強力なツールをユーザーに提供するように設計されています。複数のAIモデルとデータソースを統合することで、Hyperspaceはユーザが素早くAIモデルを生成することを可能にします。
7ヶ月前
025.5K
Prompt Optimizer:优化主流AI模型提示词的开源工具

プロンプト・オプティマイザー:主流AIモデルのプロンプト語を最適化するオープンソースツール

概論 Prompt Optimizerは、GitHubのlinshenkxによって開発された、プロンプト単語の最適化に焦点を当てたオープンソースツールです。インテリジェントなアルゴリズムによってAIモデルのプロンプトワードを最適化し、生成されるコンテンツの品質を向上させます。
8ヶ月前
025.5K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID:画像をアップロードし、さまざまなスタイルの画像を生成するためにポートレート機能を移行する。

包括的な紹介 InstantIDは、1枚の参照ID画像を使用して、高い忠実度を確保しながら、パーソナライズされたスタイルやポーズの画像を数秒で生成することに焦点を当てた先進技術です。この技術は、顔画像とランドマークマップを統合することで、拡散モデルに基づいたソリューションを使用しています。
1年前
025.5K
code2prompt:将代码库转换为大模型可理解的prompt文件

code2prompt: コードライブラリをビッグモデルで理解可能なプロンプトファイルに変換する

一般的な紹介 code2promptは、開発者Mufeed VHによって作成され、GitHub上でホストされているオープンソースのコマンドラインツールで、ユーザーがコードベース全体をLarge Language Model(LLM)に適したプロンプト(プロンプト...
7ヶ月前
025.5K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ(VAE)により、このモデルは...
8ヶ月前
025.5K
Newsful:基于AI的金融新闻摘要网站

ニュースフル:AIベースの金融ニュースまとめサイト

はじめに Newsfulは、人工知能技術を利用して金融ニュースサービスを提供するオンライン・プラットフォームであり、世界中の企業ニュースや市場動向をリアルタイムで集約することに重点を置いている。自然言語処理(NLP)と機械学習技術を駆使し、複数のメディアソースから情報を抽出し、...
7ヶ月前
025.5K
ExamFul.AI:智能备考助手,助力AP、IB和A-Level考试,历年真题/论文和AI智能辅导

ExamFul.AI:AP、IB、Aレベル試験のためのインテリジェントな準備アシスタント、過去の試験問題/エッセイ、AIスマート個別指導

概要 ExamFulは、AP、IB、A-Levelの試験準備をする学生のために設計されたオンライン学習プラットフォームです。このプラットフォームは、過去の試験問題の豊富なリソースを提供し、AIインテリジェントチュータリングを組み合わせることで、学生が効率的に試験に備えることができます。知識の定着や難しい問題の解き方など、Ex...
12ヶ月前
025.5K
Outlier:参与AI模型训练的任务发布平台

Outlier:AIモデルのトレーニングに参加するためのタスク公開プラットフォーム

概 要 Outlierは、世界中の専門家を結びつけ、ユーザーがAIモデルのトレーニングや最適化に取り組めるよう支援するオンライン・プラットフォームである。ユーザーは専門知識を活用し、柔軟な収入を得ながらタスクをこなすことで、AI開発に貢献することができる。このプラットフォームは、様々なドメインのタスクをサポートしています...
6ヶ月前
025.5K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia Browser: ブラウザのタスクを自動化する統合AIツールにより、インテリジェントなブラウジング体験を提供(未公開)

概要 Dia Browserは、The Browser Companyが開発した新しいスマートブラウザで、高度なAIツールを統合することで、より効率的なブラウジング体験をユーザーに提供することを目的としている。このブラウザは2025年初頭に正式リリースされる予定で、主な機能は...
10ヶ月前
025.5K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni:マルチモーダル入力とリアルタイム音声対話のためのエンド計測モデル

包括的な紹介 Qwen2.5-Omniは、Alibaba Cloud Qwenチームによって開発されたオープンソースのマルチモーダルAIモデルです。テキスト、画像、音声、動画など複数の入力を処理し、リアルタイムでテキストや自然な音声による応答を生成することができる。このモデルは2025年の3 ...
7ヶ月前
025.5K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型

Moshi: 複数言語とアクセントをサポートするリアルタイム音声対話フレームワーク。

はじめに Moshi Chatは、フランスの非営利AI研究所Kyutaiが開発したエンドツーエンドのリアルタイムAI音声アシスタントです。リアルタイムで話を聞くだけでなく、自然な会話を行い、見る、聞く、話すといったマルチモーダルなインタラクションをサポートします。
1年前
025.5K
Diffus(GRAVITI Diffus):功能完整的原生云端 Stable Diffusion WebUI(NSFW)

Diffus (GRAVITI Diffus): フル機能のネイティブ・クラウド安定拡散WebUI (NSFW)

一般的な紹介 Diffusは、Stable Diffusionテクノロジーに基づいた、プロのクリエイターやアート愛好家のためのAI画像生成プラットフォームです。このサイトでは、ユーザーが簡単なヒントで高品質な画像を生成できるよう、豊富なモデル、拡張機能、ツールを提供しています...
12ヶ月前
025.5K
InboxPilot:学习公司内部知识自动化处理电子邮件的AI工具

InboxPilot:社内のナレッジを学習してメール処理を自動化するAIツール

概要 InboxPilotは、企業向けに設計されたAIメール自動化ツールで、社内のデータを活用してインテリジェントにメールを作成し、返信を送信します。時間を節約するだけでなく、顧客サービスの効率と質を向上させます。このツールは、特に大量のサポートを処理するのに適しています...
7ヶ月前
025.5K
反谱 - AI音乐转谱平台,支持音频文件转五线谱和简谱

Anti-score - AI音楽トランスクリプションプラットフォーム。

AntiSpectrumは、先進的なAI技術に基づき、オーディオファイル(MP3、FLACなど)をペンタトニックやシンプルな楽譜に変換する革新的なオンラインAI音楽変換プラットフォームです。AntiSpectrumにはボーカル分離機能があり、音楽中のボーカルと伴奏を分離し、音楽制作やミキシングを簡単にします。AntiSpectrumは、MIDIファイルの変換をサポートしています...
4ヶ月前
025.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。

概要 Chunkrは、PDF、PPTX、DOCX、ExcelファイルをRAG(Retrieval Augmented Generation)やLLM(Large Language Modelling)で使用するのに適したデータに変換するためのセルフホストAPIです。このプロジェクトはLumina...によって開発されました。
10ヶ月前
025.4K
Chikka:AI语音访谈快速获取用户深度洞察

Chikka:AIによる音声インタビューで、ユーザーの深い洞察を素早く得る

概論 Chikkaは、人工知能技術を利用したユーザー・インタビューとインサイト収集のためのオンライン・プラットフォームである。インタビュー概要を素早く設計し、大規模なパーソナライズド・インタビューを実施し、その結果を自動的に分析し、インテリジェントな音声アシスタントであるAvaを通じて隠れたテーマやレコメンデーションを発掘することができます。No...
7ヶ月前
025.4K
PDF.ai:解读法律协议、财务报告、书籍、科学论文等复杂的PDF文档

PDF.ai:法的契約書、財務報告書、書籍、科学論文などの複雑なPDF文書を解釈します!

包括的な紹介 PDF.aiは、人工知能技術を使ってPDF文書と対話するプラットフォームです。ユーザーはPDFファイルをアップロードし、AI技術を通じて文書と対話し、質問したり、要約を得たり、情報を検索したりすることができます。このプラットフォームは、法的契約書、財務報告書、書籍、科学的...
10ヶ月前
025.4K
Vega AI:专业的AI绘画工具,拥有特色图像姿态控制插件和风格训练

Vega AI:画像ジェスチャーコントロールプラグインとスタイルトレーニングを備えたプロフェッショナルAIペイントツール

総合紹介 Vega AIは、主にAIペイントと画像処理サービスを提供する専門的なAI作成プラットフォームです。ユーザーは、テキスト記述から画像を生成したり(テキストから画像へ)、画像を異なるスタイルに変換したり(画像から画像へ)、画質を向上させたりすることができます。
1年前
025.4K
AnkiAIUtils:メモリーカードを自動的に最適化する知的アシスタント、Ankiフラッシュカード学習AIツールセット

AnkiAIUtils:メモリーカードを自動的に最適化する知的アシスタント、Ankiフラッシュカード学習AIツールセット

概要説明 AnkiAIUtilsは、フラッシュカード学習システムAnkiのために設計されたAI強化ツールのセットです。医学生によって開発されたこのツールは、AI技術により、学習中にユーザーが苦手とするカードを自動的に改善するように設計されています。ユーザーにパーソナライズされた学習をインテリジェントに提供します。
10ヶ月前
025.4K
EnConvo:智能AI启动器,专为macOS设计的全能AI助手

EnConvo:インテリジェントAIランチャー、macOSのための本格的AIアシスタント

一般的な説明 EnConvoは、毎日のタスクを自動化することでユーザーの生産性を高めるように設計されたmacOS用のインテリジェントなAIアシスタントランチャーです。このプラットフォームは、150以上のビルトインツールとMCPサポートを統合し、ユーザーのワークフローを学習して適応します。
8ヶ月前
025.4K
ALog:便携AI语音日记应用,支持语音转文字。

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されている。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換します...
9ヶ月前
025.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-フォーリー - テンセントのオープンソース動画音源生成モデル

HunyuanVideo-Foleyは、TencentのMixed Yuanチームによるオープンソースのビデオサウンド生成モデルで、無音ビデオに正確にマッチした効果音を追加することをサポートします。このモデルは、大規模なデータセットのトレーニングに基づいており、マルチモーダル拡散コンバータアーキテクチャと、アライメント損失関数の表現とオーディオVAE最適化技術を組み合わせています...
2ヶ月前
025.4K
ANP:实现智能代理间安全高效通信的开源协议

ANP: インテリジェントエージェント間の安全で効率的な通信のためのオープンソースプロトコル

概要 AgentNetworkProtocol(略してANP)は、GitHubでホストされているオープンソースのプロトコルプロジェクトで、インテリジェントエージェント(AIエージェント)に安全で効率的な通信ソリューションを提供することに焦点を当てている。このプロトコルは、アイデンティティと暗号化という3つのレイヤーから構成されています。
7ヶ月前
025.4K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse:各タイプのドキュメントをLLMで利用可能なデータに解析し、表や写真などドキュメント内のすべての情報をそのまま保存する。

概論 MegaParseは、Large Language Model (LLM)のデータ処理を最適化するために設計された、パワフルで多機能な文書解析ツールです。MegaParseは、テキスト、PDF、PowerPointプレゼンテーション、Word文書など、どのような文書を扱う場合でも...
10ヶ月前
025.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen:マルチモーダル入力を用いた統一的な画像生成モデルによる、文字の一貫性を保った画像生成

概論 OmniGenはVectorSpaceLabによって開発された「ユニバーサル」画像生成モデルであり、ユーザーは簡単なテキストプロンプトやマルチモーダル入力で、多様で文脈に富んだ視覚効果を作成することができる。OmniGenは、特に、...を認識する必要があるアプリケーションに適しています。
11ヶ月前
025.4K
Moffee:将Markdown转为PPT幻灯片

Moffee:マークダウンをPPTスライドショーに変換する

一般的な紹介 Moffeeは、Markdownファイルを素早く、簡単かつ効率的にプロフェッショナルなスライドショーに変換するオープンソースツールです。ユーザはMarkdownコンテンツを書くだけで、Moffeeはレイアウト、ページ分割、スタイルを自動的に処理し、手作業でタイプセットする必要がなくなります。
7ヶ月前
025.4K
卡卡字幕助手(VideoCaptioner):基于LLM的智能字幕助手,一键生成高质量字幕

VideoCaptioner: LLMベースのインテリジェント・キャプション・アシスタント!

概論 カカ・キャプションアシスタント(VideoCaptioner)はLarge Language Model (LLM)に基づいたインテリジェントなビデオキャプション処理ツールです。高性能GPUを使用せず、ワンクリックで高品質な字幕を生成することができ、字幕生成、文節分割、最適化、翻訳の全プロセスをサポートします。字幕生成、文節分割、最適化、翻訳の全プロセスをサポートします。
11ヶ月前
025.4K
Reor:AI个人知识管理工具,自动链接、语义搜索和AI闪卡

Reor:自動リンク、セマンティック検索、AIフラッシュカードを備えたAIパーソナル知識管理ツール

一般的な紹介 リオールは個人向けに設計されたナレッジ・マネジメント・ツールで、AI技術を使ってユーザーのノートの整理と管理を支援する。インターネットに接続することなく、すべてのデータとモデルがローカルで実行されるため、プライバシーとセキュリティが確保されていることが主な特徴です。ユーザーは、メモを書いたり、コンテンツを検索したり、パス...
7ヶ月前
025.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: 実物理ベースの4Dダイナミックワールドシミュレーションのためのオープンソース生成物理エンジン

一般的な紹介 Genesisは、汎用ロボティクスと具現化AI学習のために設計された生成物理ワールドです。Genesisは、様々な材料や物理現象のシミュレーションをサポートする統一されたシミュレーション・プラットフォームを提供します。
10ヶ月前
025.4K
Waifu2x Extension GUI:深度学习技术放大、修复图像与视频插帧(Windows x64)

Waifu2x拡張GUI: ディープラーニング技術による画像とビデオの拡大、修復、補間 (Windows x64)

一般的な説明 Waifu2x-Extension-GUIは、画像、GIF、ビデオの超解像ズームとビデオフレーム補間用の深層畳み込みニューラルネットワーク技術を利用した強力な画像およびビデオ処理ツールです。このツールは複数のアルゴリズムとエンジンをサポートしており、Wai...
10ヶ月前
025.4K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは、極めてシンプルなRAG(Retrieval Augmented Generation)フレームワークであり、ヘテロジニアスグラフインデキシングと軽量なトポロジー拡張検索によって、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究室(HKUDS)によって開発され、...
9ヶ月前
025.4K
DearBook:一键生成多人朗读的儿童插画故事绘本

DearBook:ワンクリックで複数の読者に向けた絵本の読み聞かせが可能

はじめに DearBookは、人工知能技術を利用し、魔法のような童話を創作するためのウェブサイトです。ユーザーは簡単な操作で、ユニークでクリエイティブな物語の内容やイラストを生み出すことができます。このサイトの目標は、誰もが簡単に自分だけの物語を作れるようにすることです。
10ヶ月前
025.4K
Craft:内置AI助手进行文档总结和语法检查的写作工具

Craft:文書要約と文法チェックのためのAIアシスタントを内蔵したライティングツール

概要 Craft は、ユーザーが効率的に情報を記録、整理、共有できるように設計された、強力なノート・文書管理ツールです。個人的な使用でも、チームでの共同作業でも、Craftはスムーズな操作性と豊富な機能を提供します。ユーザーはデバイス間でシームレスにペンを同期することができます...
1年前
025.4K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...
8ヶ月前
025.4K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム

概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。
6ヶ月前
025.4K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT:ワークフロー自動化と自律的タスク実行のためのインテリジェントな身体構築プラットフォーム

包括的な紹介 AutoGPTは、継続的に稼働するAIエージェントの作成、導入、管理を支援し、複雑なワークフローを自動化するために設計された強力なプラットフォームです。Significant Gravitas社によって開発されたこのプラットフォームは、幅広いツールと機能を提供し、ユーザがAIエージェントに集中できるようにします。
10ヶ月前
025.4K
Copy.AI:智能营销文案生成工具,适合营销自动化和电商文案写作

Copy.AI:マーケティングオートメーションとeコマースコピーライティングのためのインテリジェントなマーケティングコピー生成ツール

Copy.ai一般紹介 Copy.aiは、マーケティングとセールスチームのために設計された人工知能プラットフォームです。ブログ記事、ソーシャルメディア投稿、Eメール、商品説明、広告コピー、その他あらゆるタイプのコンテンツを書く必要があるかどうかにかかわらず、Copy.aiはあなたのためにそれを行うことができます...
1年前
025.4K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM:大規模言語モデルの推論と処理のための効率的な軽量フレームワーク

包括的な紹介 LightLLMはPythonベースのLarge Language Model (LLM)推論とサービスのフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られています。このフレームワークは、FasterTransfor... を含む様々な有名なオープンソースの実装を活用しています。
8ヶ月前
025.4K
小视频宝(ClipTurbo):一键生成高质量营销短视频

ClipTurbo:ワンクリックで高品質のマーケティングビデオを作成!

はじめに ClipTurboは、ユーザーが簡単に高品質なマーケティングビデオを作成できるように設計された、AIを活用したショートビデオ生成ツールです。ClipTurboは、AI技術を活用することで、コピー、翻訳、アイコンのマッチング、TTS音声合成をm...
9ヶ月前
025.3K
Privatemode:提供端到端加密的AI聊天应用,保护企业数据隐私

Privatemode:企業データのプライバシーを保護するエンドツーエンドの暗号化を提供するAIチャットアプリ

一般的な紹介 Privatemode AIは、データプライバシーとセキュリティに焦点を当てたジェネレーティブAIサービスプラットフォームであり、ユーザーがプライバシー漏洩を恐れることなく機密データを処理できるように設計されています。データの送信、保存、処理中は、機密コンピューティング技術により常に暗号化されます。
8ヶ月前
025.3K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: ツリーベースの会話を可視化するAIチャットインターフェース

概要 TreeGPTは、Next.jsをベースとしたオープンソースのチャットアプリケーションです。大規模な言語モデル(LLM、GPTなど)の会話を、ツリーグラフ構造(有向非循環グラフ、DAG)を通して可視化することに重点を置き、従来の直線的なチャット手法に取って代わることで、スピードと...
8ヶ月前
025.3K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台

ファ・シン・バオ:AI法律顧問、人工知能法律相談、百度AI法律プラットフォーム

全面的な紹介 LawXinbaoは百度によって創始されたインテリジェント法律サービスプラットフォームであり、先進的な人工知能技術と専門的な法律知識ベースを統合している。当プラットフォームは、ユーザーに便利で専門的な法律インテリジェントサービスを提供することを目的としており、インテリジェントな法律Q&A、案件分析、契約書レビューなどの機能を備えています。ディープラーニング...
9ヶ月前
025.3K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge:LLMをローカルで実行し、微調整する最も迅速な方法!

概要 LlamaEdgeは、ローカルデバイスやエッジデバイス上で大規模な言語モデル(LLM)を実行し、微調整するプロセスを簡素化するために設計されたオープンソースプロジェクトです。このプロジェクトはLlama2ファミリーのモデルをサポートし、OpenAI互換のAPIサービスを提供します。
9ヶ月前
025.3K
WeShop唯象:AI商拍平台、服装模特拍摄、商品拍摄

WeShop:AI商業写真プラットフォーム、衣類モデル撮影、商品撮影

総合的な紹介 WeShopは中国初のAI商業写真プラットフォームであり、eコマース商品画像のインテリジェントな生成に焦点を当てている。モデル、カメラマン、物理的な場所を必要とせず、プロフェッショナルな商品画像を作成するソリューションを提供し、商品ディスプレイをより魅力的にします。顧客は低コストで高効率の商品画像制作を実現できる。
1年前
025.3K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型

GPT4Free: 複数のGPTモデルを自由に使用するためのAI対話ウェブサイトのインターフェイスをデコンパイルします。

GPT4Freeの概要 GPT4Freeは、開発者のxtekkyがGitHubで公開したオープンソースプロジェクトで、GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...など、さまざまな強力な言語モデルを無料で提供することを目的としています。
12ヶ月前
025.3K
Scam AI:识别和防范AI诈骗的智能工具,检测合成的图像、音频、视频

詐欺AI:AI詐欺を特定・防止するスマートなツール、合成された画像・音声・動画を検出

概論 Scam AIは、AI詐欺の特定と防止に焦点を当てたウェブサイトである。AI技術の急速な進歩に伴い、詐欺の手口はより巧妙になり、見分けることが難しくなっています。Scam AIは、様々な形態のAI詐欺を特定し、防止するためのツールやリソースを提供しています。
9ヶ月前
025.3K
Mango Animate:AI生成数字人讲解的白板动画演示视频

Mango Animate:AIが生成するデジタルヒューマン説明者のホワイトボードアニメーションデモビデオ

一般的な紹介 Mango Animateは、テキストを音声に変換するアバタービデオを作成するために構築された革新的なAIビデオ生成プラットフォームです。このプラットフォームは、Mango AI Video Generator、パワフルなアニメーションビデオ作成ツールMango AM...など、幅広いアニメーションソフトウェア製品を提供しています。
1年前
025.3K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: インタラクティブな画像編集ツール、ポイント&クリックとドラッグ&ドロップによる画像位置のコントロール

概要 DragGANは、Generative Adversarial Networks(GAN)をベースとしたインタラクティブな画像編集ツールである。Xingang PanらによってSIGGRAPH 2023で発表され、ポイント・アンド・クリックやドラッグ・アンド・ドロップの簡単な操作で直感的に操作できることを目的としている...
10ヶ月前
025.3K
BotGem(原名AMA/问天):优秀的手机端AI对话集成工具

BotGem(旧名:AMA/Ask the Sky):携帯電話向けの優れたAI対話統合ツール

BotGem 概要 BotGem(旧名:AMA/Ask the Sky)は、高度な自然言語処理技術を使ってユーザーのテキストメッセージを理解し、応答するインテリジェントなチャットアシスタントアプリです。質問、アイデアの共有、アドバイス、またはカジュアルなチャットなど、BotGe...
12ヶ月前
025.3K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替

HelloMeme:ローカルの忠実度の高い表現アクション一貫性のある画像やビデオを生成、Runway Act oneオープンソースピンポン!

包括的な紹介 HelloMemeはHelloVisionによって開発されたオープンソースプロジェクトであり、空間編み目アテンションを統合することによって、拡散モデルに高レベルで忠実なストリップを埋め込むことを目的としている。
10ヶ月前
025.3K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

概要 Agentic Securityは、開発者やセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースのLLM(Large Language Model)脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、LLM APを統合することができます。
8ヶ月前
025.3K
推荐Github优秀开源下载工具

推奨されるGithubの優れたオープンソース・ダウンロードツール

今日のインターネットの急速な発展において、ユーザーが情報やリソースを入手するための重要な手段として、ダウンロードツールは欠かすことのできない役割を果たしている。この記事では、5つのオープンソース・ダウンロードツールを系統的に分析する:AB Download Manager、XDM(Xtreme Download ...
1年前
025.3K
ZenUML:基于简单文本代码创建序列图和流程图

ZenUML: シンプルなテキストコードに基づくシーケンス図とフローチャートの作成

ZenUMLは、シーケンス図やフローチャートの作成に特化した、マルチプラットフォーム対応のダイアグラム・アズ・コード・ソリューションです。ブラウザ上でダイアグラムをリアルタイムにレンダリングすることで、サーバーサイドのインタラクションの遅延を回避し、非効率的なドラッグ&ドロップ操作や読み込みの遅いアニメーションによってユーザーの思考プロセスが中断されることを防ぎます。
10ヶ月前
025.3K
Sidekick CLI:一个开源的 Claude Code 替代工具

Sidekick CLI: オープンソースのクロードコード置き換えツール

概要 Sidekick CLIは、AIの支援により開発者のプロジェクト開発とデプロイプロセスを簡素化するために設計されたオープンソースのコマンドラインツールです。Claude Code、Copilot、Cursorにインスパイアされ、同様の機能を提供しています。
6ヶ月前
025.2K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: 自然言語対話をサポートする軽量データベース可視化管理ソフトウェア

概要 WhoDBは、データベース管理タスクを簡素化するために設計された、軽量(~20MB)で強力かつユーザーフレンドリーなデータベース管理ツールです。Adminerのシンプルさと、ユーザーエクスペリエンスとパフォーマンスの向上を兼ね備えています。
11ヶ月前
025.2K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: 無音ビデオに鮮やかな同期サウンドを追加する

一般的な紹介 FoleyCrafterは、OpenMMLabによって開発されたオープンソースプロジェクトで、無音ビデオのための鮮明で同期された効果音を生成します。このプロジェクトでは、高度な人工知能技術を用いて、ビデオの内容を分析することにより、意味的に関連性のある、時間的に同期した効果音を生成します...
10ヶ月前
025.2K
5ire:支持本地向量知识库的跨平台大模型桌面客户端

5ire: クロスプラットフォームのビッグモデル・デスクトップクライアント、ローカルベクター知識ベースをサポート

概論 5ireはオープンソースのクロスプラットフォーム・ビッグモデル・デスクトップクライアントであり、ユーザーに便利なローカルベクター知識ベース管理とビッグモデルとのインタラクション機能を提供するように設計されている。このソフトウェアは、強力な検索機能付き生成(RAG)機能により、複数のドキュメントフォーマットの解析とベクトル化された保存をサポートします。さらに、5i...
12ヶ月前
025.2K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス

概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがChromeエクステンションとNode.jsサービスを通じて、ログ、ネットワークリクエスト、ブラウザアクティビティをリアルタイムで監視することを可能にします。
7ヶ月前
025.2K
Glama:集成1000+MCP服务的多功能AI聊天工具

Glama:1000以上のMCPサービスを統合する多機能AIチャットツール

概論 Glamaはパワフルで使いやすいAIチャットツールです。様々なAIモデルとの会話をサポートするだけでなく、ファイルのアップロード、ウェブでの情報検索、さらにはプロフェッショナルなチャートの生成も可能です。企業チームや開発者、個人ユーザーなど、情報やタスクを効率的に処理する必要のあるユーザーを対象としています。
7ヶ月前
025.2K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa:高忠実度モデルのバーチャル試着とキャラクターポーズ調整、メタ・オープンソース制御キャラクター画像生成モデル

包括的な紹介 Leffaは、制御可能なキャラクター画像を生成するための統一されたフレームワークであり、キャラクターの外見(バーチャルフィッティングなど)やポーズ(ポーズ転送など)の精密な操作を可能にする。このフレームワークは、ターゲットクエリをアテンション層の正しい参照キーにフォーカスさせることで、細かいディテールの歪みを大幅に低減する。
10ヶ月前
025.2K
Unscreen:自动移除视频背景,轻松制作无背景视频

アンスクリーン:ビデオの背景を自動的に削除し、背景のないビデオを簡単に作成できます。

Unscreenは、自動的にビデオの背景を削除することに焦点を当てた強力なオンラインツールです。ユーザーはビデオをアップロードするか、ビデオへのリンクを提供するだけで、Unscreenは自動的にそれを分析し、複雑なことなく背景を削除します。このツールは、.mp...を含む幅広いビデオフォーマットをサポートしています。
11ヶ月前
025.2K