AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

免费开源TTS哪家强?10款最佳文本转语音项目深度评测

音声合成プロジェクトのベスト10を徹底レビュー

--オープンソース音声合成(TTS)プロジェクト:アプリケーションにリアルな「音」を注入する 人工知能の波の中で、音声合成(TTS)技術はデジタル世界と人間の感覚をつなぐ重要な架け橋となっている。音声合成(TTS)技術は、デジタル世界と人間の感覚をつなぐ重要な架け橋となっている。インテリジェント・アシスタントにおける人間とコンピュータの対話から、ナビゲーション...
1年前
0128.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX:マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ

包括的な紹介 MedRAXは、胸部X線(CXR)解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。
1年前
067.3K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。

LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...
1年前
070.9K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。
1年前
050.8K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki:リアルタイム音声翻訳モデル、元の音声の特徴を保持したストリーミング翻訳

一般的な紹介 Hibikiは、Kyutai Labsによって開発された高忠実度のリアルタイム音声翻訳モデルです。従来のオフライン翻訳機とは異なり、Hibikiはユーザーが話している最中にリアルタイムでターゲット言語の自然な音声翻訳を生成し、テキスト翻訳も提供することができます。このモデルは...
1年前
066.6K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます!

概要 Qwen4MacはQwen Large Language Model (LLM)をMacのメニューバーに統合し、ユーザーがいつでも簡単に呼び出して使えるようにするために設計されたオープンソースプロジェクトです。このプロジェクトは、andreaturchetによって開発・保守されており、ユーザが簡単にQwenを...
1年前
055.3K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI:DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。

ポケットAI(PocketPal AI中国語版)は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。スモール・ランゲージ・モデル(SLM)をベースにしており、インターネット接続のない携帯電話で動作し、特に中国のユーザー体験に適応しています。口...
1年前
0123.3K
域名 AI.com 重定向到chat.deepseek.com

ドメイン AI.com chat.deepseek.com へのリダイレクト

AI.comドメイン名は、まさにドメイン名界の「肉じゃが」であり、誰もが欲しがっている。考えてみれば、2文字で、最もホットなAIの側面を持つドメイン名は、まさに "金看板 "である。 以前は "妾を選ぶ "ようなものだったが、一瞬後にはOpenAIのChatGPTに飛びついた...。
1年前
064.4K
Pulse:文档处理与数据提取的商业解决方案

パルス:文書処理とデータ抽出のためのビジネスソリューション

Pulseは、文書処理とデータ抽出に特化したインテリジェントなプラットフォームで、企業や開発者がさまざまな複雑な文書を効率的に解析・処理できるように設計されています。高度なコンピュータビジョンとマルチモーダル処理技術により、Pulse はテキスト、画像、表、その他多くのデータから正確にデータを抽出することができます。
1年前
054.4K
LLM OCR 的局限性:光鲜外表下的文档解析难题

LLM OCRの限界:華やかさの下にある文書解析の課題

RAG(Retrieval Augmented Generation:検索拡張生成)システムを必要とするアプリケーションにとって、巨大なPDF文書を機械可読なテキストの塊にすること(「PDFチャンキング」とも呼ばれる)は大きな頭痛の種だ。 市場にはオープンソースのソリューションも商用製品もあるが、正直なところ......。
1年前
056.4K
Turnitin:学校常用学术诚信与原创性检测工具

Turnitin:学校共通のアカデミック・インテグリティとオリジナリティのテストツール

一般的な紹介 Turnitinは、教育者と学生のために設計されたアカデミックインテグリティとオリジナリティ検出プラットフォームです。Turnitinの主な機能には、剽窃の検出、文章の質の向上、および学術論文のオリジナリティの確保を支援するさまざまなツールがあります。
1年前
055.3K
IsGPT:免费、快速、可靠的英文AI内容检测工具

IsGPT:無料、高速、信頼性の高い英語AIコンテンツ検出ツール

包括的な紹介 IsGPTは、GPTのようなAIによって生成されたテキストコンテンツの検出に特化した無料のAIコンテンツ検出ツールです。このツールは、MIT CSAILによってインキュベートされ、既存のAIコンテンツ検出ツールの欠点を解決することを目的としています。IsGPTは、テキストとの関連において、テキストの当惑度と突発性を分析することによってテキストを分析します。
1年前
066.6K
Agentic Object Detection:无需标注和训练的视觉目标检测工具

エージェントによる物体検出:注釈やトレーニングを必要としない視覚的物体検出ツール

包括的な紹介 Agentic Object Detectionは、Landing AIによる先進的なターゲット検知ツールです。このツールは、テキストプロンプトによって検出を実行するため、データアノテーションやモデルトレーニングが不要となり、従来のターゲット検出のプロセスを大幅に簡素化します。
1年前
056.7K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll:個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード

概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllはローカルで動作する健康アシスタントを提供し、ユーザーがより良く管理できるようにします。
1年前
057.1K
疑似将 o3-mini 原始推理过程(COT) 进行摘要的提示词

o3-miniの原始推論プロセス(COT)を要約すると思われるキューワード

重要なことは、o3モデルのオリジナルの推論プロセスはユーザーには表示されず、「要約」された推論プロセスが表示されるということです。要約された推論プロセスは、よりユーザーフレンドリーで簡潔です。 最近、o3シリーズの推論プロセスを処理するためのシステムプロンプトのリークが疑われています。
1年前
055.1K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: シンプルなLLMモデルの微調整とデータ合成ツール!

包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxシステムをサポートする直感的なデスクトップアプリケーションを提供し、LLMのゼロコード実装を可能にします。
1年前
070K
端脑云 DeepSeek 大语言模型免费试用,私域大模型服务器预装满血版 DeepSeek R1!

Endbrain Cloud DeepSeekビッグ言語モデル無料トライアル、プライベートドメインビッグモデルサーバーには、DeepSeek R1のフルブラッドバージョンがプリロードされています!

今日のデジタル時代において、人工知能技術はかつてない速度で私たちの生活や仕事のやり方を変えつつあります。人工知能の分野において、DeepSeekビッグ言語モデルは、その卓越した性能と革新性により、急速に業界の注目の的となっています。エンドブレインクラウドは、このDeepSeekモデルを...
1年前
051.5K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

概要 Agentic Securityは、開発者やセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースのLLM(Large Language Model)脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、LLM APを統合することができます。
1年前
061.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...
1年前
063.8K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。
1年前
0173.5K
Anthropic 发布规则分类器:有效防御大语言模型越狱攻击,参与测试领奖金!

Anthropicがルール分類器をリリース:大規模言語モデルの脱獄攻撃に対する効果的な防御、ボーナスのためのテストに参加!

AI技術の急速な発展により、大規模言語モデル(LLM)はかつてないスピードで私たちの生活を変えつつある。しかし、技術の進歩は新たな課題ももたらしている。LLMは悪意のある目的に悪用され、有害な情報を流出させたり、化学兵器、生物兵器、放射性物質兵器、核兵器の製造に利用される可能性さえあるのだ...。
1年前
045.2K
DeepSeek API 大规模应用硬盘缓存技术:大模型平民化的关键一步

ハードディスク・キャッシング技術のDeepSeek API大規模アプリケーション:大規模モデルの民生化における重要な一歩

-- ビッグモデルAPIの価格競争におけるディープ・ロジック、ユーザー・エクスペリエンスの最適化、そしてテクノロジー・インクルージョン AIビッグモデルの分野で激しい競争が繰り広げられるなか、ディープシークは先ごろ、同社のAPIサービスがハードディスク・キャッシュ技術を革新的に採用していることを発表し、その後、衝撃的な価格調整を提示した...
1年前
077.3K
微软“画图”应用也将加入“Copilot”按钮,Windows Insider 测试用户可抢先体验

マイクロソフトの "ペイント "アプリには "Copilot "ボタンも追加され、Windows Insiderテスターはその一部を覗くことができる!

Windows Insiderのユーザーは、まもなく別の新しいアプリでCopilotアイコンを目にすることになる。新しくロールアウトされたアップデートのおかげで、CanaryチャンネルとDevチャンネルのInsiderテストユーザーには、AIが動作するこの新しいボタンが表示されます...
1年前
044K
基于RAG构建提供健康建议的小助手(实验项目)

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築(パイロット・プロジェクト)

概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...
1年前
049.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
1年前
060.9K
DeepSeek 多模态大模型 Janus-Pro 一键安装包,附使用教程

DeepSeekマルチモーダル大規模モデルJanus-Proチュートリアル付きワンクリックインストールパッケージ

本日は、DeepSeekのJanusシリーズの最新バージョンである、強力なオープンソースのマルチモーダルモデル、Janus-Proをご紹介します。Janus-Proは、写真を読み取って質問に答えるだけでなく、テキストの説明に基づいて写真を生成することもできます。つまり、GPT-4のようなものを統合しているのです...
1年前
069.2K
Raphael:免费无限制的使用 FLUX.1-Dev 生成图像

Raphael:FLUX.1-Devで画像を無料で制限なく生成!

概要 Raphaelは、FLUX.1-Devモデルを搭載した、世界初の完全無料・無制限のAI画像ジェネレーターです。Raphaelは、FLUX.1-Devモデルを使用した、世界初の完全無料・無制限のAI画像ジェネレーターです。ユーザーは、登録や使用制限なしに、テキスト記述から高品質の画像を生成することができます。
1年前
0112.7K
Sigma AI Browser:免费使用主流大模型的AI浏览器

シグマAIブラウザー:主流のビッグモデルを使用するための無料のAIブラウザー

概要 Sigma AI BrowserはSigmaBrowser OÜによって開発された先進的なブラウザで、人工知能技術を活用し、より高速でスマートなブラウジング体験をユーザーに提供します。このブラウザは、スピードと効率性だけでなく、セキュリティの強化やパーソナル...
1年前
086.4K
DeepSeek 实战:三步搞定知识图谱构建 - 单篇提取、多篇融合、主题生成

DeepSeekハンズオン:3つのステップによる知識グラフの構築 - 単一抽出、複数パートの融合、トピック生成

質問:ナレッジグラフは重要であり、DeepSeek言語モデルはホットですが、ナレッジグラフを迅速に構築するために使用できますか?DeepSeekがどのように情報を抽出し、知識を統合し、何もないところからグラフを作成できるのか、実際に試してみたい。 方法:私は3つの実験を行い、...
1年前
096.7K
One-Prompt-One-Story:文本提示生成角色身份一致的图像

ワン・プロンプト・ワンストーリー:テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す

Synthesis One-Prompt-One-Story(1Prompt1Story)は、1つのプロンプトから一貫した画像を生成できるように設計された革新的なテキストから画像への生成ツールである。ICLR 2025でTao Liuらによって発表された。
1年前
053.7K
DeepSeek 论战:中国在成本、真实训练成本、闭源模型利润影响方面的领导地位

DeepSeek討論会:コストにおける中国のリーダーシップ、実際のトレーニングコスト、クローズドソースモデルの利益への影響

キーワード:H100価格高騰、補助金による推測価格、輸出規制、MLA ディープシークの語りが世界を席巻 ディープシークが世界を席巻している。この1週間、ディープシークは世界中の誰もが語りたがる唯一の話題となっている。現在、D...
1年前
047.7K
突破信息孤岛:Dify为本地化DeepSeek AI助手添加联网搜索

情報のサイロ化を打破:ディファイ、ローカライズされたAIアシスタントDeepSeekにコネクテッド検索を追加

自己完結型で機密性が高く、ローカルのテキストを分析し、いつでも正確な会話を提供し、ネットワーク検索機能を持つプライベートAIアプリケーションを持つことを想像してみてほしい。この記事では、DeepSeek + Ollamaの構築プロセスをステップ・バイ・ステップでご紹介します。
1年前
068.3K
Kimi与豆包深度对比评测——到底哪个好用?

キミとビーンバッグ 徹底比較レビュー - どっちがいい?

-自分に合ったAIアシスタントを選ぶには? ビッグモデル時代の到来とともに、さまざまなメーカーが独自のAIアシスタントを発表している。その中でも「Kimi」と「Doubao」は独自の長所を持つ製品として注目を集めている。本稿では、インターフェイス、機能、回答品質、使用経験、生...
1年前
0252K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。
1年前
057K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

一般的な紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む複数のファイル形式をサポートしています。
1年前
065.3K
告别DeepSeek卡顿:独家秘笈解锁R1流畅体验,联网离线全搞定!

DeepSeekのラグにサヨナラ:限定シークレットが、オンラインでもオフラインでもスムーズなR1体験を解き放つ!

まだDeepSeekの公式R1の「後でもう一度お試しください」に悩まされ、血圧が急上昇するまでラグが続いていますか?ご心配なく、あなたは一人ではありません!昨日、私はSilicon Flow + ChatboxAIを使ってDeepSeekの公式ラグから解放される方法を紹介しました。
1年前
048.3K
国家超算互联网正式上线 DeepSeek R1,打造全民可及的智能基础设施

ナショナル・スーパーコンピューティング・インターネットがDeepSeek R1で稼動、誰もがアクセス可能なスマートインフラを構築

最近、国家スーパーコンピューティング・インターネット・プラットフォームは、DeepSeek-R1、V3、Coderなどのシリーズを含むDeepSeekが開発した多数の大型モデルを正式に発表した。その中で、小型版のDeepSeek-R1は、ワンクリック推論サービスを提供し、ユーザーは...
1年前
041.8K
Rowfill:批量提取文档结构化信息并自动化分析

ロウフィル:文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model(LLM)とOpe...
1年前
054.4K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(LLM)のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。
1年前
061.1K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPTリサーチャー:ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。
1年前
051.3K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
1年前
089.6K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave:インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。
1年前
053.1K
Botnow:AI 智能体创作与分发平台,助力智能营销与智慧办公

ボットナウ:スマートマーケティングとスマートオフィスのためのAIインテリジェントボディ作成・配信プラットフォーム

包括的な紹介 Botnowは、プラグイン、ナレッジベース、ワークフローを通じて、開発者が高品質なインテリジェンスを低い敷居で迅速に構築できるように設計された、次世代のAIインテリジェンス作成および配布プラットフォームです。このプラットフォームは、サードパーティのプラットフォームへのインテリジェンスの公開をサポートし、APIチューニングを提供します。
1年前
052.6K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: 複数のAIモデルを簡単に統合し、Gradioに基づいたマルチモーダル・アプリケーションを構築する

概論 ai-gradioはオープンソースのPythonツールキットで、開発者が複数のAIモデルを簡単に統合して使用できるように設計されています。Gradio上に構築されたこのプロジェクトは、複数のAIモデルとサービスをサポートするための統一されたインターフェースを提供します。テキスト、音声、動画のいずれでも...
1年前
055.7K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher:完全な調査レポートを書くための自動詳細調査ツール

概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResear...
1年前
056.4K
OpenAI 放大招,要用 AI 硬件革了智能手机的命!

オープンAIは、AIハードウェアでスマートフォンに革命を起こそうとしている!

2007年、スティーブ・ジョブズが初代iPhoneを空から取り出し、スマートフォンの新時代を切り開いたことを覚えているだろうか。それから10年以上が経過し、スマートフォンはますます高性能になっているが、技術革新のボトルネックには到達していないようだ。テクノロジーは殻の変化の上に成り立っている」と誰もが嘆いている矢先、オプ...
1年前
047K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara:視覚的埋め込みベースの文書保管・検索サービス

概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。光学式文字認識(OCR)やテキスト抽出の必要性をなくし、フォームの破損や画像の紛失といった問題を回避します。ColiVaraは、PDFを含む100以上のファイルフォーマットをサポートしています。
1年前
059.8K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Cursor Reset: Cursorバージョン0.45.x以上のデバイス識別子をリセットするスクリプト。

概要 Cursor Reset は、Cursor IDE でデバイス識別子をリセットするための PowerShell スクリプト・ツールで、Cursor バージョン 0.45.x をサポートしています。このツールは、ユーザーが Cursor IDE のデバイス識別子をリセットできるように設計されています。
1年前
099.9K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...
1年前
089.4K
Julep AI:使用DSL构建多步骤智能体工作流的AI云平台

Julep AI: DSLを使用したマルチステップ・インテリジェント・ボディワークフロー構築のためのAIクラウドプラットフォーム

概要 Julep AIは、過去のやり取りを記憶し、複雑なマルチステップタスクを実行するAIインテリジェンスを作成・管理するためのプラットフォームです。Julep AIは、長期記憶とマルチステッププロセス管理機能を提供し、外部ツールやAPIとの統合をサポートしています。
1年前
057.2K
DeepSeek 美国版和中国的区别?

DeepSeek米国版と中国版の違い?

主な違いは検閲のレベルで、英語のコンテンツは当然ながら中国語のコンテンツよりもフィルタリングされていない。 中国語の回答のトーンは「正しい考え方」に偏っている。米国市場では、欧米ユーザーの情報ニーズを満たすために...
1年前
063.2K
Gemini Teacher:英语口语发音纠正助手

ジェミニ・ティーチャー:英語スピーキング発音矯正アシスタント

概要 Gemini Teacherは、Google Gemini AIに基づいた英語スピーキング練習アシスタントです。ユーザーの英語の発音をリアルタイムで認識し、即座にフィードバックと修正案を提供します。このツールは、ユーザーが英語のスピーキングスキルを向上させるために設計されています...
1年前
073.1K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive:教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...
1年前
082.3K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 視覚言語モデルの汎化能力のための低コスト強化学習

包括的な紹介 R1-Vは、低コストの強化学習(RL)を通して視覚言語モデリング(VLM)のブレークスルーを達成することを目的としたオープンソースプロジェクトです。このプロジェクトは、VLMが一般的な計数能力を学習する動機付けとなる、検証可能な報酬メカニズムを利用している。驚くべきことに、R1-Vの2B ...
1年前
063.6K
llms.txt:为大语言模型提供标准化网站信息文档

llms.txt:大規模言語モデルのための標準サイト情報ドキュメント

包括的な紹介 llms.txtは、Large Language Models (LLM)のために特別に設計された標準化された文書フォーマットです。LLMが推論プロセスで簡単かつ効率的に使用できる、簡潔で構造化された情報をウェブサイトが提供できるようにします。この仕様は、CloudflareとAnthropiによってサポートされています。
1年前
065.4K
70% 完成度陷阱:AI 辅助编码的最后 30% 挑战

70%完成の罠:AIアシストコーディングのための30%最終チャレンジ

ここ数年、AIによる開発に深く関わってきて、興味深い現象に気づいた。エンジニアがAIを使うことで生産性が大幅に向上したと報告する一方で、私たちが日常的に使っている実際のソフトウェアが大幅に改善されたようには見えないのだ。何が起こっているのだろうか? その答えが明らかにしたのは、私たち...
1年前
055.1K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール

概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット(例:太字、斜体、色、スーパー...)を保持することをサポートしています。
1年前
078.5K
研究表明:RL 在学习可泛化知识方面优于 SFT,尤其在多模态任务中展现出更强的推理与视觉识别能力

RLは、特にマルチモーダル課題において、汎化可能な知識の学習においてSFTを上回り、より強力な推論能力と視覚認識能力を示すことが示された。

はじめに 人工知能の分野では、基本的なモデル(大規模言語モデルや視覚言語モデルなど)が技術進歩の原動力となっている。しかし、複雑で変化する様々な実世界のシナリオに適応できるように、これらのモデルの汎化能力をいかに効果的に向上させるかは、依然として大きな課題である。現在、教師あり...
1年前
042.6K
Go-Proxy:Docker集成的高性能反向代理服务器

Go-Proxy:Docker統合のための高性能リバースプロキシサーバー

包括的な紹介 Go-ProxyはGo言語を使って開発された高性能なプロキシサーバーで、主にさまざまなネットワーク環境でプロキシサービスを提供するために使用されます。HTTP、HTTPS、SOCKS5、WebSocket、TCP、UDPを含む様々なプロトコルをサポートし、プロキシサーバーとして使用することができます。
1年前
055K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab:人間とコンピュータのコラボレーションに関する反復的思考を探求するための実験的対話ツール

CoT-Labは、人間とコンピュータのコラボレーションにおける新しいパラダイムを探求するための実験的インターフェースです。CoT-LabはCognitive Load Theory(認知的負荷理論)とActive Learning Principles(能動的学習原理)に基づき、「シンキングパートナー」関係の構築を通じて、人間と人工知能(AI)の間の深い認知的連携を促進します。プロジェクトの目的は...
1年前
046.5K
DeepSeek R1 越狱:尝试突破 DeepSeek 的审查机制

DeepSeek R1の脱獄:DeepSeekの検閲を突破する試み

DeepSeek R1公式脱獄は、基本的にあらゆるタイプの検閲メカニズムをトリガーするための素晴らしい実験環境であり、多くの防御テクニックを学ぶことができる。そこで今回は、長年にわたる大きなモデルの脱獄の例を紹介する、大きなモデルの検閲メカニズム学習記事である。 大きなモデルの検閲メカニズムを通...
1年前
0227.7K
Humanize AI:免费将AI生成内容撰写为人类撰写的内容,绕过AI检测器

AIの人間化:AI検出器をバイパスして、AIが生成したコンテンツを人間が書いたコンテンツとして無料で書く。

概論 Humanize AIは、AIが生成したテキストを自然な人間の言葉に変換するために特別に設計されたオンラインツールです。このサイトでは、ChatGPT、Gemini、Bing、Jasper、Gram...を変換する高度なAIヒューマナイズツールを提供しています。
10ヶ月前
055.1K
20秒让你理解 DeepSeek-R1 与 ChatGPT 的差距有多大

ChatGPTとDeepSeek-R1の距離を20秒で理解する

大きなモデルの最も基本的な能力は、DeepSeek-R1とChatGPTがそれぞれソーシャルメディア・ブラストを書けるようにするために添付ファイルとしてアップロードされたドキュメント:OpenAI o3-miniシステム・マニュアル(中国語)で、以下の指示である(ここでは、まったく不適切なプロンプトを使用した...)。
1年前
050.8K