AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

向量数据库深度对比:Weaviate、Milvus 与 Qdrant

ベクトルデータベースの深さ比較:Weaviate、Milvus、Qdrant

人工知能や機械学習の分野では、特にRAG(Retrieval Augmented Generation)システムやセマンティック検索などのアプリケーションを構築する際、膨大な量の非構造化データを効率的に処理・検索することが極めて重要になる。ベクターデータベースは、この課題に対処するための中核技術として登場した。ベクターデータベースは、高次元データを格納するためだけのものではない。
7ヶ月前
015.7K
十方融海 小智AI 已跃居GitHub全球排行榜第一!

テンスクエアのロンハイ・シャオジーAIがギットハブのグローバルランキングでトップに躍り出た!

今日の急速に変化する技術の中で、人工知能(AI)は侮れない力として、私たちの生活と仕事のやり方を深く変えている。そして、AIの波が押し寄せている中、天升論海小子AI音声箱はその優れた性能と革新的なユーザー体験でGitHubのトップに躍り出た...
7ヶ月前
013.5K
解锁小红书营销密码:海外用户运营增长指南 (附PDF下载)

リトルレッドブック・マーケティングの暗号を解く:海外ユーザー事業拡大ガイド(PDFダウンロード付)

中国だけでなくアジアでも話題のソーシャルEコマースプラットフォーム「小紅秀」は、単なるショッピングアプリの域を超え、若者のライフスタイルの風見鶏となり、ブランドマーケティングの新たなポジションを確立して久しい。中国市場に参入したい、あるいは若い消費者にリーチしたいと考える海外のブランドや個人にとって、小紅樹を使いこなすことは...
7ヶ月前
09.9K
从 Cline 开始了解 AI Coding 工作原理

クラインからAIコーディングの仕組みを学ぶ

思いがけず、AIはプログラミング分野に半端ない変革の空を起こしている。v0、bolt.newから、Agantを組み合わせた様々なプログラミングツールCursorやWindsurfまで、AI CodingはアイデアMVPの大きな可能性を秘めている。より...
7ヶ月前
014K
LiveKit:构建实时音视频应用的开源工具

LiveKit: リアルタイムのオーディオおよびビデオアプリケーションを構築するためのオープンソースツール

包括的な紹介 LiveKitは、開発者がリアルタイムのオーディオおよびビデオアプリケーションを構築できるようにすることに重点を置いたオープンソースプロジェクトです。WebRTC技術をベースにしており、メディアサーバーや様々なクライアントSDKを含む完全なソリューションを提供します。LiveKitのコアは拡張可能な...
6ヶ月前
018.6K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
5ヶ月前
020.6K
Decagon:企业级客户服务智能体解决方案

Decagon: エンタープライズ・カスタマーサービス・インテリジェンス・ソリューション

概要 Decagonは、エンタープライズグレードの生成的AIカスタマーサポートソリューションの提供に注力する企業である。その中核となる製品は、複雑な問題を処理し、既存のシステムとシームレスに統合し、データから継続的に学習することができるインテリジェントなAIカスタマーサービス・インテリジェンスです。
7ヶ月前
017K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent:モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...
7ヶ月前
019.5K
Operator 系统技术文档

オペレーターシステム技術文書

元記事:https://cdn.openai.com/operator_system_card.pdf EXPLAIN: OpenAI、初のL3レベルインテリジェンス「Operator」を発表:人間とコンピュータのインタラクションの新時代を切り開く 1 はじめに Ope...
8ヶ月前
09.8K
OpenAI 推出首个L3级智能体Operator:开启人机交互新时代

OpenAIが初のL3レベルインテリジェンス「Operator」を発表:人間とコンピュータのインタラクションの新時代を切り開く

コンピュータ・ユースのトラックは、新興企業、ダークホース、そして巨大なビッグプレーヤーで混雑している。 デスクトップ・オートメーション・インテリジェンシアをフォローすることができます。 人工知能分野は競争が激化しており、スタートアップの新参者だけでなく...
8ヶ月前
011.2K
Orama:高性能全文本和向量搜索引擎

Orama:高性能な書籍・ベクトル全文検索エンジン

概説 Oramaはオープンソースの高性能検索エンジンで、すべてTypeScriptで記述されており、全文検索、ベクトル検索、ハイブリッド検索をサポートしている。OramaはあらゆるJavaScript実行環境で動作するように設計されており、高速で信頼性の高い検索を提供する。
8ヶ月前
014.7K
使用免费 GPU 算力在线部署 DeepSeek-R1 开源模型

無料のGPUパワーでDeepSeek-R1オープンソースモデルをオンライン展開

Tencent Cloud Cloud Studioのおかげで、DeepSeek DeepSeek-R1のおかげで AIとビッグモデル技術が急速に発展している今日、より多くの開発者や研究者が、これらの高度な技術をよりよく理解し、適用するために、ビッグモデルを自分自身で体験し、微調整したいと考えています...
7ヶ月前
016.9K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter:AIを搭載した落書き風画像編集ツール

概要 FramePainterは、高度なビデオ拡散技術と直感的なSketchコントロールを活用し、複雑な画像編集を簡単に実現できる画期的なAI駆動型画像編集ツールです。簡単な調整でも、複雑なクリエイティブな変換でも、FramePainter...
8ヶ月前
014.3K
[转]从零拆解一款火爆的浏览器自动化智能体,4步学会设计自主决策Agent

[転送】注目のブラウザ自動化インテリジェンスをゼロから分解、4つのステップで自律意思決定エージェントの設計を学ぶ

私たちが過去に開発したインテリジェンスのほとんどは、固定されたワークフローパターンであり、以下のフレームワークに従って、自律的な意思決定やツールの自律的な使用を行うインテリジェンスを開発したものはほとんどなかった。 2日前、私はブラウザを使って簡単なタスクを自動化できるオープンソースのエージェント、browseを共有した...
8ヶ月前
010.7K
Fey: 金融市场研究工具,提升投资决策的智能助手

フェイ: 金融市場調査ツール、投資判断を強化するインテリジェント・アシスタント

概要 Feyは、現代の投資家のために設計されたインテリジェントなアシスタントで、リアルタイムの市場データとパーソナライズされた投資アドバイスを提供します。シンプルで直感的なインターフェースで、ユーザーは重要な金融情報や市場動向に簡単にアクセスすることができます。Feyの主な機能には、株価追跡、財務分析、パーソナライズされた新...
7ヶ月前
013.3K
Needle:接入私人数据源的AI搜索与工作自动化平台

Needle:個人データソースにアクセスできるAI検索・求人自動化プラットフォーム

はじめに Needleは、効率的な情報検索と自動化されたワークフローを通じて企業の生産性を向上させるために設計された人工知能プラットフォームである。このプラットフォームは、組織内の様々なデータソースを接続し、統一された検索とデータ管理機能を提供することができます。ユーザーは単に...
8ヶ月前
014K
Rapport Cloud:创建和部署AI驱动的数字动画角色

Rapport Cloud:AIによるデジタルアニメーションの作成と展開

概要 Rapport Cloudは、人工知能を搭載したインタラクティブなデジタル・キャラクターの作成と展開に特化したクラウドベースのプラットフォームです。Speech Graphics のチームによって開発されたこのプラットフォームは、受賞歴のある音声駆動型フェイシャル アニメーション テクノロジーを利用しています。
8ヶ月前
014.8K
NewsBang:智能新闻与深度洞察APP,提供无偏见的新闻解读

NewsBang:偏りのないニュース解釈のためのインテリジェントニュース&ディープインサイトアプリ

一般的な説明 NewsBangは、高度な生成AI技術を活用し、スマートなニュースと深い洞察をユーザーに提供する革新的なニュースプラットフォームです。シンプルな "左スワイプ "で、ユーザーはニュースをより深く理解することができます。newsBangはインタラクティブなAI ...
8ヶ月前
014K
Jogg AI:快速生成高质量视频广告,生成社交媒体头像

Jogg AI:高品質の動画広告を素早く生成、ソーシャルメディアのアバターを生成

概要 Jogg AIは、動画広告を迅速かつ効率的に生成するために設計された高度なAI駆動型プラットフォームです。ユーザーはURLを入力するだけで、数分で美しい動画広告に変換することができます。このプラットフォームは、カスタマイズ可能なテンプレートやAIアバター、シンプルな...
8ヶ月前
015.1K
使用什么大模型可以完整的翻译几百页的PDF文档?

数百ページのPDF文書を完全に翻訳するために、どのような大型モデルを使用できますか?

PDFMathTranslate、GPTアカデミックなど:現在主流の文書(または長い論文)翻訳は、一般的に、次のような特別なツールを必要とするフォーマット、セグメンテーション、そして翻訳を変換するために使用されます... もちろん、あなたは添付ファイルとして文書を添付することができます...
8ヶ月前
013.4K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

タンクワーク:音声とテキストでコンピュータを操作し、リアルタイムの音声フィードバックを提供する知的ボディ

概論 TankWorkはオープンソースのデスクトップエージェント・フレームワークで、コンピュータビジョンとシステムレベルのインタラクションを通じて、AIがコンピュータを認識し制御できるように設計されています。このフレームワークは、エージェントが音声やテキストコマンドでコンピュータを直接制御し、リアルタイムのスクリーンコンテンツを処理し、継続的なオーディオビジュアルを提供することを可能にします。
8ヶ月前
013.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AIオートフリー:自動化ツール(CursorやWindsurfなど)を使用したAI IDEが使い放題

概要 AI Auto Freeは、CursorやWindsurfなどのAI駆動統合開発環境(IDE)をユーザーが無制限に利用できるように設計された強力な自動化ツールです。このプロジェクトはクロスプラットフォームをサポートし、複数の言語機能を含んでいます。
8ヶ月前
015.8K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm:マルチインテリジェンスクラスターコラボレーションのためのフレームワーク

QuantumSwarmは、AIの人口知能の開発と研究に焦点を当てたオープンソースの人工知能フレームワークです。このプロジェクトはQuarm AIチームによってGitHub上で管理されており、マルチインテリジェンスシステムの構築とテストのための柔軟で効率的なプラットフォームを提供することを目指している。
8ヶ月前
014K
智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级

Smart Spectrum GLM-PCオープン体験:コンピュータを自律的に操作するマルチモーダルエージェントがバージョンアップ

GLM-PCは、CogAgentのマルチモーダルモデルに基づいた世界初の一般向けターンキーコンピュータエージェントです。人間のようにコンピュータを「観察」し「操作」することができ、ユーザが様々なコンピュータ・タスクを効率的に完了できるよう支援する。 202年以来...
8ヶ月前
09.4K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG:検索機能拡張生成システムの最適化のための視覚的評価ツール

包括的な紹介 XRAG(eXamining the Core)は、高度な検索機能拡張生成(RAG)システムの基本コンポーネントを評価するために設計されたベンチマークフレームワークです。各コアモジュールのプロファイリングと分析により、XRAGは、異なる構成やコンポーネントがRAGにどのような影響を与えるかについての情報を提供します。
8ヶ月前
014.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan:ワンクリックでMarkdown記事を美化し、複数のセルフメディアプラットフォームフォーマットに対応(オープンソースのローカルクライアント)

包括的な紹介 WenYanは、Markdownの記事のタイプセットと美化のために設計されたツールであり、編集されたMarkdownの記事をWeChat、Zhihu、今日の見出しや他のプラットフォームに適した形式に変換することをサポートしています。ユーザーはワンクリックで記事をコピーし、記事を直接...
8ヶ月前
011.7K
Cursor 如何解决 Too many free trials. 提示?

カーソル 「無料トライアルが多すぎます。

以前、Cursorが新規ユーザーに対して14日間、500回の無料エントリー制限を設けていることは周知の通りである。 通常、14日間が過ぎるとアカウントをキャンセルし、再登録することで、14日間の経験を継続することができる。 しかし500回以上使用すると、C...
8ヶ月前
014.9K
告别本地开发环境!腾讯、微软、谷歌免费在线 AI IDE 助你快速上手开发

ローカル開発環境にサヨナラ!Tencent、Microsoft、Googleが提供する無料のオンラインAI IDEが、あなたの開発をサポートします!

背景 クラウドコンピューティングと人工知能(AI)技術の急速な発展に伴い、オンライン統合開発環境(IDE)は現代の開発作業にとって重要なツールとなっている。特に今日ますます普及しているAIとクラウド開発では、オンラインIDEは面倒なローカル環境設定を省くだけでなく、強力な...
8ヶ月前
011.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: ニュースのタイムライン要約ツールでニュースの検索とタイムライン生成の効率を改善

一般的な紹介 CHRONOSはAlibaba NLPチームによって開発されたニュースタイムライン要約ツールです。CHRONOSはオープンドメインのタイムライン要約タスクを処理できるだけでなく、効率性とスケーラビリティの面でも優れています。
8ヶ月前
013.3K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow:ビデオ内のオブジェクトの動きをコントロールし、ビデオ内の動くオブジェクトを加算または減算します。

一般的な紹介 Go-with-the-Flowは、Netflix Eyeline Studiosの研究チームによって開発されたオープンソースプロジェクトで、ノイズを歪ませることで映像拡散モデルのモーションパターンを制御します。このプロジェクトにより、ユーザーはシーンのカメラと...
8ヶ月前
013.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-ダイナ:静止画参考動画 ミッシーの写真を踊らせるポーズ生成動画

包括的な紹介 X-Dynaは、ByteDanceによって開発されたオープンソースプロジェクトで、ゼロサンプル拡散技術を使用してダイナミックなポートレートアニメーションを生成します。このプロジェクトでは、ドライブビデオ内の表情や体の動きを使って個々のポートレート画像をアニメーション化し、リアルでコンテキストを意識したモーションエフェクトを生成します。
8ヶ月前
014.5K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D(Hunyuan3D):高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー

包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。
8ヶ月前
016.8K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI:インテリジェントなドキュメントQ&Aシステムの構築と、プライベートなウェブサイド・ナレッジベースのシンプルな構築

総合紹介 RAG Web UIは、RAG(Retrieval Augmented Generation)技術に基づいた知的対話システムです。企業や個人が独自の知識ベースに基づいてインテリジェントなQ&Aシステムを構築するのに役立ちます。文書検索と大規模な言語モデルを組み合わせることで、RAG Web UIは正確で信頼性の高い...
8ヶ月前
014.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: 自然言語でコンピュータを制御するDesktop Intelligentsiaアプリケーション

概論 UI-TARS Desktopは、ByteDance社が開発したUI-TARS(Visual Language Model)に基づいたグラフィカルインターフェースエージェントアプリケーションです。UI-TARSデスクトップは、ByteDance社が開発したUI-TARS(Visual Language Model)をベースとしたグラフィカルインターフェースエージェントアプリケーションです。
8ヶ月前
023.8K
免费使用 Cursor/Windsur 生成各类实用信息图

Cursor/Windsurを使えば、あらゆる種類の便利なインフォグラフィックを無料で作成できます!

むかしむかし、私たちは楽しいカード図のプロンプトの単語の例をたくさん共有したが、楽しいが、実際には、我々は鳥の使用がないことがわかった。理由は非常に簡単です:これらのカード図のプロンプトの単語のテンプレートのサンプルスタイルのコードは、一般的に固定されている、ユーザーの本当の意図とサンプルのスタイルが一致しません。 一部の人々は、より一般的なプロンプトの単語の適応を行っている:カードマップ...
8ヶ月前
011.5K
使用 Phidata AI 快速构建股票分析智能体智能体

Phidata AIで株式分析インテリジェンス・ボディ・インテリジェンスを迅速に構築

株式調査における情報過多は現実である 株式の価値を評価する際の一般的な課題は、十分な情報に基づいた投資判断を下すために、複数の情報源から大量の情報を扱うことである。 従来の方法には次のようなものがある:様々なプラットフォームから財務データを収集する。 複数のレポート、ニュース、その他の記事を読む。 ...
8ヶ月前
09.6K
Narrify:将书籍转化为音频摘要,随时随地聆听精华

Narrify: 書籍をオーディオ要約に変換し、いつでもどこでも最高の作品を聴くことができます!

概要 Narrifyは、書籍を簡潔で魅力的なオーディオ要約に変換するために設計された革新的なプラットフォームです。Narrifyを使えば、ユーザーは書籍の重要な内容や洞察に素早くアクセスすることができ、通勤中でもレジャー中でも本のハイライトを簡単に聴くことができます...
8ヶ月前
014.1K
不幸与DeepSeek-R1同时发布的Kimi k1.5技术报告,提升长上下文和多模态推理能力

残念ながら、DeepSeek-R1と同時にリリースされたKimi k1.5のテクニカルレポートでは、長いコンテキストとマルチモーダル推論が改善されています。

強力なマルチモーダル推論:Kimi k1.5モデルは、数学、コード、テキスト、視覚推論タスクを含む複数のベンチマークとモダリティで最先端の推論性能を達成します。 プレーンテキストを処理するだけでなく、...
8ヶ月前
016.6K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin

デビン・カーソルルール:デビンのために強化されたカーソルとウィンドサーフを作る

概要 Devin Cursor Rulesは、CursorおよびWindsurf統合開発環境(IDE)を、Devinと同様の高度なAI機能を実現するための設定ファイルやツールで拡張することを目的としたオープンソースプロジェクトです。このプロジェクトでは、Devinと同様の高度なAI機能を実現するための設定ファイルやツールを提供しています。
8ヶ月前
013.8K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix:大規模モデル検索用にコードベースをテキストファイルにパッケージ化

概論 Repomix(以前はRepopackとして知られていた)は、コードベース全体を単一のAIフレンドリーなファイルにパッケージ化するために設計されたオープンソースツールです。このツールにより、開発者は自分のコードベースを大規模な言語モデル(ClaudeやChat...
8ヶ月前
018.8K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git リポジトリのテキストファイルを読み込んで、大規模なモデルのために素早くチャンキングする。

一般的な紹介 Yekは、リポジトリやディレクトリからテキストファイルを読み込んでチャンキングし、大規模言語モデル(LLM)で使用するためにシリアライズするRustベースの高速ツールです。このツールはデフォルトで .gitignore ルールを使って不要なファイルをスキップし、...
8ヶ月前
014.4K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: 高品質な結果を出すために、出力をレビュー、検証、フォーマットするマルチロールインテリジェンス

包括的な紹介 Kheishは、構造化されたステップバイステップのコラボレーションを必要とする大規模言語モデリング(LLM)タスクのために設計されたオープンソースのマルチロールエージェントです。Kheishは単なるコーディネータではなく、それ自体がインテリジェントなエージェントであり、要求に応じてモジュールを要求し、ユーザーの反転を統合します。
8ヶ月前
013.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft:ショートストーリー、ダイアログスクリプト、ナレーション、グラフィックを生成するための多機能AIコンテンツ作成ツール

概要 AI ContentCraftは、テキスト生成、音声合成、画像生成などを統合した多機能なコンテンツ作成ツールです。ストーリー、ポッドキャストスクリプト、付随するオーディオやビデオコンテンツを素早く生成することができます。このツールは複数の言語変換をサポートし、バッチ処理も可能です。
8ヶ月前
014.3K
对标 Cursor 的 AI编辑器 Trae 上手体验

CursorをベンチマークするAIエディターTraeのハンズオン

中国のディープカスタマイゼーション Traeは、インターフェイスやインタラクション、またはコンテンツであるかどうか、多くのディープカスタマイゼーションのための中国の環境に基づいており、完全に中国の文化です。VScodeまたはCursorのインポート設定から直接使用し、難なく始めることができます。
3ヶ月前
015.5K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
8ヶ月前
014.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

最短:エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証(2FA)をサポートしています。Shortestの主な特徴は...
8ヶ月前
015.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js:AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。
8ヶ月前
019.6K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)

ReadKidz:キャラクターの一貫した童話絵本を作成、豊富な絵本スタイルのテンプレート(有料)

一般的な紹介 ReadKidzは、人工知能技術を使用して、ユーザーがパーソナライズされた絵本やアニメーションを作成できるようにする革新的なプラットフォームです。ReadKidzを使えば、親御さんでも、先生でも、絵本作家を目指す方でも、高品質のストーリーコンテンツを簡単に作成することができます...
8ヶ月前
015.3K
利用大模型进行商业数据分析,要学的不是提示词,而是这些...

ビッグモデルを使ったビジネス・データ分析のために覚えなければならないのは、出だしの言葉ではない。

ビジネスデータ分析にビッグモデルを使用することは、テキスト、SVG、Pythonを生成することに他ならず、人々が必要とするものは、出だしの言葉ではないかもしれないが、これら9つのモデルを学ぶことである! 1.AARRRモデル(海賊モデル) 2.RFMモデル 3.決定木モデル 4.PEST分析モデル...
8ヶ月前
010K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

ビデオアナライザー:ビデオコンテンツを分析し、詳細な説明を生成します。

Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。
7ヶ月前
019K
实现 LLM 记忆系统的五种方式

LLMメモリーシステムを実装する5つの方法

大規模言語モデル(LLM)アプリケーションを構築する際、メモリシステムは対話のコンテキスト管理、長期的な情報保存、意味理解を強化する重要な技術の一つである。効率的なメモリシステムは、モデルが長い対話の一貫性を維持し、重要な情報を抽出し、さらに過去の対話を検索する機能を持つことができます...
8ヶ月前
010K
Trae:字节跳动推出的免费AI编程工具

Trae:ByteHopperが提供する無料のAIプログラミングツール

総合紹介 TraeはByteDanceが提供する無料のAIプログラミングツールで、中国人開発者のための統合開発環境(IDE)として設計されています。クロード3.5やGPT-4o.T.などの高度なAIモデルを用いて、開発者がコードを素早く生成、最適化、デバッグできるように支援します。
3ヶ月前
030.9K
海螺语音国内上线,可能是最好的中文语音配音产品

コンク音声国内発売、最高の中国語音声吹き替え製品かもしれない

中国でコンテンツ制作のために作られたダビング製品で、いいものは一つもない。APIしか使えないか、製品はまあまあのサウンドモデルでも、いいものはない。 たとえば、海外のイレブンラボは、英語はOKですが、中国語は本当に渡って引っ張っている、オープンソースのモデルの主な問題は、モデルの品質が比較的悪いということです...
8ヶ月前
010.7K
豆包端到端实时语音大模型上线!智商情商双在线,中文语音对话断崖式领先

Beanbag エンド・ツー・エンドのリアルタイム音声グランドモデルがオンラインに!IQとEQがオンラインになり、中国語の音声対話が崖っぷちに立たされている!

今日、Beanbag APPは、新しいエンドツーエンドのリアルタイム音声通話機能が正式にオンラインであることを発表した "プレリリース "を再生することなく、直接、すべてのユーザーのテストを満たすために、使用するために誰もが無料で、フルボリュームに開きます。 Beanbagリアルタイム音声ビッグモデルウェブサイト:https://team.doubao.com...
8ヶ月前
011K
为写作话题匹配合适的作家和写作风格

適切な書き手と文体を執筆テーマに合わせる

背景 英語圏には、ウェブ向けの文章を書くのが得意なライターがたくさんいて、その文体も千差万別で、学習用コーパスも豊富で、AIは彼らの真似をするのが得意である。このような人たちのライティングスタイルを参考にすることで、コンテンツがより理解しやすくなったり、論理的な枠組みができたりして、爆発的な文章が書きやすくなる。 特徴 文章のトピックを入力すると、AIが自動的に最もマッチする文章を分析...
6ヶ月前
011K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。
7ヶ月前
016.9K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型

JENOVA:複数のモデルと検索を統合し、問題に応じてモデルを動的に選択するAI対話アシスタント

包括的な紹介 JENOVAは、強力なAI統合サービスをユーザーに提供するために設計された、世界をリードするAIプラットフォームです。最先端のAIモデル(GPT-4o、Claude 3.5、Gemini 2など)を統合することで、JENOVAはユーザーのニーズに...
8ヶ月前
015.5K
Traycer:开发者专用的AI编程助手,具有任务规划与实时代码审查功能

Traycer: タスクプランニングとリアルタイムコードレビューを備えた開発者専用AIプログラミングアシスタント

概 要 Traycerは開発者向けのAIプログラミングアシスタントで、コンテキストに応じたコードを分析し、リアルタイムでレビューすることで、ソフトウェア開発の効率と品質を大幅に向上させるように設計されている。Visual Studio Codeに統合され、自動的にタスクを計画することができます...
8ヶ月前
015.8K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
8ヶ月前
021.7K
UnDatas.IO:精准解析各类非结构化数据的API服务(付费)

UnDatas.IO: さまざまな種類の非構造化データを正確に解析するAPIサービス(有料)

包括的な紹介 UnDatas.IOは、非構造化データの解析と処理に特化したプラットフォームです。高度な技術を駆使して、ドキュメントのレイアウトを自動的に認識し、表、画像、数式、テキストを分類して、データ処理プロセスを大幅に簡素化します。このプラットフォームは、データの並べ替えにかかる時間を大幅に節約するだけでなく...
8ヶ月前
012.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink:質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは革新的なマシンライティングフレームワークで、人間の認知プロセスの反復的な拡張と反映を模倣することで、高品質の長文エッセイを生成するように設計されています。OmniThinkは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。
8ヶ月前
013.7K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)高レベルのインテリジェントボディモデルを提供し、...
7ヶ月前
012K
Klap:将长视频转化为适合社交媒体传播的短视频,轻松制作热门短片

Klap:長い動画をソーシャルメディア配信に適した短い動画に変換し、人気のショートフィルムを簡単に作成できます。

概要 Klapは、コンテンツ制作者向けに設計されたAIベースの動画編集ツールで、長い動画をTikTok、Instagram Reels、YouTube Shortsなどのソーシャルメディア・プラットフォームに適した短い動画に変換することができる。
8ヶ月前
014.2K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight:ポートレート画像の自然光レンダリング(未発表)

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは、物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します...
8ヶ月前
014.6K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介 ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。
8ヶ月前
023.6K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。
8ヶ月前
018.5K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: ハイライトビデオを自動的に編集し、簡単にプロフェッショナルなVlogを作成します。

総合紹介 AIVLOGはVlogクリエーターのために設計されたAIビデオ編集ツールです。自動的にビデオコンテンツを分析し、インテリジェントにハイライトを編集することができ、ユーザーは95%編集時間を節約できます。日常生活のビデオ、旅行記録、会話など、AIVLOGは簡単に...
8ヶ月前
014.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
8ヶ月前
014.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

ウィンドサーフ・ウェーブ2メジャー・アップデート:エンタープライズ・ハイブリッド展開版にウェブ検索と自動メモリーを導入

Codeiumは最近、Windsurf Wave 2アップデートを展開し、ウェブ検索、自動メモリ、コード実行の最適化など、いくつかの重要な機能アップグレードを開発者に提供した。トップ2のAIコーディングツールとして、これらのアップデートは20...
8ヶ月前
010K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

GoogleがVertex AI RAGエンジンをリリース:信頼性の高い検索機能付きジェネレーティブ・アプリケーションを構築するためのワンストップ・ショップ

生成AIと大規模言語モデリング(LLM)は産業を変革しているが、2つの重要な課題が企業の採用を妨げている:幻滅(不正確または無意味な情報の生成)と学習データ以外の限られた知識。検索補強型生成(RAG)と接地...
8ヶ月前
010.6K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG:簡易検索拡張生成フレームワーク、エンティティグラフインデックスリコール関連テキストブロック

包括的な紹介 MiniRAGは、極めてシンプルなRAG(Retrieval Augmented Generation)フレームワークであり、ヘテロジニアスグラフインデキシングと軽量なトポロジー拡張検索によって、小さなモデルでも優れたRAG性能を実現することを目的としている。香港大学データサイエンス研究室(HKUDS)によって開発され、...
8ヶ月前
014.7K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT:画像・映像の領域レベル理解のためのマルチモーダルグランドモデルによるビジュアルコンテンツ分析の強化

包括的な紹介 Omni-RGPTは、画像や動画の領域レベルでの理解を可能にするために設計されたマルチモーダルな大規模言語モデルである。トークンマークテクニックを導入することで、Omni-RGPTは、視覚特徴空間内のターゲット領域を領域キュー(例えば、ボックスや...
8ヶ月前
013.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing:自然な会話とコミュニケーションのための低遅延オープンソース音声対話アシスタント

包括的な紹介 ベイリング(Bailing)は、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントです。このプロジェクトは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデリング(LLM)および音声合成(TTS)技術を組み合わせて...
8ヶ月前
015.6K
元界AI:开源版AI数字人克隆与短视频生成工具

メタバースAI:AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

総合紹介 Metaverse AI(オープンソース版)はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成することができ、吹き替えや字幕にも対応しています。このツールはWindo...
6ヶ月前
013.8K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat:ウィキペディアのデータを使って知識を検索するためのチャットツール

概論 ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模言語モデルの事実性を向上させることを目的としている。大規模言語モデル(ChatGPTやGPT-4など)は、最新の情報や人気のないトピックを処理する傾向があります。
8ヶ月前
013.6K
AI搜索结果影响下,Google员工讨论“SEO已死”?

グーグル社員が「SEOは死んだ」と議論、AIの検索結果が影響?

Google社員が「SEOは死んだ」と議論 最近のポッドキャスト "Search Off the Record "のエピソードで、SEOは死んだのかという話題が持ち上がった。ポッドキャスト「Search Off the Record」の最近のエピソードで、SEOが死んだかどうかというトピックが取り上げられ、ゲイリー・イリーズ氏は楽観的な見解を示した。 彼は次のように主張している。
8ヶ月前
09.5K
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型

アリババAI研究所、改良型ストリーミング音声合成モデル「CosyVoice 2」を発表

1.概要 近年、音声合成技術は大きな進歩を遂げ、特にリアルタイムで自然かつスムーズな音声生成の実現に成功した。しかし、実際のアプリケーションでは、待ち時間、発音の正確さ、話者の一貫性などの問題が、特に高い応答性が要求されるストリーミングアプリケーションにおいて、依然として業界を悩ませている。
8ヶ月前
010K