AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: 高品質画像生成のためのテキスト画像変換モデル、中国語ポスター生成もサポート

包括的な紹介 Kolorsは、Racerチームによって開発された、ポテンシャル拡散技術に基づく大規模なテキスト画像生成モデルです。このモデルは、数十億のテキスト-画像データのペアで学習され、中国語と英語の両方の入力をサポートし、高品質で複雑な意味的に正確な画像を生成することができます。
1年前
065.9K
BizyAir用户深度评测:无显卡玩转ComfyUI,让FLUX.1极速出图

BizyAirユーザー徹底レビュー:ComfyUIを再生するためのグラフィックカードがない、画像からFLUX.1非常に高速みましょう

発売以来、シリコンフローのBizyAirプラグインはComfyUIに強力なクラウドサポートをもたらし、AIデザイナーはグラフィックカードなしで非常に高速で絹のように滑らかな画像生成体験を実現できるようになりました。 BizyAirは現在、FLUX.1、SD ...など、約20のベースモデルを内蔵しています。
1年前
054.9K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow:カートゥーンシェーディング、白黒画像の自動シェーディングによる画像の色の一貫性と品質の向上

包括的な紹介 ColorFlowは、Tencent ARCチームによって開発された画像シーケンスの自動カラーリングツールで、白黒画像シーケンスの自動カラーリングの問題を解決します。このツールは、検索で強化されたシェーディングパイプラインを使用して、キャラクターの髪の色やサービスなど、参照画像のプールを通して様々な要素の色を正確に生成します。
1年前
063.8K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit:画像修復・編集のオールインワンツール、テンセントアークがリリース

総合紹介 BrushEditは、Tencent ARC Labsが開発したオールインワンの画像修復・編集ツールです。このツールは最新のAI技術に基づいており、画像の欠陥を自動的に識別して修復することができ、ユーザーによるインタラクティブな編集もサポートしています。
1年前
060.9K
即梦AI:一站式AI创作平台, 图像生成, 智能画布, 视频生成, 音乐生成

インスタントドリームAI:ワンストップAI作成プラットフォーム、画像生成、スマートキャンバス、ビデオ生成、音楽生成

概論 Instant Dream AIは、多彩で強力な創作ツールをユーザーに提供するために設計された、ワンストップのAI創作プラットフォームです。画像生成、スマートキャンバス、動画生成、音楽生成など、Instant Dream AIはユーザーの創造性を簡単に実現することができます。このプラットフォームは、AI描画を含む複数の作成モードをサポートしています...
1年前
0106.4K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成

概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル(LLM)のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。
1年前
079.7K
Class Companion: K12教师设计的课后作业管理系统,为学生提供AI辅导和作业批改

Class Companion:K12の教師が考案した放課後の宿題管理システムで、生徒のためにAI家庭教師と宿題の添削を提供する。

概要 Class Companion は、教師と生徒のために設計されたオンライン教育プラットフォームで、人工知能技術を使用して、即時フィードバックと個別指導を提供します。このプラットフォームは、幅広い科目と学年をサポートし、教師が時間を節約し、教育効率を向上させ、生徒により多くの練習を提供するのに役立ちます...
1年前
053.3K
Gauth(Gauthmath):使用AI解决作业问题,提供详细解答,字节旗下海外作业辅导APP

Gauth(ゴウトマス):AIを使って宿題の問題を解き、詳細な回答を提供する、バイトの海外宿題支援アプリ

一般的な紹介 Gauth(旧称Gauthmath)は、学生のために設計されたAI宿題ヘルパーウェブサイトです。高度なAI技術とプロの家庭教師チームを使って、数学から化学まで様々な科目の宿題回答サービスを提供しています。ユーザーは画像をアップロードしたり、質問を入力したりすることで、素早く...
9ヶ月前
071K
Ello:提供个性化阅读体验,提升儿童阅读能力

Ello:子どもたちの読書スキルを向上させるために、パーソナライズされた読書体験を提供する。

一般的な説明 Elloは、高度なAI技術とインタラクティブな機能を通じて、子供たちの読書スキルの向上を支援するために設計されたパーソナライズされた読書プラットフォームです。Elloは、さまざまな年齢層や読書レベルに適応した、解読可能な電子書籍や文庫本の豊富なセレクションを提供しています。このプラットフォームは...
1年前
043.6K
Praktika.ai: 提升英语口语能力,享受个性化AI辅导

Praktika.ai: パーソナライズされたAI家庭教師で英語のスピーキングスキルを向上させよう

一般的な紹介 Praktika.aiは、先進的なAI技術を使用し、ユーザーにパーソナライズされた英語スピーキングの個人指導を提供する革新的な英語学習プラットフォームです。超リアルなAIバーチャル家庭教師と対話することで、ユーザーはリラックスした楽しい環境で英語のスピーキングスキルを向上させることができます。
1年前
056.6K
Gemini 2.0 怎么用?——这玩意儿比“外挂”还像“外挂”,附使用教程

Gemini 2.0の使い方は?--チュートリアルがあります!

最近、人工知能は過去のものとなった。 先日、グーグルがGemini 2.0をリリースして大きなニュースになったが、これのどこがいいのかって? まあ、こう言ってはなんだが、まだ体験したことのない人は、スプライト入りのポトフを人生で一度も味わったことがないようなものだ......。
1年前
045.9K
Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版

Cursor試用期間リセットツール:Cursor試用期間制限の問題を解決し、簡単に試用期間をリセットし、プロフェッショナル版へのアップグレードを回避する。

概要説明 Cursor無料トライアルリセットツールは、無料サブスクリプション中にCursorで発生するマルチアカウント制限の問題を解決するために設計されたオープンソースツールです。ユーザーが同じマシンで複数の無料トライアルアカウントを使用する場合、Cursorは...
1年前
0183.7K
NeoCodeium怎么用?

ネオコディウムはどのように機能するのですか?

NeoCodeiumは、Codeiumの技術に基づいて開発された、NeovimのAIコード補完機能を提供するプラグインです。このプラグインは、公式プラグインの複数行仮想テキスト処理中のちらつき問題を解決し、よりスムーズなユーザー体験を提供することを目的としています。
1年前
051.5K
Waifu2x Extension GUI:深度学习技术放大、修复图像与视频插帧(Windows x64)

Waifu2x拡張GUI: ディープラーニング技術による画像とビデオの拡大、修復、補間 (Windows x64)

一般的な説明 Waifu2x-Extension-GUIは、画像、GIF、ビデオの超解像ズームとビデオフレーム補間用の深層畳み込みニューラルネットワーク技術を利用した強力な画像およびビデオ処理ツールです。このツールは複数のアルゴリズムとエンジンをサポートしており、Wai...
1年前
069.5K
OpenAI开始提供大模型(GPT系列模型)的提示缓存(Prompt Caching):GPT-4o系列模型输入价格下降一半,访问速度提升80%

OpenAIが大規模モデル(GPTシリーズモデル)にプロンプトキャッシングを提供開始:GPT-4oシリーズモデルの入力価格を半額に、アクセス速度を80%向上

大規模なモデルアプリケーションでは、複雑なリクエストの処理は、特にリクエスト内容に多くの繰り返しがある場合、しばしば高い待ち時間とコストを伴う。この「遅いリクエスト」の問題は、長いプロンプトと高頻度のインタラクションを伴うシナリオで特に顕著です。この課題に対処するため、OpenAIは最近...
1年前
047.1K
Claude官方洞察报告:原来中文用户最爱用Claude写小说

クロード公式インサイトレポート:中国ユーザーはクロードで小説を書くのが大好き

Clio:プライバシーのための実世界AI利用洞察システム 人々は何のためにAIモデルを使うのか?大規模な言語モデルの人気が急速に高まっているにもかかわらず、これまで私たちは、それらがどのように使用されているのかを正確に把握することができませんでした。 それは単なる好奇心の問題ではない。
1年前
042.7K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: 歌詞とバッキングトラックからラップ(Rap)ボーカルを直接生成するモデル(現在オープンデータセット)

概要 RapBankは、ラップ歌詞生成のために設計されたデータセットとツールセットです。このプロジェクトはNZqianによって作成され、YouTubeからラップ曲を収集・処理することで、研究者や開発者に高品質のラップ歌詞データを提供する。
1年前
058K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。
1年前
087.4K
星流:Star-3 Alpha图像生成模型,LiblibAI发布的新一代AI图像创作平台

Starflow:Star-3アルファ画像生成モデル、LiblibAIがリリースした次世代AI画像生成プラットフォーム

総合紹介 Xingliu(星流)は、LiblibAIチームによって開発された新世代のAI画像作成ツールで、独自に開発されたStar-3 Alpha画像生成モデルをベースとしており、高精度で多様な画像生成サービスを提供することができます。デザイナーや写真家...
1年前
073.3K
Cursor 没法白嫖了?Windsurf 高级功能需要订阅了?继续推荐一款 AI 代码编辑器Google IDX

Cursor もう白けることはない!Windsurfのプレミアム機能はサブスクリプションが必要?AIコードエディター、Google IDXを推薦し続ける!

背景: 数日前、ウィンドサーフを使用していたところ、アップデートのダウンロードを促されました。 アップデートの後、クロード3.5ソネットのようなWindsurの高度な機能を使用し続けるためにサブスクライブする必要があり、そうでなければ、カスケードベースのみを使用することができます。 ここでは、次の ...
1年前
051.5K
卡片图提示词:用SVG图形化展示任何概念示意图

カード・ダイアグラム・キューワード:SVGであらゆる概念図式をグラフィカルに表現

使い方のヘルプ: クロードの専用SVGグラフィックジェネレータキューワードは、どのようなテーマの内容でも回路図を生成することができます。 もちろん、ChatGPTを使用して生成することもできますが、キャンバスで直接SVGをプレビューすることはできません:基本的な修正を加えることで、キューワードの制約の出力形式を...
1年前
061.9K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: エージェントに独自の計算リソースを提供し、GPUを自律的に管理し、ブロックチェーン操作やソーシャルパブリッシングを実行する能力を与える。

概要 Hyperbolic AgentKitは、ブロックチェーンとコンピューティングパワーを組み合わせたAIエージェントを実行するためのテンプレートを提供することを目的としたオープンソースプロジェクトである。このプロジェクトは、CoinbaseのCDP Agentkitをベースに、ブロックチェーンの端末をサポートするための修正と拡張を加えています。
1年前
042.3K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
1年前
040.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx:1枚の画像から探索可能な360°3D世界を生成(コードは順次オープンソース化)

一般的な紹介 GenExは、1枚の画像から完全に探索可能な360°の3D世界を生成できる先進的なAIモデルである。ユーザーはこの生成された世界をインタラクティブに探索することができる。GenExは想像空間における造形的AIの境界を押し広げ、...
1年前
049.2K
Hika AI:提供深度洞察和智能知识图谱的免费AI搜索引擎

Hika AI: 深い洞察とインテリジェントなナレッジグラフを提供する無料のAI検索エンジン

包括的な紹介 Hika AIは、深い多次元的な洞察とインタラクティブな探索体験を提供するように設計された無料のインテリジェント検索エンジンです。高度なAI技術を活用することで、Hika AIは関連する知識領域を素早く拡大し、特定の重要なポイントをより深く掘り下げることができ、ユーザーがより包括的な情報を得られるよう支援します。
1年前
057.7K
CreateLogo:AI标志生成器,品牌名称生成器,生成专业SVG标志(付费)

CreateLogo:AIロゴジェネレータ、ブランド名ジェネレータ、プロフェッショナルなSVGロゴ生成(有料)

一般的な紹介 CreateLogo.appは、ユーザーがプロフェッショナルなロゴをすばやく簡単に作成できるように設計された、AIを搭載したロゴ生成プラットフォームです。CreateLogo.appは、企業経営者、新興企業の創業者、個人ユーザーのいずれにも、直感的な操作でロゴを作成できます。
1年前
050.1K
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源

HuggingFaceはo1の背後にある技術的な詳細を明らかにし、それをオープンソース化した!

小型模型は、考える時間を長く与えれば、大型模型を凌駕することができる。 このところ、業界では小型モデルに対する熱意がかつてないほど高まっており、性能面で大型モデルを凌駕するための「実用的なトリック」が数多く登場している。 小型模型の改良にスポットライトを当てることは、小型模型の性能を向上させることにつながると言える。
1年前
037.6K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 深い文書理解に基づくオープンソースのRAGエンジンで、効率的な検索強化生成ワークフローを提供します。

包括的な紹介 RAGFlowは、深い文書理解技術に基づいたオープンソースのRAG(Retrieval Augmented Generation)エンジンです。RAGFlowは、あらゆる規模の企業向けに効率的なRAGワークフローを提供し、実際の文書に基づいた複雑な形式のデータを提供できる大規模言語モデル(LLM)を組み込んでいます。
1年前
088.7K
不能白嫖Cursor了,有没有其他备选方案?

カーソルを小さくすることができません。

Cline + Gemini 2.0 Cursorは、人気のあるAIコードエディタで、強力な反面、最近ではマシンコードを検出するなどして自由な使用を妨げ始め、多くの開発者に制限を感じさせている。Cursorの対抗馬として、W...
1年前
068.4K
再见 LangChain!Atomic Agents火了!

さよならラングチェーン! アトミック・エージェントは燃えている!

LangChain、CrewAI、AutoGenのようなフレームワークは、AIシステムを構築するための高レベルの抽象化を提供することで人気がある。しかし、私を含む多くの開発者は、これらのツールは開発プロセスに不必要な複雑さとフラストレーションを加えることが多く、良いことよりも悪いことの方が多いことに気づいている...。
1年前
041.5K
Break The AI:人工智能越狱挑战游戏,提升技能,参与竞赛

ブレイク・ザ・AI:人工知能脱獄チャレンジゲーム、スキルアップして大会に参加しよう

一般的な紹介 Break The AIは、ユーザーがAIスキルを向上させ、様々な楽しくやりがいのあるタスクに参加できるように設計された、AIチャレンジとコンペティションに焦点を当てたプラットフォームです。このサイトは、AI愛好家、学生、専門家のためのインタラクティブなコミュニティを提供し、ユーザーが...
1年前
054.7K
Depth AI:构建全面的代码知识图谱,深度理解代码库的AI助手

深度AI:包括的なコードナレッジグラフを構築し、コードベースを深く理解するためのAIアシスタント

概要 Depth AIは、開発者がコードベースを深く理解し、分析するために設計された人工知能アシスタントです。包括的なコードナレッジグラフを構築することで、Depth AIは複雑な技術的質問に答え、開発者がより効率的にコードを管理・最適化できるようにします。どのような場合でも...
1年前
068.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
1年前
055.5K
SystoByte:编程系统设计练习平台,提供实时AI反馈,提升面试技能

シストバイト:AIによるリアルタイムフィードバックを提供し、面接力を向上させるプログラミングシステム設計練習プラットフォーム

概要 SystoByteは、システム設計の練習のために構築されたプラットフォームであり、ユーザーのシステム設計スキルの向上、特に面接対策に役立つように設計されています。このプラットフォームは、ユーザーが直感的なインターフェースで設計できるシステム設計問題の豊富なライブラリを提供し、AIが生成した問題に即座にアクセスできます。
1年前
044.2K
Porkybank:AI驱动的日常预算管理,轻松追踪每日预算

Porkybank:AIを活用した日々の予算管理が簡単にできる

一般的な説明 Porkybankは、ユーザーが簡単に毎日の予算を追跡するために設計されたオープンソースの個人財務管理アプリケーションです。収入-支出)÷日数=現金というシンプルな計算式で、ユーザーは自分の財政状況を視覚化することができます。プロジェクトはGitHu...
1年前
045.2K
NotebookLM Podcast:任何文档生成多语言个性化AI播客(付费)

NotebookLM Podcast:あらゆる文書から多言語パーソナライズAIポッドキャストを生成(有料)

概要 NotebookLM Podcastは、人工知能技術を使ってあらゆるテキストコンテンツをダイナミックで魅力的なオーディオポッドキャストに変換する革新的なプラットフォームです。学生、教育者、コンテンツ制作者、多忙なプロフェッショナルなど、NotebookLM...
1年前
045.4K
FindPicLocation:使用AI技术定位照片拍摄地点,快速获取片GPS定位

FindPicLocation: AI技術を使って、写真が撮影された場所を特定し、フィルムのGPSロケーションを素早く取得します。

包括的な紹介 FindPicLocationは、人工知能技術を使って、ユーザーが写真を撮った場所を特定するのを助けるウェブサイトである。ユーザーは写真をアップロードするだけで、システムは自動的に写真のEXIFデータを分析し、GPS座標を抽出し、地図上に正確な場所を表示します。このサイトの目的は...
1年前
079.8K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI:複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク

包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...
1年前
070.5K
Cohere AI 推出 Rerank 3.5:相关知识排序技术的新时代

Cohere AIがRerank 3.5を発表:関連知識ソート技術の新時代へ

概要 情報爆発時代において、組織はコンテンツを見つけるためだけでなく、効率と生産性を向上させるためにも検索テクノロジーに頼るようになった。しかし、従来の検索モデルでは、ユーザーの意図を正しく理解できないことが多く、その結果、不正確で関連性のない、あるいは不完全な検索結果になってしまう。このような経験は、ユーザーをイライラさせるだけでなく...
1年前
044.3K
OpenAi上新Project,0基础构建科研知识库!淘汰人工已成定局

OpenAi 新プロジェクト、0ベースで研究知識ベースを構築!人工排除は当然の結論

誰でも0ベースからカスタマイズできる「研究知識ベースモデル」。人為的な顧客サービスのモデルアウトは当然の結論になった! OpenaiがリリースしたProjectの特徴】 1.Projectへのファイルアップロードをサポートし、特定分野の知識ベースを構築する 2. 2.ネットワーキング検索をサポートし、リアルタイムで最新の...
1年前
040.2K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM:大規模言語モデルの推論と処理のための効率的な軽量フレームワーク

包括的な紹介 LightLLMはPythonベースのLarge Language Model (LLM)推論とサービスのフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られています。このフレームワークは、FasterTransfor... を含む様々な有名なオープンソースの実装を活用しています。
1年前
059.8K
Command R7B:增强检索和推理能力,多语言支持,快速高效的生成式 AI

コマンドR7B:検索と推論の強化、多言語サポート、高速で効率的な生成AI

私たちのRファミリーの中で最小のモデルは、一般的なGPUやエッジデバイス上で強力なAIアプリケーションを構築するための一流のスピード、効率、品質を提供します。 本日、エンタープライズ向けに特別に開発された大規模言語モデル(LLM)であるCommand R7Bをリリースできることを嬉しく思います。
1年前
042.4K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件

Artab:ブラウザで開いた新しいタブで世界の名画を表示、Chromeプラグイン

一般的な説明 Artabは、新しいタブを開くたびに世界の素晴らしい芸術作品を紹介するように設計されたブラウザ拡張機能です。この拡張機能はChrome、Edge、Firefoxブラウザで利用できます。Artabを使用すると、ユーザーはブラウズすることができます...
1年前
055.8K
智谱发布的免费视觉模型GLM-4V-Flash并发数限制提升到10,这次生产环境够用了

スマートスペクトラムは、ビジョンモデルGLM-4V-Flashの同時実行数制限を10に引き上げ、本番環境向けに無償リリースしました。

GLM-4Vシリーズ GLM-4Vシリーズには、異なるアプリケーションシナリオに適した3つのモデルがあります。 GLM-4V-Plus:優れたマルチモーダル理解能力を持ち、最大5枚の画像を同時に処理でき、ビデオコンテンツの理解もサポートしているため、複雑なマルチメディア分析シナリオに適しています。 ...
1年前
066.9K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频

VideoFX(Veo2):高い物理的状態の再現性とネイティブ4Kビデオ出力を備えたAI生成クリエイティブビデオ

概要 VideoFXは、クリエイティブで視覚的に美しいビデオコンテンツを簡単に作成できるように設計された、Google Labsの革新的なビデオ生成ツールです。このツールは、高度な Veo 2.0 テクノロジーを利用して、さまざまなクリエイティブな用途に適した幅広いビデオ効果と編集機能を提供します。
1年前
059K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

ウィスク:複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します!

概要 WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマ、シーン、スタイルをミックスできるように設計されています。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用します...
9ヶ月前
060.8K
SiliconCloud上线加速版视频模型Mochi-1-Preview

シリコンクラウド、高速ビデオモデル「Mochi-1-Preview」を発表

先日、GenmoAIは高忠実度のアクションと堅牢なキューフォロー機能を備えたビデオ生成モデルmochi 1 preview (10B)をオープンソース化し、現在480p解像度のビデオ生成をサポートしている。本日、シリコンベースのフローであるSiliconCloudが、mochiの推論アクセラレーション・バージョンを公開した。
1年前
037.6K
如何将copilot安装到国内电脑

国内パソコンへのコパイロットのインストール方法

Windows 11ユーザーの場合、梯子を掛けてもコパイロットボタンが国に表示されないので、多くのユーザーにとっては少し不便だ。 しかし、この記事は、タスクバーにコパイロットを表示する便利な方法を介して達成することができ、その使用は正方形にすることができます...
1年前
047.6K
这个AI设计软件厉害了,只要一张产品图就能生成专业的电商主图,爆款产品这不就来了嘛。

このAI設計ソフトウェアは素晴らしいです、限り、製品の画像は、プロの電子商取引のメイン画像を生成することができ、よく来ていない製品をポップアップ。

競争の激しい今日のeコマース市場において、いかにして商品を多くの選択肢の中から目立たせるかは、あらゆるブランドやビジネスが直面しなければならない課題となっている。 Eコマースを成功させる重要な要素の1つとして、ビジュアルマーケティングの重要性はいくら強調してもしすぎることはありません。 魅力的でプロフェッショナルな商品イメージのディスプレイは...
9ヶ月前
041.7K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa:高忠実度モデルのバーチャル試着とキャラクターポーズ調整、メタ・オープンソース制御キャラクター画像生成モデル

包括的な紹介 Leffaは、制御可能なキャラクター画像を生成するための統一されたフレームワークであり、キャラクターの外見(バーチャルフィッティングなど)やポーズ(ポーズ転送など)の精密な操作を可能にする。このフレームワークは、ターゲットクエリをアテンション層の正しい参照キーにフォーカスさせることで、細かいディテールの歪みを大幅に低減する。
1年前
058.3K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio:ビデオ映像に同期した効果音やサウンドトラックを生成する、ビデオと音声のマルチモーダル共同トレーニングツール

一般的な紹介 MMAudioは、マルチモーダルな共同トレーニングによって高品質な同期音声を生成することを目的としたオープンソースプロジェクトである。香港中文大学のHo Kei Chengらによって開発されたこのプロジェクトの主な機能は、ビデオやテキスト入力に基づいて同期された音声を生成することである。
1年前
061.9K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: ネイティブAI対話および文書処理ツールの柔軟な構成

一般的な紹介 H2O GPTは、プライベート化されたチャットとドキュメント処理機能を提供することを目的としたオープンソースプロジェクトです。このプロジェクトはApache 2.0ライセンスに基づいており、LLaMa2、Mistral、Falconなどの様々なGPTモデルをサポートしています。...
1年前
048.6K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル(LLM)の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...
1年前
057K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT:ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。
1年前
056.9K
PrivateGPT:完全本地化RAG处理流程的文档问答系统

PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム

一般的な紹介 PrivateGPTは、インターネットに接続せずに大規模言語モデル(LLM)を使って文書をクイズすることを可能にする、本番環境で利用可能なAIプロジェクトです。このプロジェクトは、100%のデータプライバシーを保証し、すべてのデータはユーザの実行環境で処分されます...
1年前
053.9K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT:ワークフロー自動化と自律的タスク実行のためのインテリジェントな身体構築プラットフォーム

包括的な紹介 AutoGPTは、継続的に稼働するAIエージェントの作成、導入、管理を支援し、複雑なワークフローを自動化するために設計された強力なプラットフォームです。Significant Gravitas社によって開発されたこのプラットフォームは、幅広いツールと機能を提供し、ユーザがAIエージェントに集中できるようにします。
1年前
055.3K
Vizcom:将草图转化为逼真渲染图的设计工具

Vizcom:スケッチをリアルなレンダリングに変換するデザインツール

概論 Vizcomは、デザインやクリエイティブのプロフェッショナルのための革新的なツールです。AI技術により、ユーザーのスケッチをフォトリアリスティックなレンダリングや3Dモデルに素早く変換することで、デザイン効率を劇的に向上させます。ユーザーは、Vizcomのワークベンチ上でシームレスに共同作業を行うことができます。
1年前
075.6K
YOO简历:智能简历生成工具,在线制作大厂简历范文,提升求职成功率

YOO履歴書:インテリジェントな履歴書生成ツール、大規模な工場の履歴書サンプルのオンライン生産、就職活動の成功率を高める。

概要 YOO履歴書は珠海碧宇科技有限公司によって開発されたインテリジェントな履歴書作成ツールです。新入生から経験豊富な求職者まで、YOOレジュメはパーソナライズされた履歴書テンプレートと...
1年前
047.1K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置

DragGAN: インタラクティブな画像編集ツール、ポイント&クリックとドラッグ&ドロップによる画像位置のコントロール

概要 DragGANは、Generative Adversarial Networks(GAN)をベースとしたインタラクティブな画像編集ツールである。Xingang PanらによってSIGGRAPH 2023で発表され、ポイント・アンド・クリックやドラッグ・アンド・ドロップの簡単な操作で直感的に操作できることを目的としている...
1年前
052.9K
瑞达写作:一键生成论文,免费选题生成论文大纲, 论文润色,引用文献数据

リダ・ライティング:ワンクリックでエッセイを作成、無料でトピックを選んでエッセイのアウトラインを作成、エッセイを推敲、文献データを引用

総合紹介 リダライティングは、学術論文執筆に特化したAIプラットフォームであり、ユーザーの論文執筆タスクを効率的に完了させることを目的としている。論文のタイトルを入力すると、ユーザーはワンクリックで最大50,000語の完全な論文コンテンツを生成することができます。このプラットフォームは、自由なトピックの選択、アイデアのアウトラインなど、様々な機能を提供しています。
1年前
051.5K
Pitch:利用AI生成或模板中创建专业的PPT在线演示文稿

ピッチ:AI生成またはテンプレートを使用してオンラインでプロフェッショナルなPPTプレゼンテーションを作成する

概要 Pitchは、急成長するチームのために設計されたオンラインプレゼンテーション作成プラットフォームです。豊富なテンプレートと強力なコラボレーションツールで、プロフェッショナルなプレゼンテーションを簡単に作成できます。営業チーム、デザインチーム、マーケティングチームのいずれであっても、Pitch...
1年前
060.2K
Ajelix:智能化Excel数据分析工具,接入多种数据源,AI生成各类可视化分析图表

Ajelix:インテリジェントなExcelデータ分析ツール、様々なデータソースへのアクセス、様々なタイプの視覚的分析チャートを生成するAI

概要 Ajelixはデータ分析とビジネスインテリジェンスに特化したプラットフォームであり、ExcelとGoogle Sheetsの使用を簡素化し、強化するための様々なAIツールを提供している。このプラットフォームには、エクセルの数式ジェネレーターやデータ...
1年前
062.3K
PDFgen:一键生成各类PDF合同范本模板,简化文档处理

PDFgen:あらゆる種類のPDF契約書テンプレートを生成し、文書処理を簡素化するキー

概 要 PDFgenは、簡単なテキストプロンプトからPDFテンプレートを生成することに特化した人工知能ベースのツールです。このプラットフォームの主な機能はPDF作成の自動化であり、特に文書を定期的に扱う企業や個人に適しています。PDFgenはREST APIを提供します。
1年前
057.4K
Deepnote:人工智能驱动的专业数据分析与科学团队协作平台

Deepnote:専門的なデータ分析と科学チームのコラボレーションのためのAI搭載プラットフォーム

概要 Deepnoteは、データ分析およびデータサイエンスチームのために設計されたコラボレーションノートブックプラットフォームです。Python、SQL、ノーコード分析を組み合わせ、50以上のデータソースに接続することができます。DeepnoteはGPT-4を活用し、汎用的なデータ分析機能を提供します。
1年前
057.6K
PDFGPT:提供PDF文件摘要和问答功能

PDFGPT: PDF 文書の要約と Q&A 機能の提供

一般的な紹介 PDFGPTは、PDFファイルを処理するために設計された人工知能ベースのツールです。ユーザーはPDF文書をアップロードし、ツールを使って文書の要約を取得し、関連する質問に答えることができます。PDFGPTは、学生、研究者、ジャーナリスト、ビジネスプロフェッショナルのいずれにもご利用いただけます。
1年前
053.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。
1年前
069.6K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

ミニカバー:ブログ、ショートビデオ、ソーシャルメディアなどにパーソナライズされたカバーを作成するために設計されたオンラインカバーメーカー!

概要 Mini-Coverは、ブログやショートビデオ、ソーシャルメディアなどのプラットフォーム用にパーソナライズされたカバーを生成するために設計されたオープンソースのオンラインカバー生成ツールです。JLinMrによって開発されたこのツールは、シンプルで効率的なソリューションを提供し、ユーザーのニーズに合ったカバーを素早く生成することを目的としています。
1年前
054.5K
利用帕累托法则(80/20法则)作为提示指令高效学习核心知识

パレートの法則(80/20の法則)を手がかりとした効率的なコア知識の学習

スナックプロンプトのサイトでは、非常にシンプルでありながら、16Kビューに近いホットなプロンプトが、学習の重要な部分を見つけるために2の法則または8の法則を使用することを中心にしています。 パレートの原理(パレート)は、20%の概念に注目することを提案している。
1年前
050.7K
2024年度RAG清单,RAG应用策略100+

2024 RAG目録、RAG応用戦略 100以上

2024年を振り返ると、大きなモデルは日々変化し、何百もの知的体が競争している。AI応用の重要な一翼を担うRAGもまた、「英雄と領主の集団」である。年初はModularRAGが熱を帯び続け、GraphRAGが話題を呼び、中旬にはオープンソースツールが本格化し、ナレッジグラフが...
1年前
050.6K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown:Microsoftドキュメントインテリジェント変換ツール、様々なファイルをMarkdown形式に変換

一般的な紹介 MarkItDownはMicrosoftによって開発されたPythonツールで、様々なファイルやオフィス文書をMarkdown形式に変換するように設計されています。このツールは、PDF、PowerPoint、Word、Excel、ダイアグラム...など、幅広い種類のファイルをサポートしています。
1年前
059.8K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア:クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス(CLI)で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。
1年前
056.6K
ZenUML:基于简单文本代码创建序列图和流程图

ZenUML: シンプルなテキストコードに基づくシーケンス図とフローチャートの作成

ZenUMLは、シーケンス図やフローチャートの作成に特化した、マルチプラットフォーム対応のダイアグラム・アズ・コード・ソリューションです。ブラウザ上でダイアグラムをリアルタイムにレンダリングすることで、サーバーサイドのインタラクションの遅延を回避し、非効率的なドラッグ&ドロップ操作や読み込みの遅いアニメーションによってユーザーの思考プロセスが中断されることを防ぎます。
1年前
059.6K
微软新模型:Phi-4来了,14B参数媲美更大规模模型

マイクロソフトの新モデル:ファイ-4が登場、大型モデルに匹敵する14Bのパラメータを持つ

わずか140億(14B)のパラメータを持つPhi-4は、革新的な学習方法と高品質なデータにより、いくつかの大規模モデルに匹敵する、あるいはそれを上回る性能を示している。本論文では、Phi-4のアーキテクチャ、特徴、学習方法、および、その実用的な応用例について詳述する。
1年前
043.5K
Swarms:多智能体编排框架,企业级生产工具

Swarms: マルチインテリジェンス・オーケストレーション・フレームワーク、エンタープライズ・プロダクション・ツール

概要 Swarmsは、効率的なエージェント管理とタスク処理によってビジネスの生産性を向上させるために設計された、エンタープライズグレードのプロダクション対応マルチエージェント・オーケストレーション・フレームワークです。複数のモデル、複数のメモリシステム、カスタムエージェントの作成をサポートするこのフレームワークは、モジュール設計と包括的なロギング機能を提供し、システム...
1年前
047K
算了么:共享你电脑闲置 GPU 显卡算力赚钱,支持科学研究

忘れてください:あなたのコンピュータの未使用GPUグラフィックスパワーを共有し、お金を稼いで科学研究を支援しましょう!

包括的な紹介 Nevermindは、アイドル状態のグラフィックカードの演算能力を利用して科学計算を行い、収益を得るプラットフォームです。ユーザーは、自分のコンピュータのアイドル状態のGPUリソースを共有することで、科学研究と技術進歩をサポートし、同時に一定の金銭的見返りを得ることができます。このプラットフォームは、科学の進歩を促進し、科学研究の重要な問題を解決することを目的としています。
1年前
080.4K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

ソニック:音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作

概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。
12ヶ月前
068.8K
AI全栈利器开源!带你用Ollama+Qwen2.5-Code跑bolt.new,一键生成网站

オープンソースのAIフルスタックツール!Ollama+Qwen2.5-Codeのrunbolt.newで、ワンクリックでウェブサイトを生成!

Cursor、V0、Bolt.newから最近のWindsurfまで、AIプログラミング・ツールは最近とてもホットだ。 この記事では、まずオープンソースのソリューションであるBolt.newについて話をしよう。Bolt.newは、製品発表からわずか4週間で400万ドルの収益を上げた。 このサイトはどうしようもない状態...
1年前
041.6K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル(LLM)です。従来の音声認識システムとは異なり、Ultravoxは音声認識(ASR)ステージを別途用意する必要がなく、音声を直接高次元空間に...
1年前
062.2K
infinite-zoom-stable-diffusion:生成无限缩放循环视频

infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。

包括的な紹介 無限ズーム安定拡散(Infinite Zoom Stable Diffusion)は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...
1年前
055.9K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...
1年前
0100.3K
卷起来了!长文本向量模型分块策略大比拼

ロールアップ長文ベクトルモデル チャンキング戦略 コンペティション

ロングテキスト・ベクター・モデルは、10ページ分のテキストを1つのベクターにエンコードできる。 多くの人はこう考える。 必ずしもそうではない。 直接使ってもいいのか?チャンクすべきか?最も効率的な分割方法は?この記事では、長文ベクトルモデルの様々なチャンキング戦略について徹底的に議論し、その結果を分析します。
1年前
039.4K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。

リサーチラビット:ネイティブのLLMを使用し、ユーザーが指定したトピックに自動的にドリルダウンし、サマリーを生成するWebリサーチとレポート作成。

はじめに Research Rabbitは、LLM(Large Language Model)ベースのウェブリサーチおよび要約アシスタントです。ユーザがリサーチトピックを提供すると、Research Rabbitは検索クエリを生成し、関連するウェブ結果を取得し、これらの結果を要約します...
12ヶ月前
064.7K