最新のAIリソース

共 3094 篇文章
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

ディフューザー画像アウトペイント:超強力なオープンソースAI画像拡張ツール、画像アウトペイント(outpainting)

一般的な紹介 Diffusers Image Outpaintは、Hugging Faceコミュニティメンバーのfffiloniによって作成された強力なAI画像拡張ツールです。このツールは、高度な拡散モデリング技術を利用して、画像を...
2年前
070.5K
Morphik Core:处理多模态数据的开源 RAG 平台

Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォーム

一般的な紹介 Morphik Coreはmorphik-orgチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。以前はDataBridge Coreと呼ばれていましたが、現在はMorphik Coreに改名されています。
1年前
070.4K
Tempo Labs:使用AI快速构建React应用,多职能协作的React可视化编辑器

Tempo Labs: AIを使ったReactアプリの迅速な構築、多機能コラボレーションのためのReactビジュアルエディタ

一般的な紹介 Tempo Labsは、人工知能技術を使用して、開発者やデザイナーがReactアプリケーションを迅速に構築できるように支援するプラットフォームです。直感的なドラッグ&ドロップエディターと豊富なコンポーネントライブラリを提供することで、高品質なユーザーインターフェースの設計・開発を容易にします。
1年前
070.4K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor:見て、聞いて、話すことができるGemini上に構築されたAIデスクトップスマートアシスタント

概論 Gemini Cursorは、GoogleのGemini 2.0 Flash(実験的)モデルをベースとしたデスクトップ知的アシスタントである。Gemini Cursorは、マルチモーダルAPIを通じて、視覚、聴覚、音声によるインタラクションを可能にし、リアルタイムで低遅延な利用を提供します。
1年前
070.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown:Microsoftドキュメントインテリジェント変換ツール、様々なファイルをMarkdown形式に変換

一般的な紹介 MarkItDownはMicrosoftによって開発されたPythonツールで、様々なファイルやオフィス文書をMarkdown形式に変換するように設計されています。このツールは、PDF、PowerPoint、Word、Excel、ダイアグラム...など、幅広い種類のファイルをサポートしています。
1年前
070.3K
TinyWow:免费使用多功能写作与图像在线编辑工具

TinyWow:無料で使える多機能ライティング&画像オンライン編集ツール

はじめに TinyWowは、ユーザーのデジタルライフを簡素化するために設計された、幅広い無料デジタルツールを提供する包括的なオンラインプラットフォームです。PDF管理、ビデオ編集、画像操作、AIによるライティング支援など、TinyWowにはユーザーが必要とするものが揃っています。
1年前
070.3K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio:複数のキャラクターを設定し、顔の一貫性を保つ分割画面管理ツールを備えたAI映画制作プラットフォーム

概要 LTX Studioは、クリエイター、マーケティング担当者、映像制作者、スタジオ向けに設計された、AIを活用した革新的な映像制作プラットフォームです。ストーリーの構想から、分割画面の生成、キネティックエフェクトの追加、ポスト編集まで、全工程の操作が可能で、クリエイティブなコンセプトを...
1年前
070.3K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator:オープンソースのロゴジェネレーター、AIインテリジェンスを使用してプロフェッショナルなブランドロゴを生成します。

一般的な紹介 LogoCreatorは、Together AIとFluxモデルに基づいたオープンソースのロゴ・ジェネレーターで、企業や個人に迅速でプロフェッショナルなロゴ・デザイン・サービスを提供することに焦点を当てています。このプロジェクトは、開発者Nutlopeによって開発され、Gitでオープンソース化されています...
1年前
070.3K
Reshot AI:实时编辑面部表情,人像图片面部表情精细控制

リショットAI:表情のリアルタイム編集、ポートレート写真の表情の微調整

一般的な紹介 Reshot AIは、顔の表情、目の方向、頭のポーズをリアルタイムで調整することに重点を置いた、強力なオンラインAIフォトエディターです。簡単な操作で素早く写真を編集し、プロ並みの高品質な写真に仕上げることができます。
1年前
070.3K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频

Morph Studio: AIでビデオストーリーを作る|テキストからビデオへ|画像からビデオへ

モーフ・スタジオの紹介 モーフ・スタジオは、ストーリーテリングとデザインのユニークな組み合わせを専門とするクリエイティブ・プロダクション・スタジオで、コマーシャル、アニメーション、ミュージックビデオ、ショートフィルムのプロジェクトに取り組んでいます。また、モーフ・スタジオは、新しいプログラム "Mor...
2年前
070.3K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab:専用のOCR認識AIモデル、PDF to Markdown(オープンソース/API)

包括的な紹介 Datalabは、OCR、レイアウト分析、PDFからMarkdownへの変換などに焦点を当てた高度なAIモデルを幅広く提供しています。これらのモデルは高性能であるだけでなく、使いやすくオープンソースです。プラットフォーム上のマーカーモデルは、迅速かつ正確に...
1年前
070.3K
AI Engineer Pack:AI开发者的“免费大礼包”!赠送主流AI工具兑换码

AIエンジニアパック:AI開発者のための「無料バンドル」!主要AIツールの引き換えコード

あなたがAI開発者で、素晴らしいアイデアをたくさん持っているにもかかわらず、ツールの高コストに行き詰っていると想像してみてください。イレブンラボのAIエンジニア・パックは、そんな「開発コスト」の問題を解決します。
1年前
070.2K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型

ModelBest:世界をリードする軽量・高性能エンドサイド・ビッグモデル

概要 ModelBestは、軽量かつ高性能な大型モデルの開発に注力する企業であり、先進的なAI技術をメインストリーム家電や日常生活のあらゆるエンドデバイスに応用することに専念している。同社のMiniCPMシリーズは、非常に高い演算能力とメモリ使用効率を備えたエンドサイドモデルです。
2年前
070.2K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE:オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。
1年前
070.2K
HyperBooth AI:用一张自拍照快速生成不同风格照片

HyperBooth AI:1枚の自撮り写真からさまざまなスタイルの写真を素早く生成

概要 HyperBooth AIは、自撮り写真をアップロードするだけで、様々なスタイルのAI写真を瞬時に生成できるサービスプラットフォームです。ユーザーは200以上のプリセットスタイルから選択し、パーソナライズされたアーティスティックな画像を作成することができます。このプラットフォーム独自のジェネレーターは、高いシミュレーションを提供し、...
2年前
070.2K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。ワンクリックのデプロイと軽量なゲートウェイ機構により、開発者が複雑なAIアプリケーションを素早く構築できるよう支援し、面倒なエンジニアリングの設定を省きます。
1年前
070.2K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI顔交換:オープンソースの第二アヒルカメラ、フロントとバックエンドの完全なエンタープライズAI顔交換アプレット(演算サービスの支払い、2つのオープンにすることができます)を展開する

総合紹介 LunaAI face swap appletはuniappとVueフレームワークに基づいて開発された顔交換アプリケーションです。このアプリケーションは、PHP、MySQL、Nginx、Redisを利用し、アプレットを通してユーザーの顔を変える機能を実現しています。ユーザはこの小さな...
1年前
070.2K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: Smart Spectrumのグラフィカル・インターフェース自動化のためのオープンソースのインテリジェント視覚言語モデル

包括的な紹介 CogAgentは清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースの視覚言語モデルであり、プラットフォーム間のグラフィカルユーザインタフェース(GUI)操作の自動化を目的としている。このモデルはCogVLM(GLM-4V-9B)をベースにしており、中国語と英語の二ヶ国語をサポートしている。
1年前
070.2K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル(LLM)です。従来の音声認識システムとは異なり、Ultravoxは音声認識(ASR)ステージを別途用意する必要がなく、音声を直接高次元空間に...
1年前
070.1K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

総合紹介 Record Cafeはワンストップの音声/動画処理プラットフォームで、AI動画対話、AI字幕、AI音声テキスト化サービスを提供する。画面録画、動画編集、GIF/音声変換などの機能があり、クラウドストレージや共有もサポートします。インターフェースは直感的で使いやすく、マルチスクリーン録画と多言語スマートフォンにも対応しています。
1年前
070.1K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: レンズ制御とモーション振幅制御をサポートする、画像からビデオへのオープンソースモデルを生成します。

概要 Ruyi-Modelsは、画像から高品質の動画を生成するために設計されたオープンソースプロジェクトです。IamCreateAIチームによって開発されたこのプロジェクトは、768の解像度、毎秒24フレーム、5秒で120フレームの映画のようなビデオの生成をサポートしています。
1年前
070.1K
StudyX:AI驱动的作业解答与学习助手

StudyX:AIを活用した宿題ソリューションと学習アシスタント

StudyXの概要 StudyXは、学生や生涯学習者のために設計されたAI学習プラットフォームで、宿題や学習リソースに対する迅速かつ正確な回答を提供することに重点を置いています。数学、物理、化学、文学など幅広い科目をサポートしており、ユーザーはテキスト、写真、数式で問題を入力し、詳細な...
1年前
070K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识

セクレタAIサーチ:広告なしで効率的な学術検索サービスを提供、深い知識マイニングの研究モデル

一般的な紹介 Secreta AI Searchは、人工知能技術によって生産性を向上させることに特化したテクノロジー企業である。ユーザーに正確かつ迅速な検索結果を提供することを目指し、広告のない効率的な学術検索サービスを提供しています。シークレットタワーAIサーチは、自社開発の大規模言語モデルMetaLLM...
1年前
070K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画でも、ポッドキャストでも、ローカルファイルでも、MemoAIは簡単に扱うことができます。中国語、英語、日本語など90以上の言語に対応しています。
1年前
070K
Vsub:输入文字或模板生成无需露脸的病毒营销视频

Vsub:テキストやテンプレートを入力し、顔出し不要のバイラル・マーケティング動画を生成する。

概要 Vsubは動画コンテンツ作成の自動化に焦点を当てたプラットフォームで、コンテンツクリエイターが顔のない動画(フェイスレスビデオ)を素早く作成できるように設計されています。人工知能技術を活用し、ユーザーがテキストを入力したり、YouT...
1年前
069.9K
火山方舟:大模型训练与云计算服务,注册送150元等额算力

ボルケーノ・アーク:ビッグモデルのトレーニングとクラウド・コンピューティング・サービス、150ドル相当の算術に申し込む

総合紹介 Volcano Arkは、Volcano Engineが立ち上げたビッグモデルサービスに特化したクラウドコンピューティングプラットフォームで、モデルの選択、トレーニングからアプリケーションまで、完全なソリューションを企業に提供することを目的としています。AI分野におけるByteDanceの深い蓄積に基づき、Volcano Arkは複数のトップAI企業のビッグモデルリソースを統合しています...
1年前
069.9K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力

Tongyi Thousand Questions:アリが立ち上げた、テキスト回答、画像理解、ビデオ解析機能を備えた大規模なマルチモーダルモデル

総合紹介 「同義千問」は阿里雲によって開発されたインテリジェントなビッグモデルで、ディープラーニングと自然言語処理技術を通じて、人間のようなインタラクション体験を提供することを目指している。生活に楽しさを加える創造的なコピーを素早く生成することができ、ユーザーがあらゆる種類の知識を簡単に学ぶことができる学習アシスタントの役割を果たします。最先端の技術と進化する...
1年前
069.8K
Anifusion - AI漫画和动漫图片制作平台,文本描述生成漫画页面和角色图像

Anifusion - AIマンガ・アニメ画像作成プラットフォーム、マンガページやキャラクター画像のテキスト記述生成

アニフュージョンは、AI技術を活用したオンラインAIマンガ・アニメ画像作成プラットフォームで、クリエイターが画力を必要とせずにプロ級のマンガ・アニメ作品を制作することを支援する。ユーザーは説明的なプロンプトを入力するだけで、AIが自動的に漫画ページやキャラクター画像を生成します。このプラットフォームでは、直感的なレイアウト...
11ヶ月前
069.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...
1年前
069.8K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

Analytics GBI (XiYan-SQL): ChatBIのためのテキストからSQLへのインテリジェントデータ分析が簡単に

包括的な紹介 Analyse GBIは、Aliyun Bailianが立ち上げたビッグモデルに基づくインテリジェントなデータ分析製品である。この製品は高度な自然言語処理技術を使用しており、複雑なSQL構文をマスターすることなく、ユーザが自然言語を通じてデータを照会・分析できるようにします。Analytics GBIは、以下のような複数のデータソースをサポートしています。
1年前
069.8K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)

Heeyo:子供たちの学習体験を向上させる知的AIパートナー、子供たちに寄り添うAIコンパニオン(有料)

概要説明 Heeyoは、3歳から11歳のお子様を対象に、インタラクティブなゲームや会話を通じて学習体験を高めるために設計されたAIアプリです。ハーバード大学とスタンフォード大学の教育専門家によって設計されたHeeyoは、数学、科学、社会的情操スキルをカバーする2000以上の学習ゲームを提供しています。子供...
1年前
069.8K
Dream Interpreter AI:免费AI解梦,梦境解析,理解潜意识思维。

Dream Interpreter AI: 無料のAI夢解釈、夢分析、潜在意識の理解。

概論 Dream Interpreter AIは、人工知能技術を使って、ユーザーが自分の夢を解析し、理解するのを助けるプラットフォームである。高度なAIアルゴリズムと夢のシンボルの広範なデータベースにより、ユーザーはパーソナライズされた夢の解釈と視覚化を得ることができます。このプラットフォームは無料で提供されています...
1年前
069.7K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: 遠隔技術面接を支援する目に見えないAIツール

一般的な紹介 Interviewcoderは、技術面接のために設計されたAI支援ツールで、ユーザーがプログラミング面接中に解答を素早く生成し、コードを最適化し、リアルタイムでデバッグできるように設計されています。ステルスデスクトップアプリケーションとして動作し、Zoom、Googl...
1年前
069.7K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon:ネイティブの多言語モデルチャット用iOSアプリ

一般的な説明 FullmoonはiOSデバイス用に設計されたアプリで、ネイティブの大規模な言語モデルとのプライベートチャット機能を提供することを目的としています。このアプリはApple Siliconに最適化されており、iPhone、iPad、Macに対応しています。チャットのユーザー...
1年前
069.6K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

素晴らしいLLMアプリ:優れたオープンソースのLLMアプリを収集・探索し、コマンド1つで素早くデプロイできます!

概要 Awesome LLM Appsは、Shubham Sabooによって作成されたGitHubリポジトリで、素晴らしいLLM(大規模言語モデリング)アプリを幅広く集め、紹介することに特化しています。このリポジトリには、OpenAI、An...
1年前
069.6K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具

AnimeGamer: 言語コマンドでアニメ動画とキャラクターのインタラクションを生成するオープンソースツール

AnimeGamerはテンセントのARC Labが開発したオープンソースツール。ユーザーは、「宗介が紫の車でドライブする」といった簡単な言語コマンドでアニメ動画を生成したり、「魔法少女の冒険」のキキや「スカイシティ」...といった異なるアニメキャラクターを相互作用させたりすることができる。
1年前
069.6K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 動画書き起こし単語レベルタイムライン字幕、動画字幕翻訳、ローカライズ吹き替えオープンソースツール

概要 VideoLingoはNetflixの等級を発生させるように設計されているワンストップビデオ翻訳および局在化のダビング用具である 未加工機械翻訳および複数行のサブタイトルを除去し、全体的な知識を可能にするために良質の吹き替えを加える 言葉の障壁を渡って共有されるため。これによって、言語の壁を越えたグローバルな知識の共有が可能になります。
2年前
069.5K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit:画像修復・編集のオールインワンツール、テンセントアークがリリース

総合紹介 BrushEditは、Tencent ARC Labsが開発したオールインワンの画像修復・編集ツールです。このツールは最新のAI技術に基づいており、画像の欠陥を自動的に識別して修復することができ、ユーザーによるインタラクティブな編集もサポートしています。
1年前
069.5K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合

Pika: 優れたクリエイティブ動画生成|テキストから動画へ|グラフィックから動画へ|画像から動画へのフュージョン

Pika 一般紹介 Pika.artはアイデアを動画にするプラットフォームで、クリエイティブな人々にAI動画作成ツールを提供することを目的としています。面白いクリップ、ソーシャルメディアコンテンツ、ショートフィルムなど、Pika.artはユーザーのイマジネーションを形にします。ユーザー...
11ヶ月前
069.5K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

テキスト生成ウェブUI:複数のバックエンド・サービスをサポートするGradioベースの大規模言語モデル・チャット・インターフェース

概論 テキスト生成ウェブUIは、大規模言語モデル(LLM)のために設計されたGradioベースのウェブUIです。Transformers、llama.cp...を含む様々なテキスト生成バックエンドをサポートしています。
1年前
069.5K
知乎直达:智能问答与搜索工具,获取中文知识精准答案

Zhihuダイレクト:中国の知識に対する正確な回答を得るためのインテリジェントなQ&Aおよび検索ツール

Zhihuダイレクト(zhida.ai)は、Zhihuが立ち上げたAIビッグモデルに基づくインテリジェントなQ&A・検索ツールである。Zhihuコミュニティの高品質なコンテンツをコアとし、複数のデータソースを組み合わせることで、ユーザーに信頼性の高い情報へのアクセスを提供します。ZhihuDirectは、簡潔かつ詳細な回答を生成するだけでなく...
2年前
069.5K
Topaz Labs:AI智能图像和视频处理专家,照片视频修复与无损放大

Topaz Labs: AIインテリジェント画像・映像処理エキスパート、写真映像の復元とロスレス拡大処理

概要 Topaz Labsは、プロのコンテンツクリエイターに最適化されたネイティブワークステーションエクスペリエンスを提供するために設計された、AIにフォーカスした画像およびビデオエンハンスメントソフトウェアを提供しています。強力なシャープネス、ノイズリダクション、拡大...
1年前
069.5K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - ネイルとTongyiが共同で発表した新世代の音声認識モデル

Fun-ASRはNailとTongyi Labsが共同で発表した音声認識の大型モデルです。このモデルは膨大な音声データで学習され、インターネット、テクノロジー、家庭装飾などの多業種の専門用語を正確に識別することができ、認識精度が大幅に向上している。このモデルは推論最適化のためにNailの企業情報と組み合わされ、ファントム...
8ヶ月前
069.4K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

一般的な紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む複数のファイル形式をサポートしています。
1年前
069.4K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex:オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成

概要 Amurexは、The Personal AI Companyによって開発されたオープンソースのAIミーティングアシスタントで、インテリジェントな機能によってミーティングの効率を向上させるように設計されています。Amurexは、リアルタイムのアドバイスを提供し、インテリジェントなサマリーを生成し、ミーティング内容を記録し、自動的にフォローを送信することができます。
1年前
069.4K
OWL:多智能体协作完成现实任务的自动化工具

OWL:現実的なタスクにおけるマルチインテリジェンス・コラボレーションのための自動化ツール

概論 OWL(Optimized Workforce Learning)は、CAMEL-AIチームによって開発されたオープンソースのフレームワークで、実世界のタスクを自動化するためのマルチインテリジェンス・コラボレーションの最適化に焦点を当てている。CAMEL-AIフレームワークに基づいて...
1年前
069.4K
Zuni:读取网页内容提供帮助的侧边栏AI助手

Zuni:ウェブコンテンツを読み取ってヘルプを提供するサイドバーのAIアシスタント

一般的な紹介 ZuniはChromeのサイドバー用のAIアシスタントで、リアルタイムでウェブページを分析し、Gmailの機能を統合することで、ユーザーの作業効率を向上させるように設計されている。開発元はOld House Labs, Inc.で、2024年にGeorge Seabr...によって開発された。
1年前
069.4K
They See Your Photos:基于 Google Vision 照片隐私信息分析

彼らはあなたの写真を見ている:Google Visionに基づく写真プライバシー情報の分析

はじめに They See Your Photos は、ユーザーが写真に隠された個人情報を理解できるようにデザインされた、使いやすいオンライン・ツールである。ユーザーは任意の画像をアップロードすることができ、ウェブサイトは人工知能技術によって画像コンテンツとメタデータを分析し、写真から明らかになる可能性のある詳細を表示します...
1年前
069.3K
Seed-X - 字节跳动推出的开源多语言翻译模型

Seed-X - Wordpressのオープンソース多言語翻訳モデル

Seed-Xは、ByteDanceのSeedチームが立ち上げた多言語翻訳モデルで、70億のパラメータを持ち、28言語の双方向翻訳をサポートする。このモデルは、多言語データの事前学習、コマンドの微調整、強化学習技術を組み合わせて、複雑な言語パターンを効率的に処理し、翻訳品質を向上させる。
9ヶ月前
069.2K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: 1枚の画像から高解像度の3Dモデリングデジタル資産を生成

概論 TripoSGはVAST AI研究チームによって開発されたオープンソースプロジェクトで、1枚の画像から高品質の3Dモデルを生成する。このプロジェクトでは、大規模な整流器フローコンバーター技術を用い、ハイブリッド教師あり学習と高品質なデータセットを組み合わせることで、生成された3Dモデルに...
1年前
069.2K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)

RapBank: 歌詞とバッキングトラックからラップ(Rap)ボーカルを直接生成するモデル(現在オープンデータセット)

概要 RapBankは、ラップ歌詞生成のために設計されたデータセットとツールセットです。このプロジェクトはNZqianによって作成され、YouTubeからラップ曲を収集・処理することで、研究者や開発者に高品質のラップ歌詞データを提供する。
1年前
069.2K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG:マルチモーダル検索と知識グラフ構築をサポートする超長尺動画理解のためのRAGフレームワーク

包括的な紹介 VideoRAGは、非常に長い文脈動画を処理し理解するために設計された、検索機能を強化した生成フレームワークです。このツールは、グラフ駆動のテキスト知識ベースと階層的なマルチモーダルコンテキストエンコーディングを組み合わせ、1つのNVIDIA RTX 3090 GPUで効率的に処理します...
1年前
069.2K
美图奇想大模型:图像与视频生成工具开放平台

Mitochromeのビッグモデル:画像・映像生成ツールのオープンプラットフォーム

総合紹介 MiracleVisionはMeituが開発したAIビジュアルマクロモデリングツールで、ユーザーに多様で高品質な画像・動画生成サービスを提供することに専念している。このウェブサイトでは、その最新バージョンであるMiracleVision 4.0のパワーを紹介します。
1年前
069.2K
Deepseek Artifacts:使用最佳开源模型生成React代码,目标是构建公共前端代码开放数据集

Deepseek Artifacts:公開フロントエンドコードのオープンデータセットを構築することを目標に、最高のオープンソースモデルを使用してReactコードを生成する。

概要 Deepseek Artifactsは、世界最高のオープンソースモデルを使用してReactアプリケーションを作成するためのウェブサイトです。ユーザーは、サイトがDeepseek V3(オリジナルモデル:Met...)をどのように使用するかを記述することで、夢のReactアプリを記述することができます。
1年前
069.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: デスクトップとブラウザの自動化のための自然言語によるインテリジェント・ボディ・ワークフローの構築

概論 Eko は、自然言語記述によって効率的なインテリジェントエージェントワークフローを構築するために設計された、プロダクショングレードの JavaScript フレームワークです。開発者が深いプログラミングをすることなく、AI 技術を使って日常的なタスクを自動化できるよう設計されています。
1年前
069.1K
MemeCam:使用AI生成搞笑表情包,在图片中加入搞笑文字,生成有趣的表情包。

MemeCam:AIを使用して面白い顔文字を生成し、写真に面白いテキストを追加して面白い顔文字を生成します。

概要 MemeCamは、面白い顔文字を生成することに特化した、AIを搭載した革新的なプラットフォームである。ユーザーは画像をアップロードするか、ウェブカメラを使って写真を撮ると、MemeCamは高度なGPT-4oテクノロジーを使って画像を認識し、面白いテキストを自動的に生成する。
1年前
069.1K
llms.txt:为大语言模型提供标准化网站信息文档

llms.txt:大規模言語モデルのための標準サイト情報ドキュメント

包括的な紹介 llms.txtは、Large Language Models (LLM)のために特別に設計された標準化された文書フォーマットです。LLMが推論プロセスで簡単かつ効率的に使用できる、簡潔で構造化された情報をウェブサイトが提供できるようにします。この仕様は、CloudflareとAnthropiによってサポートされています。
1年前
069.1K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

ウィスク:複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します!

概要 WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマ、シーン、スタイルをミックスできるように設計されています。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用します...
11ヶ月前
069.1K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NVインジェスト:複雑なフォーマットのドキュメントを解析し、マルチモーダルデータをメタデータとテキストに抽出する。

包括的な紹介 NV Ingest (NVIDIA Ingest)は、何十万もの複雑で厄介な非構造化PDFやその他の企業ドキュメントを解析するために設計された、早期アクセス可能なマイクロサービス群です。これらのドキュメントをメタデータとテキストに変換し、検索に埋め込むことができます...
1年前
069.1K
removebg:一键去除图片背景,removebg在线免费中文版

removebg:ワンクリックで画像の背景を削除、removebgオンライン無料中国語版

removebg 概要 removebgは、写真の背景を自動的に削除するオンラインツールです。ユーザーは写真をアップロードするだけで、システムは即座に背景のない透明な画像を提供します。 removebgは、高度な人工知能技術を使用して、写真の中の人や動物を認識します。
2年前
069K
Mootion:完整的视觉故事创作平台

Mootion:完全なビジュアルストーリーテリング作成プラットフォーム

一般的な紹介 Mootionは、ユーザーがアイデアをビジュアルストーリーに変えることを支援するために設計されたAIネイティブのコンテンツ作成プラットフォームです。このプラットフォームは、3Dアニメーション、ビデオ制作、ゲーム開発など、複数のクリエイティブなプロセスをカバーし、Blender、Maya、Unityをメインとして動作します。
2年前
069K
Jules:实验性AI代码助手,可自动执行Python和JavaScript编码任务,例如GitHub工作流中的错误修复。

Jules:GitHubワークフローのバグ修正など、PythonやJavaScriptのコーディング作業を自動化する実験的なAIコードアシスタント。

概要 JulesはGoogle LabsのAIコードアシスタントで、開発者のプログラミング効率向上を支援するために設計されている。最新のGemini 2.0フラッシュモデルを統合し、開発者にインテリジェントなコード提案とGithub上での自動化を提供することができます...
1年前
068.9K
Whispers from the Star:米哈游开发的AI实时互动科幻故事游戏

星からのささやき:ミハ・ツーリズムが開発したAIリアルタイム・インタラクティブSFストーリーテリングゲーム

概要 「星からのささやき」(群星低语)は、Anuttacon社が開発したリアルタイムインタラクティブSFストーリーテリングゲームである。ミハ・ツアーの創設者であるハオ・ユー・ツァイによって設立されたAnuttaconによってリリースされたこのゲームは、深宇宙を舞台としており、プレイヤーは...
1年前
068.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口計算機リバースノートは、猿の口計算機アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、Fridaやdexdumpなどの命令を使用するための様々なリバースツールやテクニックが含まれています。
2年前
068.9K
Animation:实时生成3D动画,打造栩栩如生的虚拟角色

アニメーション: リアルタイムで3Dアニメーションを生成し、リアルなバーチャルキャラクターを作成します。

アニメーション・インクは、リアルタイム・ジェネレイティブ・アニメーション技術を専門とするテクノロジー企業である。同社は、高度なAI技術とアニメーションエンジンによって、リアルなバーチャルキャラクターを作成し、Large Language Modelling (LLM)主導のインタラクティブ体験を強化することに専念している。同社は、元メタエンジニアリング...
1年前
068.9K
Portkey:连接多种AI模型并管理应用的开发工具

Portkey:複数のAIモデルを接続し、アプリケーションを管理するための開発ツール

概 要 Portkeyは、企業や開発者がAIアプリケーションを迅速に構築、管理、最適化できるよう支援するプラットフォームです。200以上の大規模言語モデル(LLM)を統合AIゲートウェイで接続し、プロンプト管理、負荷分散、リアルタイム監視などの機能を提供します。このサイトの中心的な目標は、...
1年前
068.9K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます!

概論 Raycast-G4F(GPT4Free)は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...
1年前
068.9K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE:歌詞を完全な曲のベースモデルに変換し、幅広い音楽スタイルをサポートします。

概要 YuEは、歌詞をフルソングに変換することに重点を置いた、オープンソースのフルソング生成ベースモデルです。ボーカル以外の短いスニペットしか生成しない他のモデルとは異なり、YuEはリードボーカルとバッキングボーカルを含む、長さ数分のフルソングを生成することができます。YuEは、歌詞から曲への変換に特化したモデルである。
1年前
068.8K
OpenAI Translator:多平台翻译增强工具|全局划词翻译

OpenAI Translator:マルチプラットフォーム翻訳強化ツール|グローバルストローク翻訳

概論 openai-translatorはOpenAIのChatGPT APIをベースに開発された翻訳支援ツールです。ブラウザプラグインとクロスプラットフォームのデスクトップアプリケーションがあります。翻訳、タッチアップ、要約の3つのモードをサポートし、55の異なる翻訳をカバーします。
2年前
068.8K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: 機械学習論文を実行可能なコードに自動変換する

一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング(LLM)システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。このシステムは、計画言語モデリング...
12ヶ月前
068.8K
Weebo:实时语音聊天机器人,提供自然语言对话体验

Weebo: 自然言語での対話体験を提供するリアルタイム音声チャットボット

はじめに Weeboは、音声認識にWhisper Small、自然言語生成にLlama 3.2、音声合成にKokoro-82Mを利用したオープンソースのリアルタイム音声チャットボットです。このプロジェクトはAman...によって開発されました。
1年前
068.8K
Artflow:创作人物一致性的动画故事和虚拟数字人口播视频

アートフロー:キャラクターを一貫させたアニメーション・ストーリーとバーチャル・デジタル・ポップアップ・ビデオの制作

一般的な説明 Artflowは、ユーザーが写真をアップロードし、専用のAIキャラクターをトレーニングし、キャラクターを統一したビデオやアニメーションストーリーを作成できるオンラインプラットフォームです。初回無料でトレーニングを提供し、ユーザーはアイデンティティをカスタマイズすることで、様々なシナリオに対応したユニークな画像や動画を作成することができます。 月額 ...
2年前
068.8K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツール

概要 SegAnyMoは、カリフォルニア大学バークレー校と北京大学の研究者チームによって開発されたオープンソースプロジェクトで、Nan Huangなどのメンバーが参加している。このツールはビデオ処理に重点を置いており、ビデオ内の任意の動く物体、例えば人、動物、...を自動的に識別し、セグメント化することができる。
1年前
068.7K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet:テキスト記述によるオンプレミス・アプリケーションの迅速な構築と展開

概要 ToolJetは、AIを活用したエンタープライズ・アプリケーション開発プラットフォームであり、簡単な自然言語記述でカスタムAIアプリケーションやエージェントの作成を可能にする。ユーザーは、希望するアプリケーションを記述するだけで、ToolJetがUI、データベース、クエリなどのセットアップをすべて行います。
1年前
068.7K
Viggle:可控人物动作视频生成|视频人物转换风格

Viggle: 制御されたキャラクターアクション動画生成|動画キャラクター変身スタイル

概要 Viggleは、JST-1モデル駆動型の動画生成サービスプラットフォームで、キャラクター動画生成に特化しています。ユーザーは、テキストプロンプトで任意のキャラクターの動きを制御したり、静止画のキャラクターとアクション動画をミックスしたり、テキストだけで動画を作成したりすることができます。現在、Viggle...
1年前
068.7K
文心智能体平台:建立在完整分发渠道和商业闭环的智能体应用

Wenxinインテリジェントボディプラットフォーム:完全な流通チャネルと商業閉鎖の上に構築されたインテリジェントボディアプリケーション

はじめにWenxinインテリジェントボディプラットフォームAgentBuilderはBaiduは、インテリジェントボディ(エージェント)プラットフォームのWenxin大きなモデルに基づいて起動され、独自の産業分野、アプリケーションのシナリオに応じて開発者の大半をサポートし、開発方法のさまざまなタイプを選択し、製品機能の時代の大きなモデルを作成します。開発者は...
1年前
068.6K
Unscreen:自动移除视频背景,轻松制作无背景视频

アンスクリーン:ビデオの背景を自動的に削除し、背景のないビデオを簡単に作成できます。

Unscreenは、自動的にビデオの背景を削除することに焦点を当てた強力なオンラインツールです。ユーザーはビデオをアップロードするか、ビデオへのリンクを提供するだけで、Unscreenは自動的にそれを分析し、複雑なことなく背景を削除します。このツールは、.mp...を含む幅広いビデオフォーマットをサポートしています。
1年前
068.6K