最新のAIリソース

共 3104 篇文章
VEED.IO:AI驱动的简单视频编辑平台

VEED.IO:シンプルなビデオ編集のためのAI搭載プラットフォーム

概論 VEED.IOはブラウザベースのビデオ編集プラットフォームで、AI技術により、プロフェッショナルなビデオを素早く作成することができます。初心者からプロのチームまで、直感的なインターフェースを提供し、複雑なソフトウェアを使わずに編集、字幕の追加、エフェクトの最適化を行うことができます。主な機能には、自動...
1年前
074.2K
通义千问:阿里推出的多模态大模型,拥有文本回答、图片理解、视频解析能力

Tongyi Thousand Questions:アリが立ち上げた、テキスト回答、画像理解、ビデオ解析機能を備えた大規模なマルチモーダルモデル

総合紹介 「同義千問」は阿里雲によって開発されたインテリジェントなビッグモデルで、ディープラーニングと自然言語処理技術を通じて、人間のようなインタラクション体験を提供することを目指している。生活に楽しさを加える創造的なコピーを素早く生成することができ、ユーザーがあらゆる種類の知識を簡単に学ぶことができる学習アシスタントの役割を果たします。最先端の技術と進化する...
1年前
074.2K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT:ジェミニ・モデルを使用して、ワンクリックで短いナレーション付きビデオや長いビデオの要約ビデオを作成する。

包括的な紹介 AI2SRTは、GeminiAIのビッグモデルを使用して、ワンクリックで短いナレーション付きビデオと長いビデオのビデオ要約を生成し、音声とビデオの書き起こし字幕をサポートするオープンソースプロジェクトです。このプロジェクトは、ビデオコンテンツの作成プロセスを簡素化し、効率的な字幕生成と翻訳機能を提供することを目的としています。ユーザーは、字幕を作成した後、その字幕を字幕翻訳ソフトに渡すことができます。
1年前
074.2K
Raycast:电脑桌面上万能的AI生产力工具

レイキャスト:コンピュータデスクトップ用の万能AI生産性ツール

概要説明 Raycastは、Macユーザーのために設計されたオールインワンの生産性ツールで、シンプルな検索ボックスとショートカットキー操作によって、アプリの起動、ファイルの検索、タスクの管理、さらにはスマートホームのコントロールを素早く行うことができます。macOS独自のS...
1年前
074.2K
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势

アバターポーズメーカー:パーソナルなスタンドアップ骨格ポーズのオンライン生成

概要 アバターポーズメーカーは、パーソナルなスタンドアップポーズをデザイン・生成できるオンラインツールです。お気に入りのポーズを作成することができ、3Dモデルをコントロールするシンプルで効果的な方法を提供します。特に初心者に適しています。
2年前
074.1K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...
1年前
074.1K
火山方舟:大模型训练与云计算服务,注册送150元等额算力

ボルケーノ・アーク:ビッグモデルのトレーニングとクラウド・コンピューティング・サービス、150ドル相当の算術に申し込む

総合紹介 Volcano Arkは、Volcano Engineが立ち上げたビッグモデルサービスに特化したクラウドコンピューティングプラットフォームで、モデルの選択、トレーニングからアプリケーションまで、完全なソリューションを企業に提供することを目的としています。AI分野におけるByteDanceの深い蓄積に基づき、Volcano Arkは複数のトップAI企業のビッグモデルリソースを統合しています...
1年前
074.1K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX:マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ

包括的な紹介 MedRAXは、胸部X線(CXR)解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。
1年前
074.1K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致

LTX Studio:複数のキャラクターを設定し、顔の一貫性を保つ分割画面管理ツールを備えたAI映画制作プラットフォーム

概要 LTX Studioは、クリエイター、マーケティング担当者、映像制作者、スタジオ向けに設計された、AIを活用した革新的な映像制作プラットフォームです。ストーリーの構想から、分割画面の生成、キネティックエフェクトの追加、ポスト編集まで、全工程の操作が可能で、クリエイティブなコンセプトを...
1年前
074K
Morph Studio:用AI创作视频故事|文本转视频|图像转视频

Morph Studio: AIでビデオストーリーを作る|テキストからビデオへ|画像からビデオへ

モーフ・スタジオの紹介 モーフ・スタジオは、ストーリーテリングとデザインのユニークな組み合わせを専門とするクリエイティブ・プロダクション・スタジオで、コマーシャル、アニメーション、ミュージックビデオ、ショートフィルムのプロジェクトに取り組んでいます。また、モーフ・スタジオは、新しいプログラム "Mor...
2年前
074K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2Bオープンコンピュータの使用:E2BサンドボックスでAIオペレーティングシステムを安全に実行する

概要 E2B Open Computer Useは、E2B Desktop Sandboxを通じて、安全なクラウドベースのLinuxコンピュータ利用体験を提供することを目的としたオープンソースプロジェクトです。E2B Sandboxは、ユーザが任意の大規模コンピュータに接続できるデスクトップグラフィカル環境を提供します。
1年前
074K
Replit Agent:智能编程助手

リプリット・エージェント:インテリジェント・プログラミング・アシスタント

概論 Replit Agentは、自然言語処理技術によってソフトウェアプロジェクトの構築を支援するために設計された、株式会社リプリットによるAIプログラミングツールです。ユーザは簡単な指示や質問(プロンプト)を与えるだけで、Replit Agentが自己...
1年前
073.9K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 入力テキストから話者固有の音声合成モデルを生成する

一般的な紹介 Parler-TTSは、Hugging Face社によって開発されたオープンソースの音声合成(TTS)モデルライブラリで、高品質で自然な音声を生成するように設計されています。このモデルは、特定の話者スタイル(性別、ピッチ、話し方など)の入力テキストに基づいて音声を生成することができます。
1年前
073.9K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon:ネイティブの多言語モデルチャット用iOSアプリ

一般的な説明 FullmoonはiOSデバイス用に設計されたアプリで、ネイティブの大規模な言語モデルとのプライベートチャット機能を提供することを目的としています。このアプリはApple Siliconに最適化されており、iPhone、iPad、Macに対応しています。チャットのユーザー...
1年前
073.9K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: オンライン写真加工ツール、ワンクリックキーイング、透かし除去、写真修復、ポートレート編集

総合紹介 ZuoSugar(PicWish)は、豊富なオンライン写真編集ツールを提供し、すべてのプラットフォームの使用をサポートするインテリジェントなAI画像処理プラットフォームです。ユーザーは簡単にワンクリックでキーイング、透かし除去、ぼやけた写真を鮮明に、ロスレスズーム、画像トリミング、画像圧縮、白黒写真を完成できます。
2年前
073.9K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル(LLM)です。従来の音声認識システムとは異なり、Ultravoxは音声認識(ASR)ステージを別途用意する必要がなく、音声を直接高次元空間に...
2年前
073.8K
ChatOn:多功能 AI 聊天与创意工具

ChatOn: 汎用AIチャット&クリエイティビティツール

ChatOnは、GPT-4oとClaude 3.5をベースにした多機能なAIプラットフォームで、インテリジェントなチャット、文章作成支援、画像生成、文書処理を提供します。ユーザーは、テキストまたは音声入力を使用して、ソーシャルネットワークの生成などのタスクを迅速に完了することができます。
1年前
073.8K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex:オープンソースのAI会議記録アシスタント、会議内容を自動記録して要約を生成

概要 Amurexは、The Personal AI Companyによって開発されたオープンソースのAIミーティングアシスタントで、インテリジェントな機能によってミーティングの効率を向上させるように設計されています。Amurexは、リアルタイムのアドバイスを提供し、インテリジェントなサマリーを生成し、ミーティング内容を記録し、自動的にフォローを送信することができます。
1年前
073.7K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツール

概要 SegAnyMoは、カリフォルニア大学バークレー校と北京大学の研究者チームによって開発されたオープンソースプロジェクトで、Nan Huangなどのメンバーが参加している。このツールはビデオ処理に重点を置いており、ビデオ内の任意の動く物体、例えば人、動物、...を自動的に識別し、セグメント化することができる。
1年前
073.7K
析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

Analytics GBI (XiYan-SQL): ChatBIのためのテキストからSQLへのインテリジェントデータ分析が簡単に

包括的な紹介 Analyse GBIは、Aliyun Bailianが立ち上げたビッグモデルに基づくインテリジェントなデータ分析製品である。この製品は高度な自然言語処理技術を使用しており、複雑なSQL構文をマスターすることなく、ユーザが自然言語を通じてデータを照会・分析できるようにします。Analytics GBIは、以下のような複数のデータソースをサポートしています。
1年前
073.7K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio:ビデオ映像に同期した効果音やサウンドトラックを生成する、ビデオと音声のマルチモーダル共同トレーニングツール

一般的な紹介 MMAudioは、マルチモーダルな共同トレーニングによって高品質な同期音声を生成することを目的としたオープンソースプロジェクトである。香港中文大学のHo Kei Chengらによって開発されたこのプロジェクトの主な機能は、ビデオやテキスト入力に基づいて同期された音声を生成することである。
2年前
073.7K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: 動画から字幕へのネイティブクライアント、多言語字幕の変換

概要 MemoAIは、ビデオやオーディオファイルをテキスト、字幕、メモに変換するために設計された強力なビデオ翻訳ツールです。YouTubeの動画でも、ポッドキャストでも、ローカルファイルでも、MemoAIは簡単に扱うことができます。中国語、英語、日本語など90以上の言語に対応しています。
2年前
073.7K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor:見て、聞いて、話すことができるGemini上に構築されたAIデスクトップスマートアシスタント

概論 Gemini Cursorは、GoogleのGemini 2.0 Flash(実験的)モデルをベースとしたデスクトップ知的アシスタントである。Gemini Cursorは、マルチモーダルAPIを通じて、視覚、聴覚、音声によるインタラクションを可能にし、リアルタイムで低遅延な利用を提供します。
1年前
073.7K
阿里妈妈创意中心:淘宝生态下的智能化营销创意支持平台

AliMamaクリエイティブセンター:タオバオエコロジーのインテリジェントマーケティングクリエイティブサポートプラットフォーム

総合紹介 Alimama Creative Centreはアリババのインテリジェントなマーケティングクリエイティブサポートプラットフォームで、タオバオやTmallなどのECプラットフォームの加盟店に、グラフィックから動画、ランディングページまで、あらゆるクリエイティブサポートを提供するように設計されています。AIによるインテリジェントなコピーライティング機能と膨大なテンプレートを組み合わせることで、Creative Centreはデザイン効率を飛躍的に向上させます。
2年前
073.7K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源

Petals:大規模言語モデルの実行と微調整をGPUで分散共有し、BitTorrentネットワークのようにGPUリソースを共有する。

一般的な紹介 Petalsは、BigScienceワークショップによって開発されたオープンソースプロジェクトで、分散コンピューティングアプローチによって大規模言語モデル(LLM)を実行する。コンシューマーグレードのGPUやGoogle Co...
2年前
073.7K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite:3Bパラメトリック・ビジュアルモデル駆動型ウェブ自動化ツール

包括的な紹介 Proxy Liteは、Convergence AIによって開発されたオープンソースの軽量なWeb自動化ツールで、Proxyのミニバージョンとしてオープンウェイト設計になっています。3BパラメータのVisual Language Model (VLM)をベースにしており、自己...
1年前
073.6K
FinChat:智能股票研究平台,美股公开财报分析

FinChat: インテリジェントな株価調査プラットフォーム、米国公開株収益分析

概論 FinChatは、投資家に高品質の金融データと分析ツールを提供するために設計された、AIを搭載した株式調査プラットフォームです。750社以上の企業データと100社以上のスーパー投資家の投資情報を統合することで、FinChatはユーザーが素早く市場にアクセスできるよう支援します。
1年前
073.6K
DH live:在30/40系显卡流畅实时交互的AI数字人

DHライブ: 30/40シリーズグラフィックスカードでスムーズなリアルタイムインタラクションを実現するAIデジタルピープル

一般的な紹介 DH_liveは、サンプルレスラーニングに基づいたリアルタイムのライブデジタルヒューマンプロジェクトで、スムーズでインタラクティブなライブストリーミング体験をユーザーに提供することを目的としています。このプロジェクトは、NVIDIA 30および40シリーズのグラフィックカードをサポートし、25fps以上でリアルタイムに実行することができます。ユーザーは...
2年前
073.6K
Midreal AI:互动式AI文字冒险游戏和幻想小说创作

ミッドリアルAI:インタラクティブAIテキストアドベンチャーゲームとファンタジー小説執筆

一般的な説明 Midreal AIは、魅力的で刺激的な対話を通じたテキストアドベンチャーゲームで、最先端のAI技術を駆使し、プレイヤーに没入感のある物語体験を提供します。プレイヤーは自分でシナリオを設定して探索し、ゲームを通して多様な物語の糸を体験することができます。このプラットフォームは特に...
2年前
073.5K
QuillBot:智能辅助改写与校对文本的写作工具

QuillBot:文章のリライトと校正をインテリジェントにアシストするライティングツール

概要 QuillBotは、AIベースのオンラインライティング支援プラットフォームで、ユーザーがテキストコンテンツを素早くリライト、校正、最適化できるように設計されています。自然言語処理技術により、文章のリライト、文法チェック、要約、翻訳を提供し、学生、社会人、社内...
1年前
073.5K
iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸

AI:インテリジェントAIフォトエディター|無料画像背景除去|モデル着せ替え|フェイスチェンジ

iFoto 一般的な説明 ifotoはEコマース用に設計された無料のオンラインAI写真編集ツールで、オンライン商品プレゼンテーションを強化するための様々な機能を提供します。AI技術によって衣服モデルをリアルなモデルに変換し、商品のために実際のシーンの多様な背景を提供します。
2年前
073.5K
ClipZap AI换脸工具:快速实现照片和视频的AI换脸(免费)

ClipZap AIフェイススワップツール:写真やビデオのAIフェイスを素早くスワップ(無料)

一般的な説明 ClipZap AI顔置換ツールは、写真やビデオの顔置換のニーズのために設計された主要なAI顔置換ツールです。このサイトでは、高度なAI技術を使用して、ビデオや画像内の人物を自動的に認識し、高品質の顔置換を実行します。面白い絵文字を作成することもできます。
1年前
073.5K
They See Your Photos:基于 Google Vision 照片隐私信息分析

彼らはあなたの写真を見ている:Google Visionに基づく写真プライバシー情報の分析

はじめに They See Your Photos は、ユーザーが写真に隠された個人情報を理解できるようにデザインされた、使いやすいオンライン・ツールである。ユーザーは任意の画像をアップロードすることができ、ウェブサイトは人工知能技術によって画像コンテンツとメタデータを分析し、写真から明らかになる可能性のある詳細を表示します...
1年前
073.4K
AI Engineer Pack:AI开发者的“免费大礼包”!赠送主流AI工具兑换码

AIエンジニアパック:AI開発者のための「無料バンドル」!主要AIツールの引き換えコード

あなたがAI開発者で、素晴らしいアイデアをたくさん持っているにもかかわらず、ツールの高コストに行き詰っていると想像してみてください。イレブンラボのAIエンジニア・パックは、そんな「開発コスト」の問題を解決します。
1年前
073.4K
Consensus:优秀的学术论文搜索引擎

コンセンサス:学術論文のための優れた検索エンジン

Consensusは、AI技術を使って科学研究論文を検索し、要約する検索エンジンである。このプラットフォームでは、ユーザーが「クレアチンは筋肉増強に役立つか?や「ポジティブシンキング瞑想は睡眠を改善できるか?といった質問をし、2億以上の科学論文から洞察を得ることができる。
2年前
073.4K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet:テキスト記述によるオンプレミス・アプリケーションの迅速な構築と展開

概要 ToolJetは、AIを活用したエンタープライズ・アプリケーション開発プラットフォームであり、簡単な自然言語記述でカスタムAIアプリケーションやエージェントの作成を可能にする。ユーザーは、希望するアプリケーションを記述するだけで、ToolJetがUI、データベース、クエリなどのセットアップをすべて行います。
1年前
073.4K
Zuni:读取网页内容提供帮助的侧边栏AI助手

Zuni:ウェブコンテンツを読み取ってヘルプを提供するサイドバーのAIアシスタント

一般的な紹介 ZuniはChromeのサイドバー用のAIアシスタントで、リアルタイムでウェブページを分析し、Gmailの機能を統合することで、ユーザーの作業効率を向上させるように設計されている。開発元はOld House Labs, Inc.で、2024年にGeorge Seabr...によって開発された。
1年前
073.3K
Dzine:可控的AI图像生成功能与画布设计工具,提供数百种图像风格样式

Dzine:制御可能なAI画像生成機能とキャンバスデザインツール。

概要 Dzine(旧Stylar)は、画像生成から編集までの統合ワークフロー、比類のない画像合成、スタイルコントロールを提供するオールインワンAIデザインプラットフォームです。あらかじめ定義されたスタイルにより、あらゆるレベルのユーザーが複雑な作業をすることなく、簡単にデザインをカスタマイズすることができます。
2年前
073.3K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用

ARドローイング:ARとAI技術を使ってリアルな手描きのスキルを高めるアプリ

概要 AR Drawingは、拡張現実(AR)技術を使用して、ユーザーのデッサンスキルの向上を支援するアプリです。このアプリは、初級から上級レベルまでの様々な描画テンプレートをカバーする200以上のステップバイステップのガイド付き描画レッスンを提供しています。ユーザーは、携帯電話のカメラを使って画像を投影することができます...
2年前
073.3K
TinyWow:免费使用多功能写作与图像在线编辑工具

TinyWow:無料で使える多機能ライティング&画像オンライン編集ツール

はじめに TinyWowは、ユーザーのデジタルライフを簡素化するために設計された、幅広い無料デジタルツールを提供する包括的なオンラインプラットフォームです。PDF管理、ビデオ編集、画像操作、AIによるライティング支援など、TinyWowにはユーザーが必要とするものが揃っています。
1年前
073.3K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT:自動化されたAIインテリジェンスを作成・実行するオープンソースプロジェクト

一般的な紹介 AgentGPTは、Reworkdチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、ユーザーがブラウザを通して自律的にAIインテリジェンスを作成、設定、デプロイできるように設計されています。ユーザーは目標を設定するだけで、AgentGPTは...
1年前
073.2K
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: ゲームチャットコンテンツのリアルタイム翻訳用オープンソースクライアント

概要 DeepRantは、国際サーバーにおける言語の障壁の問題を解決するために設計された、ゲーマー向けのオープンソース翻訳ツールです。ショートカットキーを使ってゲーム内のテキストを瞬時に翻訳することができ、複数の言語による相互翻訳をサポートし、プレイヤーがゲームを終了することなくチャットメッセージを素早く理解し、返信することを可能にします。
1年前
073.2K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: デスクトップとブラウザの自動化のための自然言語によるインテリジェント・ボディ・ワークフローの構築

概論 Eko は、自然言語記述によって効率的なインテリジェントエージェントワークフローを構築するために設計された、プロダクショングレードの JavaScript フレームワークです。開発者が深いプログラミングをすることなく、AI 技術を使って日常的なタスクを自動化できるよう設計されています。
1年前
073.2K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE:歌詞を完全な曲のベースモデルに変換し、幅広い音楽スタイルをサポートします。

概要 YuEは、歌詞をフルソングに変換することに重点を置いた、オープンソースのフルソング生成ベースモデルです。ボーカル以外の短いスニペットしか生成しない他のモデルとは異なり、YuEはリードボーカルとバッキングボーカルを含む、長さ数分のフルソングを生成することができます。YuEは、歌詞から曲への変換に特化したモデルである。
1年前
073.2K
Whispers from the Star:米哈游开发的AI实时互动科幻故事游戏

星からのささやき:ミハ・ツーリズムが開発したAIリアルタイム・インタラクティブSFストーリーテリングゲーム

概要 「星からのささやき」(群星低语)は、Anuttacon社が開発したリアルタイムインタラクティブSFストーリーテリングゲームである。ミハ・ツアーの創設者であるハオ・ユー・ツァイによって設立されたAnuttaconによってリリースされたこのゲームは、深宇宙を舞台としており、プレイヤーは...
1年前
073.2K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口計算機リバースノートは、猿の口計算機アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、Fridaやdexdumpなどの命令を使用するための様々なリバースツールやテクニックが含まれています。
2年前
073.2K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 視覚言語モデルの汎化能力のための低コスト強化学習

包括的な紹介 R1-Vは、低コストの強化学習(RL)を通して視覚言語モデリング(VLM)のブレークスルーを達成することを目的としたオープンソースプロジェクトです。このプロジェクトは、VLMが一般的な計数能力を学習する動機付けとなる、検証可能な報酬メカニズムを利用している。驚くべきことに、R1-Vの2B ...
1年前
073.1K
Pika:优秀的创意视频生成|文生视频|图生视频|图像视频融合

Pika: 優れたクリエイティブ動画生成|テキストから動画へ|グラフィックから動画へ|画像から動画へのフュージョン

Pika 一般紹介 Pika.artはアイデアを動画にするプラットフォームで、クリエイティブな人々にAI動画作成ツールを提供することを目的としています。面白いクリップ、ソーシャルメディアコンテンツ、ショートフィルムなど、Pika.artはユーザーのイマジネーションを形にします。ユーザー...
1年前
073.1K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台

GeekAI: マルチモデルAPI運用バックエンドに完全にアクセス可能な商用多機能AIアシスタントのセルフデプロイメント

包括的な紹介 GeekAIは、AIビッグ言語モデルのAPI実装に基づくAIアシスタントのためのオープンソースソリューションのフルセットです。このプロジェクトは、ChatGPT、Azure、ChatGLM、Xunfei Starfire、Wenxin Yiyinおよび他の多くのp...と統合された運用管理バックエンドが付属しています。
2年前
073.1K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit:画像修復・編集のオールインワンツール、テンセントアークがリリース

総合紹介 BrushEditは、Tencent ARC Labsが開発したオールインワンの画像修復・編集ツールです。このツールは最新のAI技術に基づいており、画像の欠陥を自動的に識別して修復することができ、ユーザーによるインタラクティブな編集もサポートしています。
2年前
073.1K
Weebo:实时语音聊天机器人,提供自然语言对话体验

Weebo: 自然言語での対話体験を提供するリアルタイム音声チャットボット

はじめに Weeboは、音声認識にWhisper Small、自然言語生成にLlama 3.2、音声合成にKokoro-82Mを利用したオープンソースのリアルタイム音声チャットボットです。このプロジェクトはAman...によって開発されました。
1年前
073K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

無限大:無制限の高解像度画像生成のためのビット単位の自己回帰モデリング

概要 Infinityは、FoundationVisionチームによって開発された画期的な高解像度画像生成フレームワークです。このプロジェクトは、革新的なビットレベルの視覚的自己回帰モデリング・アプローチによって、従来の画像生成モデルの限界を打ち破ります。
1年前
073K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: レンズ制御とモーション振幅制御をサポートする、画像からビデオへのオープンソースモデルを生成します。

概要 Ruyi-Modelsは、画像から高品質の動画を生成するために設計されたオープンソースプロジェクトです。IamCreateAIチームによって開発されたこのプロジェクトは、768の解像度、毎秒24フレーム、5秒で120フレームの映画のようなビデオの生成をサポートしています。
2年前
073K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧

タフ・タンAI:AI対話で面接や職場でのコミュニケーション・スキルを磨く

概要 Tough Tongue AIは、タフな会話の練習のために設計された人工知能プラットフォームです。ユーザーは、プリセットシナリオを選択するか、カスタムシナリオを作成することにより、就職面接、給与交渉、営業プレゼンテーションなど、様々な複雑な対話状況をシミュレートすることができます。このプラットフォームは、ビデオと...
1年前
073K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

ディフューザー画像アウトペイント:超強力なオープンソースAI画像拡張ツール、画像アウトペイント(outpainting)

一般的な紹介 Diffusers Image Outpaintは、Hugging Faceコミュニティメンバーのfffiloniによって作成された強力なAI画像拡張ツールです。このツールは、高度な拡散モデリング技術を利用して、画像を...
2年前
073K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...
1年前
073K
Descript:一站式视频与播客编辑,简单如编辑文档

説明: ワンストップでビデオやポッドキャストを編集。

Descript 一般的な説明 Descriptは、パワフルでありながら使いやすいビデオおよびポッドキャスト編集ツールです。業界トップクラスの書き起こし精度とスピード、強力な修正ツールに加え、AI技術で動画をテキストに書き起こしたり、テキストを編集して動画を編集する機能も備えています。さらに...
2年前
073K
法行宝:AI法律顾问,人工智能法律咨询,百度AI法律平台

ファ・シン・バオ:AI法律顧問、人工知能法律相談、百度AI法律プラットフォーム

全面的な紹介 LawXinbaoは百度によって創始されたインテリジェント法律サービスプラットフォームであり、先進的な人工知能技術と専門的な法律知識ベースを統合している。当プラットフォームは、ユーザーに便利で専門的な法律インテリジェントサービスを提供することを目的としており、インテリジェントな法律Q&A、案件分析、契約書レビューなどの機能を備えています。ディープラーニング...
1年前
072.9K
ModelsLab:AI图像生成为主的API服务商|免费体验1000+模型

ModelsLab: AI画像生成ベースのAPIサービスプロバイダー|1000以上のモデルを無料で!

概要 ModelsLabは、テキストを画像、動画、音声、3Dモデルに変換することに特化した、幅広いAI生成ツールを提供するプラットフォームです。このプラットフォームは、開発者や企業がAI生成コンテンツを簡単に作成・統合できる強力なAPIサービスを提供します。
2年前
072.9K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID:キャラクタ一貫性のある映像を生成するポートレート参照マップ、迅速な多端末統合

包括的な紹介 ConsisIDは、北京大学のYuan Rong氏のグループによって開発されたオープンソースプロジェクトであり、周波数分解技術によって、同一性のあるテキストからビデオへの生成(IPT2V)を実現することを目的としている。プロジェクトの中核は、DiT(Diffusion Transfor...
2年前
072.9K
Same:克隆网站UI生成生产级前端代码

同上:ウェブサイトのUIをクローンして、プロダクション・グレードのフロントエンド・コードを生成する

一般的な紹介 Sameは、デザイナーや開発者がウェブインターフェースを素早く複製できるように設計された、シンプルで便利なオンラインツールです。URLを入力することで、ターゲットページの複製をピクセル単位で生成し、ユーザーが手動で再描画する手間を省くことができる。このサイトの核となるのは「コピー...
1年前
072.9K
Chatwise:共享知识变成收入的AI聊天机器人

Chatwise:知識を収益に変えるAIチャットボット

一般的な紹介 Chatwiseは、ユーザーが自分の知識をお金を稼ぐAIチャットボットに変えることを専門に支援するシンプルで便利なプラットフォームです。ファイル、記事、リンクをアップロードするだけで、サイトがすぐにインテリジェントなボットを生成し、他の人があなたのコンテンツから学ぶことができます。
1年前
072.9K
Interviewcoder:辅助远程技术面试的隐形AI工具

Interviewcoder: 遠隔技術面接を支援する目に見えないAIツール

一般的な紹介 Interviewcoderは、技術面接のために設計されたAI支援ツールで、ユーザーがプログラミング面接中に解答を素早く生成し、コードを最適化し、リアルタイムでデバッグできるように設計されています。ステルスデスクトップアプリケーションとして動作し、Zoom、Googl...
1年前
072.9K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown:Microsoftドキュメントインテリジェント変換ツール、様々なファイルをMarkdown形式に変換

一般的な紹介 MarkItDownはMicrosoftによって開発されたPythonツールで、様々なファイルやオフィス文書をMarkdown形式に変換するように設計されています。このツールは、PDF、PowerPoint、Word、Excel、ダイアグラム...など、幅広い種類のファイルをサポートしています。
2年前
072.9K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek:DeepSeekを使用して4年生の単語学習教材を作成するためのオープンソースツール

総合紹介 "Vocabulary Book by DeepSeek "はDeepSeekのビッグモデルに基づいて開発されたオープンソースプロジェクトで、英語学習者が大学英語レベル4(CET-4)の語彙を効率的に習得することを目的としています。プロジェクトはGitHubでホストされています...
1年前
072.9K
VideoFX(Veo2):AI生成创意视频,高物理状态还原,输出原生4K视频

VideoFX(Veo2):高い物理的状態の再現性とネイティブ4Kビデオ出力を備えたAI生成クリエイティブビデオ

概要 VideoFXは、クリエイティブで視覚的に美しいビデオコンテンツを簡単に作成できるように設計された、Google Labsの革新的なビデオ生成ツールです。このツールは、高度な Veo 2.0 テクノロジーを利用して、さまざまなクリエイティブな用途に適した幅広いビデオ効果と編集機能を提供します。
2年前
072.8K
mcp-ui:基于MCP协议的简洁AI聊天界面

mcp-ui: MCPプロトコルに基づいたクリーンなAIチャットインターフェース

包括的な紹介 mcp-uiは、開発者machaojin1917939763によって作成されたオープンソースプロジェクトであり、構築するためのモデルコンテキストプロトコル(MCP)プロトコルに基づき、Webおよびデスクトップ環境のためのサポートです スマート ...
1年前
072.8K
Whisk:上传多张图片,混合主题、场景和风格,创造出独一无二的作品

ウィスク:複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します!

概要 WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマ、シーン、スタイルをミックスできるように設計されています。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用します...
1年前
072.8K
LightLLM:高效的轻量级大语言模型推理和服务框架

LightLLM:大規模言語モデルの推論と処理のための効率的な軽量フレームワーク

包括的な紹介 LightLLMはPythonベースのLarge Language Model (LLM)推論とサービスのフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られています。このフレームワークは、FasterTransfor... を含む様々な有名なオープンソースの実装を活用しています。
1年前
072.8K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)

LunaAI顔交換:オープンソースの第二アヒルカメラ、フロントとバックエンドの完全なエンタープライズAI顔交換アプレット(演算サービスの支払い、2つのオープンにすることができます)を展開する

総合紹介 LunaAI face swap appletはuniappとVueフレームワークに基づいて開発された顔交換アプリケーションです。このアプリケーションは、PHP、MySQL、Nginx、Redisを利用し、アプレットを通してユーザーの顔を変える機能を実現しています。ユーザはこの小さな...
2年前
072.8K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen:オープンソースデジタルヒューマンコース制作プラットフォーム、PPTワンクリック生成クローンデジタルヒューマン講義ビデオ

総合紹介 Easegenはオープンソースのデジタルヒューマン講座作成プラットフォームであり、AI技術によって教育コンテンツの制作と管理の効率化を目指している。このプラットフォームは、コース制作、ビデオ管理からインテリジェントな質問までワンストップソリューションを提供し、ユーザーはデジタル人間説明ビデオコースを作成することができます...
2年前
072.8K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

素晴らしいLLMアプリ:優れたオープンソースのLLMアプリを収集・探索し、コマンド1つで素早くデプロイできます!

概要 Awesome LLM Appsは、Shubham Sabooによって作成されたGitHubリポジトリで、素晴らしいLLM(大規模言語モデリング)アプリを幅広く集め、紹介することに特化しています。このリポジトリには、OpenAI、An...
2年前
072.8K
飞书知识问答:使用飞书文档作为AI知识库

フライブック知識クイズ:フライブックのドキュメントをAI知識ベースとして利用する

総合紹介 Flying Book Knowledge Q&Aは、Flying Bookが発表したAI主導のナレッジ管理・Q&Aツールで、DeepSeek R1のビッグモデル技術を深く統合しています。リアルタイムのネットワーキング検索、マルチフォーマットのファイル解析(文書、画像など)をサポートし、企業のナレッジベースとシームレスにドッキングすることができます。
1年前
072.8K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: モデル統合とデータフロー管理をサポートし、AIチャットインターフェースを迅速に構築するためのツールキット。

包括的な紹介 Ant Design Xは、Ant Groupによってオープンソース化されたツールキットで、開発者がAI主導の対話インターフェースを素早く構築できるように設計されています。豊富なコンポーネントとテンプレートのセットを提供し、OpenAI標準と互換性のあるモデル統合をサポートし、インテリジェントなカスタマーサービス、AIアシスタント、その他のような様々なアプリケーションに適しています。
2年前
072.8K
Diagramming AI:使用AI在线设计UML图和工作流程图

図解AI:AIを使ってオンラインでUML図やワークフロー図をデザインする

概論 Diagramming AIは、人工知能技術を利用して、UMLダイアグラムやワークフロー・チャートを即座に設計・編集できる強力なオンライン・ツールです。このサイトでは、フローチャート、シーケンス図、ガントチャートなど、さまざまなダイアグラム形式を提供しており、ユーザーはテキストを入力するだけでダイアグラムを生成することができます。
1年前
072.7K
OpenManus-RL:微调大模型强化智能体推理与决策能力

OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化

概論 OpenManus-RLは、UIUC-UlabがMetaGPTコミュニティのOpenManusチームと共同で開発したオープンソースプロジェクトであり、GitHubでホストされている。このプロジェクトは、強化学習(RL)技術によって大規模言語モデリング(LLM)を強化する...
1年前
072.7K
HeroUI Chat:将网页设计转为React代码的AI工具

HeroUI Chat:ウェブデザインをReactコードに変えるAIツール

概要 HeroUI Chatは、人工知能に基づいたオンラインプラットフォームです。ユーザーが簡単なテキスト記述やアップロードされたスクリーンショットを使って、美しく制作可能なReactコードを素早く生成するのに役立ちます。このツールは、オープンソースのHeroUIコンポーネントに依存しています。
1年前
072.6K
WeaveFox:前端智能研发平台,能够根据设计图直接生成源代码

WeaveFox:設計図面から直接ソースコードを生成するインテリジェントなフロントエンド開発プラットフォーム

総合紹介 WeaveFoxは、Antグループが立ち上げたAIフロントエンドインテリジェント研究開発プラットフォームであり、AI技術を通じてフロントエンド開発の効率と品質の向上を目指している。このプラットフォームは、Antが独自に開発したBailingマルチモーダルラージモデルに基づいており、設計図面に基づいてフロントエンドのソースコードを直接生成することができ、複数のクライアントと技術スタックをサポートしています...
2年前
072.6K
XAudioPro:专业在线音频剪辑工具|有声书制作|文字转语音|伴奏分离

XAudioPro: プロフェッショナルオンラインオーディオ編集ツール|オーディオブック制作|テキストからスピーチへ|伴奏分離

概要 XAudioProは、プロフェッショナルかつポータブルな先進的なオンラインオーディオリアルタイム編集およびトランスコードツールです。カット、クロップ、コピー、削除、復元、振幅ゲインコントロールなどのプロフェッショナルなオーディオ編集機能をサポートします。また、スペクトルサブトラクションノイズ除去、ローパスノイズ除去などのノイズ除去サービスも提供します。
2年前
072.6K
OpenAI Translator:多平台翻译增强工具|全局划词翻译

OpenAI Translator:マルチプラットフォーム翻訳強化ツール|グローバルストローク翻訳

概論 openai-translatorはOpenAIのChatGPT APIをベースに開発された翻訳支援ツールです。ブラウザプラグインとクロスプラットフォームのデスクトップアプリケーションがあります。翻訳、タッチアップ、要約の3つのモードをサポートし、55の異なる翻訳をカバーします。
2年前
072.5K
SQL Chat:基于 Web 聊天界面的SQL客户端

SQL Chat: ウェブベースのチャットインターフェイスを備えたSQLクライアント

一般的な紹介 SQL Chat はオープンソースの SQL クエリと管理ツールで、自然言語を通してデータベースと対話するように設計されています。ユーザはチャットインターフェイスを通して、問い合わせ、変更、追加、削除などのデータベース操作を行うことができます。このツールは MySQL を含む様々なデータベースをサポートしています。
2年前
072.5K