最新のAIリソース

共 2769 篇文章
Data Agent - 火山引擎推出的新一代企业级数据智能体

データ・エージェント - ボルケーノ・エンジンが提供するエンタープライズクラスの新世代データ・インテリジェンス

データエージェントは、ボルケーノ・エンジンが立ち上げた新世代のエンタープライズグレードのデータインテリジェンスで、データ分析とインテリジェントマーケティングに焦点を当てています。データエージェントは、企業内の構造化データと非構造化データを統合し、綿密な調査と分析に基づいて包括的で詳細な調査レポートを作成します。
5ヶ月前
020.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPTリサーチャー:ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。
7ヶ月前
020.3K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 崑崙王維の音声駆動型デジタル人間創造ツール

SkyReels-A3は、崑崙ワールドワイドグループが開発した音声駆動型デジタルヒューマンクリエーションツールです。SkyReels-A3は、音声駆動型デジタル人体作成ツールで、簡単な入力(例:肖像画像と音声)で高品質の動的ビデオコンテンツを生成したり、静止画を「生き生きと」させたり、既存のビデオのセリフを新しいリップシンクに置き換えてキャラクターが自動的に合わせることができます...
2ヶ月前
020.3K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - アリ・トンイ、視覚的推論モデルを発表

QVQ-MaxはAlitonix社の最先端の視覚推論モデルで、QVQ-72B-Previewのアップグレード版です。画像やビデオコンテンツを「読み取り」、分析と問題解決のための情報と組み合わせることができます。QVQ-Maxは、画像やビデオコンテンツを「読み取り」、分析、推論、問題解決のために情報を組み合わせることができる最先端の視覚推論モデルです。QVQ-Maxの主な機能には、画像解析、ビデオ分析...
4ヶ月前
020.3K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - ウィズダムスペクトラムのオープンソース・クロスオントロジー・エンボディド・ブレインサイズ・コラボレーション・フレームワーク

RoboOS 2.0は、オントロジーを超えた脳と脳のコラボレーションを実現するオープンソースのフレームワークであり、ロボットの単一知能からグループ協調知能への転換を促進する。このフレームワークでは、クラウドブレインが複雑な意思決定とコラボレーションを担当し、スモールブレインモジュールが特定のスキルの実行に集中するという、効率的な役割分担を実現するために「ビッグブレイン」アーキテクチャを採用している。
3ヶ月前
020.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。プロジェクトのスポンサーはsunn...
9ヶ月前
020.2K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Googleオープンソースプログラミングエージェント

Gemini CLIは、強力なAI機能を開発者に提供するために、開発者のエンドポイントにGemini Big Modelを組み込むことに基づいたGoogleのオープンソースAIプログラミングツールである。このツールは、コードを理解し、ファイルを操作し、コマンドを実行し、問題を動的にトラブルシュートし、開発者が効率的にジェネレーションを書けるように支援する。
4ヶ月前
020.2K
Mapify - XMind推出的AI思维导图生成工具

Mapify - XMindのAIマインドマップジェネレーター

MapifyはXMindチームによるAIマインドマップジェネレーターです。テキスト、PDF、ウェブページ、ビデオ、オーディオ、その他のフォーマットを構造化されたマインドマップに素早く変換することができ、ユーザーが重要な情報を効率的に抽出、整理するのに役立ちます。
4ヶ月前
020.2K
魔力设 - AI设计平台,一键智能生成PPT和抠图

MagicSet - AIデザインプラットフォーム、PPTとキーストロークのワンクリック・インテリジェント生成

MagicSetは効率的で便利なオンラインAIデザインプラットフォームで、ユーザーにワンストップデザインソリューションを提供します。このプラットフォームは、50万以上の本物の画像、イラスト、アートキャラクターなどの豊富な著作権素材ライブラリを統合しており、ユーザーは著作権の問題を心配することなく無料で使用することができます。このプラットフォームは20万以上のデザインテンプレートを提供し、その中には...
4ヶ月前
020.2K
探饭 - 字节跳动推出的AI美食推荐工具

スカウティング・ライス - ワードプレスがAI食品レコメンデーションツールを発表

TanRiceは、ByteDanceの子会社であるJitterbugが立ち上げたAI食品推薦ツールであり、Beanbag Big Modelに依存して、パーソナライズされた食品推薦、店舗スカウト比較、食品ヒントやその他のサービスをユーザーに提供する。TanRiceは、ユーザーの味の好みや場所に基づいて、近くのレストランや料理を正確に推薦し、注文を支援し、グループ購入や持ち帰りサービスを提供することができる。
4ヶ月前
020.1K
AiBiao – AI图表处理工具,对话式进行数据查询、清洗、分析

AiBiao - 会話型データクエリ、クレンジング、分析のためのAIチャートツール

AiBiaoは、自然言語との対話を通じて、ユーザーが効率的にデータ処理や分析作業を完了できるように支援するAIチャート処理ツールです。複雑な計算式やコードを必要とせず、対話を通じてデータの照会、クリーニング、結合、計算、分析を行うことができ、データ処理の敷居を低くします。
4ヶ月前
020K
职达AI简历 - AI简历生成与优化平台,精准分析问题、提供优化建议

JobTech AI CV - AI履歴書生成・最適化プラットフォーム。

ジョブAI履歴書は、効率的で便利なインテリジェント履歴書生成・最適化プラットフォームです。AI技術に基づき、ユーザーはプロフェッショナルでパーソナライズされた履歴書を素早く作成することができます。ユーザーは基本的な情報と経験を入力するだけで、短時間で高品質の履歴書を作成することができ、2800以上の美しいテンプレートを提供し、様々な職種をカバーします。
4ヶ月前
020K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作

ショートブレッド - AIコミック生成ツール、自然言語記述でコミックを完成させる

Shortbreadは、ユーザーが簡単な自然言語の説明に基づいて完全なコミックをすばやく作成できるAIコミック生成ツールです。Shortbreadは、描画スキルを必要とせず、テキストを入力するだけで、AIがユニークなキャラクター、シーン、感情を持つパーソナライズされたコミックをすばやく生成します。
4ヶ月前
020K
LitServe:快速部署企业级通用AI模型推理服务

LitServe:エンタープライズグレードの汎用AIモデル推論サービスの迅速な展開

包括的な紹介 LitServeは、FastAPI上に構築されたLightning AIによるオープンソースのAIモデルサービスエンジンであり、汎用AIモデル向けの推論サービスを迅速に展開することに重点を置いている。大規模言語モデル(LLM)、視覚的モデル(Visual...
7ヶ月前
020K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 多言語翻訳・吹き替えに対応したAIデジタルヒューマン動画作成プラットフォーム

HeyGenは、AIを活用したデジタルヒューマンビデオ作成プラットフォームで、合理的なビデオ制作プロセスをサポートし、ユーザーはプロ級のデジタルヒューマンビデオを素早く作成することができます。このプラットフォームは高度なAI技術に基づいており、ユーザーはデジタルキャラクターのイメージと声を完全にコントロールすることができます。
5ヶ月前
020K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。
5ヶ月前
020K
Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - マイクロソフト、人間とコンピュータのコラボレーションのためのオープンソースAIエージェント

Magentic-UIは、マイクロソフトのオープンソースの人間とコンピュータのコラボレーションAIエージェント研究ツールです。Magentic-UIは、ウェブブラウジング、コード実行、ファイル操作などの複雑なウェブタスクを容易にするために、ユーザーと密接に連携することに基づいています。Magentic-UIは、ユーザーと密接に連携し、ウェブブラウジングやコード実行、ファイル操作などの複雑なウェブタスクを容易にすることを基本としています。
4ヶ月前
020K
迅雷MCP - 迅雷推出的AI自动下载服务

迅雷MCP - 迅雷がAI自動ダウンロードサービスを開始

Xunlei MCPは、Xunleiが開始した、AI技術に基づく自動ダウンロードサービスです。このサービスをサポートするAIアプリケーションのユーザーは、音声またはテキスト入力でダウンロードを要求すると、AIが自動的にネットワークリソースを検索し、ダウンロードを開始することができます。Xunlei MCPはPC版XunleiとNAS版Xunleiをサポートし、従来のダウンロードモードを打破する。
4ヶ月前
020K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Qunar Technologiesのオープンソース3Dシーン生成モデル

SpatialGenはQunar Technologyのオープンソース3Dシーン生成モデルであり、拡散モデルアーキテクチャに基づき、テキスト記述、参照画像、3D空間レイアウトに基づいて時空間的に一貫性のあるマルチビュー画像の生成をサポートし、さらに3Dガウスシーンの生成とローミングビデオのレンダリングを行う。
2ヶ月前
019.9K
Comate AI IDE - 文心快码推出多模态、多智能体协同的AI IDE

Comate AI IDE - ウェンセント・クイックコード、マルチモーダル、マルチインテリジェンスのコラボレーションAI IDEを発表

Comate AI IDEは、百度文信Express Codeが発表した業界初のマルチモーダル、マルチインテリジェンス体コラボレーションAIネイティブIDEです。強力なマルチモーダル機能を備え、コードへのキー(F2C)、コードへのイメージ、コードへの自然言語の設計案をサポートし、フロントエンドの開発シナリオでは、卓越したパフォーマンス...
4ヶ月前
019.9K
基于RAG构建提供健康建议的小助手(实验项目)

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築(パイロット・プロジェクト)

概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...
8ヶ月前
019.9K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1-アリが発表したマルチモーダル統一AIモデル

Ovis-U1は、アリババグループのOvisチームによって導入されたマルチモーダル統一モデルで、パラメータ規模は30億である。このモデルは、マルチモーダル理解、テキストから画像への生成、画像編集の3つのコア機能を持ち、先進的なアーキテクチャ設計と協調的かつ統一的なトレーニングメソッドにより、忠実度の高い画像の実現をサポートする。
4ヶ月前
019.9K
Engineering:GitHub自动化代码审查、文档生成和团队报告平台

エンジニアリング:GitHubの自動コードレビュー、ドキュメンテーション、チームレポートプラットフォーム

一般的な紹介 エンジニアリングは、自動コードレビュー、ドキュメント生成、リアルタイムのコードチャットなどの機能を通じて、エンジニアチームの生産性を高めるために設計されたAIツールです。このプラットフォームは、エンジニアリング・スタック全体を文脈的に理解し、エンジニアがツール数を減らすのを支援します。
8ヶ月前
019.9K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn(マジックトライオン) - ZJUやVivoなどが提供するビデオバーチャル試着フレームワーク

MagicTryOnは、浙江大学コンピューター科学技術学院がvivoや他の組織と共同で立ち上げた先進的なビデオバーチャルトライオン・フレームワークである。このフレームワークは、従来のU-Netアーキテクチャを革新的なDiffusion Transformer (DiT)アーキテクチャに置き換え、完全なセルフアテンションマシンと組み合わせたものである。
4ヶ月前
019.9K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。
3ヶ月前
019.9K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Tongyi Chien-quanによる高性能、低コストの言語モデル

Qwen-Flashは、アリババ「同義千問」シリーズに導入された高性能・低価格の言語モデルで、高速レスポンスとシンプルなタスクの効率的な処理のために設計されています。高度なMoE(Mixture-of-Experts)アーキテクチャに基づき、スパースエキスパートネットワークによって実現されています。
2ヶ月前
019.9K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
9ヶ月前
019.9K
Workers AI LLM Playground:云服务商提供的开源AI文本生成模型试用平台

Workers AI LLM Playground: クラウドサービスプロバイダーのオープンソースAIテキスト生成モデルのトライアルプラットフォーム

一般的な紹介 CloudflareはWorkers AI LLM Playgroundを提供する。この先進的なオンライン・プラットフォームでは、ユーザーがメッセージを書いたり応答を微調整したりすることで、さまざまなAIテキスト生成モデルを探求することができる。このプラットフォームでは、qwen1...
1年前
019.9K
咔皮记账 - 商汤科技推出的智能AI记账应用

Kapi Bookkeeping - ShangTechによるインテリジェントAI簿記アプリ

Kapi Bookkeepingは、Shangtang Technologyが発表したインテリジェントなAI簿記アプリケーションである。このアプリケーションは、自動記帳をコア機能とし、自動的に金額とカテゴリーを識別し、音声入力をサポートし、記帳を簡単かつ便利にする。Kapi Bookkeepingは、請求データをインテリジェントに分析し、パーソナライズされた消費サマリーや財務アドバイスを定期的にプッシュすることで、ユーザーをより...
4ヶ月前
019.8K
Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - 統一されたマルチモーダル理解・生成モデル by Tongyi Qianqian

Qwen VLoはTongyi Qianqianチームによって導入されたマルチモーダル統一理解・生成モデルである。クウェンVLoは世界を「理解」し、その理解に基づいて高品質で再現することができ、知覚から生成への飛躍を実現する。VLoは映像の内容を正確に理解し、それに基づいて一貫した高品質の生成を行うことができる。
4ヶ月前
019.8K
元镜 - AI视频创作工具,自动生成脚本

Metascope - スクリプトを自動生成するAIビデオ作成ツール

Metamirrorは、人間とコンピュータの共生エンジンをベースとしたAI映像制作ツールで、クリエイティブなひらめきから完成映像までの効率的な制作をサポートします。自動スクリプト生成、キャラクタースタイル統一、マルチモーダル融合、インテリジェントワークフローなどの機能を備えており、ワンクリックでクリエイティブな動画スクリプト、マルチモーダル分割画面デザインを素早く生成し、完成動画を合成することができます...
5ヶ月前
019.8K
DeepPiano - 智曲科技推出的AI钢琴应用

DeepPiano - Smartquote TechnologyによるAIピアノアプリ

DeepPianoはSmart Music Technologyが開発した、大型モデルを核としたインテリジェントなピアノアプリです。高度な人工知能技術により、ピアノ演奏者や学習者に様々な便利な機能を提供します。DeepPianoは、インテリジェントな楽譜のページめくり、演奏の進捗状況の自動認識、手動操作の不要...
4ヶ月前
019.8K
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット

Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...
2ヶ月前
019.7K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
3ヶ月前
019.7K
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Racerのマルチモーダル音声生成モデル

AudioGen-Omniは、Racerのマルチモーダルオーディオ生成モデルで、ビデオやテキストなどの入力に基づいて高品質のオーディオ、スピーチ、歌を生成します。AudioGen-Omniは、マルチモーダル拡散トランスフォーマーや位相整合トランスフォーマーなどの高度な技術に基づいています。
3ヶ月前
019.6K
WeKnora - 腾讯微信开源的文档理解与语义检索框架

WeKnora - Tencent WeChatオープンソースドキュメント理解と意味検索フレームワーク

WeKnoraはTencent WeChatチームのオープンソースで、Large Language Model (LLM)文書理解と意味検索フレームワークに基づいており、複雑な異種文書コンテンツシナリオの構造のために設計され、モジュラーアーキテクチャを使用するように設計されており、マルチモーダル前処理、セマンティックベクターインデキシング、インテリジェントリコールと大規模なモデルの生成推論の統合...
1ヶ月前
019.5K
有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - Netease Youdaoが発表した新世代のAI総合学習アシスタント

Youdao Little Pは、NetEase Youdaoが発表したAI全教科学習アシスタントで、K12の学生向けに設計され、Youdao Ziyi教育ビッグモデルを搭載し、小学校、中学校、高校の全教科のQ&Aをカバーし、個人的な学習アドバイスを提供する。AI単語検索とAI翻訳機能で、Youdao Little Pは生徒が言語の問題を素早く解決できるようサポートします...
4ヶ月前
019.5K
FactSnap - 新一代AI信息核查工具

FactSnap - 次世代AI情報検証ツール

FactSnapは、ウェブ情報の真偽を迅速に検証する新世代AI情報検証ツールです。複数のモデルと検索エンジンを統合することで、ユーザーがウェブを閲覧している間に、選択したテキストの検証をリアルタイムで実行します。
4ヶ月前
019.5K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

概要 OpenAI Realtime API Next.jsは、Next.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合しています。
10ヶ月前
019.5K
Wide Research - Manus平台推出的多智能体协同功能

ワイドリサーチ - マヌスプラットフォームにマルチインテリジェンス・コラボレーションを導入

ワイドリサーチは、複雑で大規模なタスクを処理するために設計されたManusプラットフォームの強力な機能です。このプラットフォームは、システムレベルの並列処理メカニズムとインテリジェンスコラボレーションプロトコルによって、同時に動作する数百の汎用インテリジェンスをサポートします。
3ヶ月前
019.5K
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR:黄ばんだ古い写真をインテリジェントに復元するAIツール

Bringing Old Photos Back to Lifeは、マイクロソフトの研究者チームによって開発されたオープンソースプロジェクトで、AI技術を使って古い写真を復元することに焦点を当てている。ディープラーニングのアプローチに基づいており、傷などの写真の深刻な劣化問題を扱うことができる。
8ヶ月前
019.4K
飞算JavaAI - AI Java开发助手,自然语言实现全流程智能化开发

Flycount JavaAI - AI Java開発アシスタント、インテリジェント開発の全プロセスの自然言語実装

Flycount JavaAIは、Flycount Technologyが発表したインテリジェントなJava開発アシスタントです。このプラットフォームは自然言語入力をサポートし、要件分析からコード生成まで、インテリジェントな開発の全プロセスを実現します。開発者は要件の説明を入力するだけで、Flycount JavaAIは正確に理解し、完全なエンジニアリングコードフレームワークを生成することができます。
4ヶ月前
019.4K
妙构 - AI视频分析与生成工具,揭示爆款视频创作规律

MyoConstruct(マイオコンストラクト) - AI動画分析・生成ツール、爆発的な動画作成の法則を解き明かす

Miaojiaoは、ディープラーニングアルゴリズムに基づいたプロフェッショナルなAI動画コンテンツ分析・生成ツールで、動画のビジュアル、オーディオ、クリエイティブ構造を全方位的に分析し、爆発的な動画の背後にある法則を明らかにします。Miaojiaoは、構図、色、カメラ言語を分析し、クリエイティブな独自性と感情的な共鳴を評価し、トレンドの洞察と最適化の提案を提供することができます...
4ヶ月前
019.3K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

リンコードIDE - 同義リンコード、AIネイティブ開発環境ツールを発表

Spirit Code IDEは、同義Spirit Codeが発売したAIネイティブ統合開発環境(IDE)で、千題の3大モデルに深く適応し、強力なプログラミング知能体モードを持っており、プロジェクトの認識、コードの検索、端末操作の実行などのタスクを自律的に完了することをサポートします。MCPツールをサポートし、Magic Hitch MCP Squareの3...
5ヶ月前
019.2K
Skywork-SWE-32B - 昆仑万维开源的自主代码智能体基座模型

Skywork-SWE-32B - KunlunWanweiオープンソース自律コードインテリジェントボディベースモデル

Skywork-SWE-32Bは、Kunlun World Wide Webによって導入されたオープンソースの32Bスケールソフトウェアエンジニアリング(SWE)自律コードインテリジェンスベースモデルです。このモデルは、ソフトウェアエンジニアリングのタスクに焦点を当て、強力なリポジトリレベルのコード修復機能を持ち、複数ラウンドのインタラクションと長いテキスト処理を含む複雑なシナリオで実行することができます...
4ヶ月前
019.2K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - アリ、リアルタイムテキスト駆動型トーキングアバター生成フレームワークを発表

OmniTalkerは、アリババが提供するリアルタイムテキストドリブントーキングアバター生成フレームワークです。このフレームワークは、ストリーミングアプローチに基づいて自然な音声応答を生成するために、テキスト、画像、音声、ビデオなどの複数のモーダル入力を同時に扱うことができます。コアはThinker-Talkerアーキテクチャに基づいています。
4ヶ月前
019.1K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

Cushion Wonderful Writer - AIエッセイライティングツール、アイデアから論文完成までのワンストップソリューション

Leaning Wonderful WriterはAI論文作成ツールで、学術論文作成のための効率的で便利なソリューションを提供します。このツールは、ワンクリックで学位論文のアウトライン、アブストラクト、本文の初稿を作成することができ、科学技術、リベラルアーツ、社会科学などの学際的な分野をカバーし、学部生や修士号などさまざまなレベルの学術ニーズに対応します。
4ヶ月前
019.1K
Why My Wife Yelling At Me:模拟婚姻沟通的互动工具

なぜ妻は私を怒鳴るのか:夫婦間のコミュニケーションを疑似体験できるインタラクティブ・ツール

概要 「妻が私に怒鳴る理由」は、人工知能を通じてパートナーの感情的な反応やコミュニケーションパターンを理解できるように設計された、ユニークな夫婦関係シミュレーションサイトである。ユーザーは様々なシナリオを入力し、仮想パートナーの反応を体験することができます。
6ヶ月前
019.1K
DeckSpeed - AI PPT制作工具,自然语言生成演示文稿

DeckSpeed - AI PPTメーカー、自然言語生成プレゼンテーション

DeckSpeedは、会話型インタラクションに基づいたAIプレゼンテーション作成ツールで、ユーザーは自然言語に基づいてニーズを表現し、従来のテンプレートに依存することなく、パーソナライズされたスライドを素早く生成します。このツールはリアルタイムのフィードバック調整をサポートしており、ユーザーはいつでもスライドの色、スタイル、内容を変更することができ、プレゼンテーションの完成度を高めることができます。
4ヶ月前
019K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

企業リサーチャー:企業リサーチツールで、企業のウェブアドレスを入力すると詳細なリサーチ情報が得られます。

概要 Company Researcher (カンパニーリサーチャー)は、ユーザーが任意の会社の迅速かつ包括的な概要を取得するために設計されたフリーでオープンソースのツールです。会社のURLを入力するだけで、このツールはウェブから包括的な情報を収集し、組織や製品に関する情報を表示します。
7ヶ月前
019K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
5ヶ月前
019K
fofa扫描全网OpenWebUI,实现大模型使用自由(不稳定)

ffofaはOpenWebUIのフルウェブをスキャンし、大型モデルの自由な使用を実現(不安定)

Fofaデータを自動的に取得し、OpenWebUIに登録するためにユーザが開発したツールを中心に、OpenWebUIのリソースを共有します。このページでは、ツールの紹介、使い方、特徴、ユーザーからのフィードバックやディスカッションなどを扱っています。 ...
12ヶ月前
019K
Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

孔子3-数学 - NetEase.com、数学教育に特化したオープンソースの推論モデルを発表

Confucius3-Mathは、NetEaseYouDaoによってオープンソース化された、数学教育に特化した国内初のオープンソース推論モデルです。140億のパラメータを持ち、K-12の数学教育シナリオに最適化されており、コンシューマーグレードのGPU(例:RTX 4090D)1つで効率的に実行でき、推論性能は約...
4ヶ月前
018.9K
HuMo - 清华大学联合字节开源的多模态视频生成框架

HuMo - 清華大学United Bytesオープンソース・マルチモーダルビデオ生成フレームワーク

HuMoは、清華大学とByteDance Intelligent Creation Labが共同でオープンソース化したマルチモーダル映像生成フレームワークで、人間中心の映像生成に焦点を当てている。HuMoは、テキスト、画像、音声などのマルチモーダル入力から、高品質かつきめ細かく制御可能な人物映像を生成することができる。
1ヶ月前
018.9K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Appleのビジュアル言語モデリング

FastVLM(Fast Vision Language Model)は、アップルが導入した効率的な視覚言語モデルである。FastViTHDハイブリッド視覚コーダーをコアとし、畳み込みとトランスフォーマーアーキテクチャを組み込むことで、視覚言語を大幅に...
2ヶ月前
018.8K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Ask o4が導入した、8つの思考経路を同時に開くパラレル思考モデル

Ask White o4は、8つの思考経路を同時に開き、問題を多角的に分析し、最適解を自動的にフィルタリングする革新的な並列思考モデルです。このモデルには、高度なLong-CoT強化学習とプロセス報酬学習技術が組み込まれており、強力な深層推論機能を持ち、複雑なタスクで優れたパフォーマンスを発揮します。
2ヶ月前
018.7K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - GoogleのAI推論モデル

Gemini 2.5 Deep Thinkは、複雑なタスクを解決するために設計されたGoogleのAI推論モデルである。国際数学オリンピック(IMO)2025で金メダルを獲得したモデルの亜種であり、並列推論によって複雑なタスクを解くように設計されている。
3ヶ月前
018.6K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式(Excel、CSVなど)のインポートをサポートし、最適なチャートをインテリジェントに推薦します。
4ヶ月前
018.6K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
5ヶ月前
018.6K
CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 中国初の不動産AIエージェントをCRICが開始

CRIC Depth Intelligenceは、CRICが独自に開発した中国不動産初のAIインテリジェント体であり、CRICの20年にわたる不動産業界での経験とデータ蓄積、マルチモーダルビッグモデル技術に基づき、データ統合、インテリジェント分析からコンテンツ生成までの全チェーンを切り開く。
5ヶ月前
018.5K
万兴天幕 – 万兴科技推出AIGC视频创作平台

万興キャノピー - 万興科技、AIGCビデオ作成プラットフォームを発表

万興キャノピーは万興科技が発表したAIGC動画作成プラットフォームで、動画、画像、音声の3大作成分野をカバーし、メディア・文化産業従事者、映画・テレビ・ポストプロダクション従事者、アート・デザイン従事者、広告・マーケティング従事者などのために特別に設計され、ワンストップの専門的作成ソリューションを提供する。
4ヶ月前
018.4K
美间:在线软装(家装)设计工具,快速生成设计方案,软装辅助AI工具箱

Meiman:オンラインソフトファニッシング(家庭用家具)デザインツール、デザインソリューションの迅速な生成、ソフトファニッシング補助AIツールキット

総合紹介 Meimanは、住宅デザインとマーケティング交渉に焦点を当てたオンラインプラットフォームです。このサイトでは、デザイナーと住宅所有者が高品質のデザイン提案を迅速に作成できるよう、豊富なデザイン素材、ソフトファニシング、提案書PPTテンプレート、ポスターテンプレートなどを提供しています。Meimanのオンラインソフトファニシングデザインツールは、わずか10秒で使用することができます...
4ヶ月前
018.3K
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - アント・グループのオープンソース万能言語モデル。

Ling-1Tは、アント・グループによってオープンソース化された1兆パラメータユニバーサル言語モデルで、Bering社の大型モデルLing2.0シリーズのフラッグシップ製品に属します。このモデルは、非常に効率的なMoEアーキテクチャを採用し、128Kのコンテキストウィンドウをサポートし、コード生成、数学的推論、論理テストを含む7つのベンチマークでGPTを上回っています。
2週間前
018.1K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Tongyi Qianqianのフラッグシップ・ビッグ言語モデル

Qwen3-Max-Previewは、Tongyi Qianwenがリリースした最新のフラッグシップ大規模言語モデルです。Qwen3ファミリーの中で最大のパラメータ数を持つモデルであり、パラメータサイズは1兆を超える。推論、命令追従、多言語サポート、ロングテール知識カバレッジが大幅に改善されています。
1ヶ月前
017.9K
InfiniteTalk - 美团视觉AI开源的音频驱动视频生成工具

InfiniteTalk - Mission Vision AI用オープンソース音声駆動ビデオ生成ツール

InfiniteTalkは、MeiGen-AIチームによって開発された音声駆動型の動画生成ツールで、入力された音声に基づいて長さ無制限のトーキング動画を生成する。主な特長は、正確なリップシンク技術で、音声とキャラクターの口の形を完全に一致させ、自然で滑らかな動画を生成します。
1ヶ月前
017.8K
有道在线图片翻译:免费在线翻译图片|有道智云AI开放平台

Youdaoオンライン画像翻訳:画像の無料オンライン翻訳|Youdao Zhiyun AIオープンプラットフォーム

総合紹介 オンライン画像翻訳サービスは、OCR技術とテキスト翻訳技術により、画像内のテキストを認識し、翻訳します。このサービスはYoudao Zhiyunによって提供され、複数の画像フォーマットと複数の言語をサポートしています。ユーザーは、ウェブサイトで直接使用したり、APIやSDKを介してアプリケーションに統合することができます...
1年前
017.6K
HunyuanImage 3.0 - 腾讯开源的免费多模态图像生成模型

HunyuanImage 3.0 - Tencentオープンソースフリーマルチモーダル画像生成モデル

HunyuanImage 3.0(渾元画像3.0)は、テンセントがリリースし、オープンソース化したネイティブのマルチモーダル画像生成モデルである。モデルのパラメータサイズは80B、現在最高の評価結果、オープンソースの画像生成モデルの最大のパラメータ数です。Hybrid Image 3.0はリアルタイムの画像生成をサポートし、ユーザーはサイド...
3週間前
017.5K
ZeroSearch - 阿里通义推出的开源大模型搜索引擎框架

ZeroSearch - アリ・トンイ、オープンソースの大規模モデル検索エンジン・フレームワークを発表

ZeroSearchはAlibaba Tongyi Labオープンソースの革新的な大規模モデルの検索エンジンのフレームワークです。このフレームワークは、実際の検索エンジンと対話する必要はありません、検索エンジンのシミュレーションに基づいて、大幅にトレーニングコストを削減し、関連またはノイズ文書を生成するために、独自の事前学習知識の大規模なモデル(80%以上を削減...
4ヶ月前
017.4K