最新のAIリソース

共 3091 篇文章
GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Wisdom Spectrum AI オープンソース多言語ラージ言語モデルシリーズ

GLM-4.6Vは、Smart Spectrum AIによってオープンソース化されたマルチモーダル大規模言語モデルのシリーズです。 このシリーズには2つのバージョンがあります:GLM-4.6V (106B-A12B)は、クラウドおよび高性能クラスタシナリオ用の基本バージョンで、Mixed Expert (MoE)アーキテクチャ、合計約1060億参照、および活性化...
5ヶ月前
029.4K
Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - Dark Side of Moonの最新モデル!

Kimi K2-0905は、Dark Side of the Moon Technologies Ltd.の先進的なAIモデルであり、プログラミング支援に優れ、効率的にコードを生成し、フロントエンド開発において整然とした標準化されたコードの生成をサポートします。モデルのコンテキスト長は256Kまで拡張され、複雑なタスクにも対応します。
8ヶ月前
077.8K
Nano Banana - 谷歌推出的AI图像编辑模型

ナノ・バナナ - GoogleのAI画像編集モデル

ナノ・バナナは、ジェミニ2.5フラッシュイメージのコードネームです。ジェミニは、Googleが提供するAI画像生成・編集モデルで、シンプルなテキストプロンプトに基づいて詳細で写実的な画像を生成し、既存の画像に高品質な修正を加えます。
8ヶ月前
073K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
8ヶ月前
047.9K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMaxの音声生成モデル

MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
9ヶ月前
052.8K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian、Qwen-Imageのオープンソース基本モデルを発表

Qwen-Imageは、Alibaba Tongyi Qianqianチームによってリリースされたオープンソースの画像生成ベースモデルです。200億のパラメータを持ち、マルチモーダル理解、高解像度コーディング、拡散モデリングの3つのモジュールを組み込んだマルチモーダル拡散変換アーキテクチャ(MMDiT)を採用しています。
9ヶ月前
050.2K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
9ヶ月前
047.2K
TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - Wordhop TRAEのAI自動開発アシスタント

TRAE SOLOは、ByteDance社が立ち上げたAIプログラミングアシスタントTRAEが、AI技術でソフトウェア開発プロセスを簡素化するために導入したAI自動開発アシスタントです。TRAE SOLOは、ユーザーのニーズを理解し、要件を入力するためのテキスト記述、音声コマンド、ファイルアップロードをサポートし、自動的に計画を立てます。
9ヶ月前
076.8K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingは、オープンソースのリアルタイムインタラクティブデジタルヒューマンシステムであり、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーミング処理を含む多くの最先端技術と統合されています。
1年前
0152.5K