文信ビッグモデルX1.1 - 百度のより良い理解のための深層思考モデル
Wenxin Big Model X1.1は、バイドゥが発表したディープシンキングモデルで、ハイブリッド強化学習フレームワークに基づいており、言語理解と生成の向上に重点を置いている。このモデルは、複雑な質問の処理、指示に従うこと、知性の行動のシミュレーションに優れており、知識豊富な回答や高品質のテキストコンテンツを正確に提供することができる。
ハイブリッドイメージ2.1 - テンセントのオープンソース・ベンダーグラフ・モデル
HunyuanImage 2.1は、高品質の画像生成のために設計されたテンセントのオープンソースグラフィックモデルです。このモデルはネイティブ2K解像度をサポートし、複雑なシーンやディテールを正確にレンダリングすることができ、キャラクターの表情や動きを生き生きと再現することができます。
アーネスト・ンによるLLMアプリケーション開発コースのための無料LangChain
LangChainによるLLMアプリケーション開発は、DeepLearning.AIが提供するオンラインコースで、LangChainの創設者であるハリソン・チェイスとアンドリュー・ングが登場します。
エンダ・ウーによるトランスフォーマーLLMの仕組みに関する無料コース
トランスフォーマーLLMは、DeepLearning.AIと『Hands-On Large Language Models』の著者であるJay Alammar氏とMaarten Grootend氏が提唱する原理で動作する。
Seedream4.0-バイトが発表した最新世代の画像作成モデル
Seedream4.0は、ByteDance社が発表した高度な画像生成・編集ツールで、生成と編集の統合を中心に、正確なコマンド編集、高い機能保持、深いインテント理解などの強力な機能を備えています。
rStar2-Agent - マイクロソフトのオープンソースの効率的なAI推論モデル
rStar2-Agentは、AIME24テストで80.61 TP3Tの精度を達成し、強力な数学的問題解決能力を実証した、Microsoftによってオープンソース化された高度なAI数学的推論モデルです。このモデルは科学的推論能力を備えており、GPQA-Diamondベンチマークで...
InfinityHuman(インフィニティ・ヒューマン):バイトがZJUと共同で立ち上げた長編ビデオ・デジタル・ヒューマン・ジェネレーション・モデル
InfinityHumanは、ByteDanceと浙江大学が共同で発表した商用レベルの長時間音声駆動型キャラクター動画生成モデルである。このモデルは音声駆動型であり、高解像度、長時間、視覚的に一貫性のあるキャラクター動画を生成することができる。
Kimi K2-0905 - Dark Side of Moonの最新モデル!
Kimi K2-0905は、Dark Side of the Moon Technologies Ltd.の先進的なAIモデルであり、プログラミング支援に優れ、効率的にコードを生成し、フロントエンド開発において整然とした標準化されたコードの生成をサポートします。モデルのコンテキスト長は256Kまで拡張され、複雑なタスクにも対応します。
Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット
Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...
gpt-realtime - OpenAIの最新AIスピーチモデル
gpt-realtimeはOpenAIの高度な音声モデルで、自然で滑らかな音声を生成するための直接音声処理をサポートしています。このモデルは複数の言語とスタイルをサポートし、笑いなどの非言語的な合図を理解し、言語を切り替えることができます。