PaddleOCR-VL - 百度オープンソース超軽量視覚言語モデル
PaddleOCR-VLはBaiduのオープンソースの超軽量視覚言語モデルで、文書解析シナリオに最適化されています。動的高解像度視覚コーダーと軽量ERNIE言語モデルの融合により、高精度を維持しながら、計算オーバーヘッドを大幅に削減し、0.9Bのパラメータしか含んでいません。
UniPixel - ピクセルレベルのマルチモーダルモデル、香港理工大学、Tencent、CASなどがオープンソース化
UniPixelは、香港理工大学、テンセント、中国科学院、Vivoが共同で提案した、ピクセルレベルの視覚言語理解を実現するための新しいマルチモーダルモデルである。オブジェクト参照とセグメンテーション機能を統合することで、画像セグメンテーション、ビデオセグメンテーション、領域理解、ピ...
DiaMoE-TTS - 清華とジャイアントネットワークのオープンソース多言語音声合成フレームワーク
DiaMoE-TTSは、清華大学とGiant Networkが共同でオープンソース化した多方言音声合成フレームワークで、国際音声記号(IPA)に基づき、方言データの不足、正書法の不統一、複雑な音韻変化の問題を解決します。統一されたIPAフロントエンドの標準化された音素表現により、方言間の差異を排除し、方言の音韻の変化...
カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開
Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...
SongBloom-テンセントがHKCSとNTUと共同開発したオープンソースの楽曲生成モデル
SongBloomは、テンセントAIラボが香港中文大学(深圳)、南京大学と共同で開発したオープンソースの楽曲生成モデルで、AIによる楽曲生成における「可塑性」の問題を解決し、高品質で構造的に完全な楽曲生成を実現している。10秒間の参考音声と対応する歌詞を入力するだけで、...
Pyscn - フリーのAIコード品質分析ツール、Python開発者向けオープンソース
PyscnはPython開発者向けに設計されたインテリジェントなコード品質分析ツールで、コードの潜在的な問題を検出して保守性を向上させます。制御フロー図を通してデッドコードを分析し、APTED+LSHアルゴリズムを使って重複コードを特定し、モジュールの結合やサークルの複雑さなどのメトリクスを計算します。
Youtu-Embedding - Tencent Youtuオープンソースの汎用テキスト表現モデル
Youtu-Embeddingは、TencentのYoutu Labsによるオープンソースのユニバーサルテキスト表現モデルで、エンタープライズレベルのアプリケーション向けに設計されている。テキストはディープニューラルネットワークによって高次元のベクトル空間にマッピングされ、その空間では意味的に類似した文章がより近くに配置され、正確な意味検索が実現される。
SAIL-VL2 - ByteHopのオープンソース・マルチモーダル視覚言語モデル
SAIL-VL2は、Byte Jumpチームによるオープンソースのマルチモーダル視覚言語モデルで、画像やテキストなどのマルチモーダル入力の共同モデリングに焦点を当てています。スパース混合エキスパート(MoE)アーキテクチャと漸進的な学習ストラテジーを用いて、2Bから8Bのパラメータスケールで、特に図形理解、数学的...
MineContext - バイト・オープンソース・アクティブ・コンテキスト・アウェアAIパートナー
MineContextは、ByteDance Vikingチームによってオープンソース化されたアクティブなコンテキスト認識AIパートナーで、ユーザーが大量の情報を効率的に管理し、知識作業の効率を向上させることを支援します。スクリーンショットとコンテンツ理解技術により、ユーザーの日常操作(ウェブ閲覧、文書編集など)を自動的に記録し、...
nanochat - カルパシーによるフリーでオープンソースの低コストモデル・トレーニング・プロジェクト
nanochatは、AIのレジェンドであり元テスラAIディレクターのアンドレイ・カルパシーが公開したオープンソースプロジェクトで、個人が非常に低コストかつシンプルに、小規模なChatGPTのような言語モデルを素早く学習することを可能にする。プロジェクト全体で使用されているのは、わずか約800...








