LongWriter:ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。
包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル(LLM)に基づいており、10,000語以上の長文を生成することができます。
Plate: 豊富なプラグイン拡張機能をサポートしたAI駆動型リッチテキストエディタ
概要 PlateはReactとTypeScriptで構築されたAI搭載のリッチテキストエディタで、高度にカスタマイズ可能で拡張性の高い編集体験を提供するように設計されています。Slate.jsをコアに利用し、モダンなUIと組み合わせている。
Sora: テキストからAIビデオへ、ビデオ編集クリエイティブスイート
一般的な紹介 Soraは、OpenAIによる先進的なビデオ生成ツールで、人工知能技術によってユーザーが簡単に高品質なビデオコンテンツを作成できるように設計されています。Soraは、拡散モデルを使用して、静的ノイズから始まる多段階のノイズ除去プロセスによって完全なビデオを生成します。ユーザーは...
古書の知識:古書資料の無料オンライン閲覧・検索、古書原文のAIアシスタントによる現地語解釈
総合紹介 魯甸古書は、北京大学とByteDance Public Welfareが共同で立ち上げた古書デジタル化プラットフォームで、古書の無料オンライン閲覧・検索サービスを一般に提供することを目的としている。周易』、『左伝』、『礼記』などの古典籍を含む2,200点以上の古書資料を集め、高画質で...
Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。
一般的な紹介 MinimaはオープンソースのRAG(Retrieval-Augmented Generation)ソリューションで、ChatGPTのローカル展開と統合をサポートしています。プロジェクトはdmayborodaによって管理されており、その目的は...
MuseGAN: マルチトラック音楽/サウンドトラックを生成し、複数の楽器の音楽クリップを簡単に作成するためのオープンソースモデル
一般的な紹介 MuseGANはGenerative Adversarial Networks (GAN)に基づいた音楽生成プロジェクトで、マルチトラック(マルチ楽器)の音楽を生成するように設計されています。MuseGANはLakh Pianorを使用しています。
MoneyPrinterTurbo:ビデオテーマを入力すると、ワンクリックでビデオコピーと短いHDビデオを生成します。
総合紹介 MoneyPrinterTurboはオープンソースプロジェクトで、先進的なAIビッグモデル技術を利用して、ワンクリックで短いHDビデオを生成する機能を実現します。ユーザーは動画のテーマやキーワードを提供するだけで、システムが自動的に動画コピー、動画クリップ、動画字幕を生成します。
Docling:様々なフォーマットのドキュメントをサポート MarkdownやJSONへの解析とエクスポート PDFサポート OCR
包括的な紹介 Doclingは、PDF、DOCX、PPTX、XLSX、画像、HTML、AsciiDocおよびMarkdownを含む幅広い文書形式をサポートする強力な文書解析およびエクスポートツールです。
オープンソースの1.6Bミニ・モデル "リトル・フォックス"、類似モデルの "クウェン "と "ジェンマ "を凌駕
GPT-1のパラメーター数は1億1700万(1億1700万)だったが、第4世代のGPT-4はパラメーター数を18000に更新した...。
メタ、ラマ3.3をリリース、70Bのパラメータはラマ3.1より強い 405B - より小さく、より速く、より強く
Meta社は、700億パラメータを持つ大規模言語モデルLlama 3.3を発表した。これは、その前身である405BパラメータのLlama 3.1の性能に匹敵し、Llama 3.1 405Bに比べて入力コストを10分の1に削減する!命令...









