
AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。
AudioNotesは、FunASRとQwen2をベースにした、オーディオ/ビデオから構造化ノートへのシステムです。オーディオやビデオのコンテンツを素早く抽出し、構造化されたMarkdownノートを生成するための大きなモデルを呼び出すことができます。本システムは、複数の...
AudioNotesは、FunASRとQwen2をベースにした、オーディオ/ビデオから構造化ノートへのシステムです。オーディオやビデオのコンテンツを素早く抽出し、構造化されたMarkdownノートを生成するための大きなモデルを呼び出すことができます。本システムは、複数の...
これは、ollama を使用して DeepSeek R1 671B (完全な未精製バージョン) をローカルに展開するための (最小限の) 手順です。最近、DeepSeek R1 671Bを2000ドルで販売している大物がいますが、個人で使用するには十分です。 モデル オリジナルのDeepSeek R1 671Bは720GBのサイズで、非...
ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。
総合紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む様々なファイル形式をサポートしています。
開発7ヶ月、テスト1ヶ月、コード77,376行を経て、Reflyは正式にオープンソースとなりました!⚡️🔥🖀 Reflyはプロジェクト発足以来、DockerやK8Sに並ぶ世界トップクラスのオープンソースプロジェクトを目指してきました。私たちの使命は、世界の10億人のクリエイターのために最高のAIを構築することです ...
まだDeepSeekの公式R1の「後でもう一度お試しください」に悩まされ、血圧が急上昇するまでラグが続いていますか?ご心配なく、あなたは一人ではありません!昨日、Silicon Flow + ChatboxAIを使って、DeepSeekの公式ラグから解放されたDeepSeekサーバーを構築する方法を紹介しました。
最近、国家スーパーコンピューティング・インターネット・プラットフォームは、DeepSeek-R1、V3、Coderなどのシリーズを含むDeepSeekが開発した多数の大型モデルを正式に発表した。その中で、小型版のDeepSeek-R1はワンクリック推論サービスを提供し、ユーザーはダウンロードせずに利用できる。さらに、このプラットフォームはプライベート ...
包括的な紹介 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。Rowfillは、高度なAI技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、ネイティブのLarge Language Models(LLM)とOpenAIのビジュアルモデルをサポートしており、データを確実に隠蔽します。
包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(Large Language Model: LLM)のパラメータ空間に外部の知識を直接埋め込むことで、生成を強化することを目的とした革新的な検索補完型生成ツールである。このツールは、従来の文脈検索-拡張生成の手法を克服している。
一般的な紹介 GPT ResearcherはLarge Language Model (LLM)に基づいた自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。エージェントの作業を並列化することで、安定したパフォーマンスと高速化を実現し、正確で偏りのない情報を提供します。
Googleは、Gemini 2.0 Flash、Flash-Lite、Proを含むGemini 2.0 Flashファミリーの新モデルをリリースした。 Gemini 2.0 Flashは、より高速で、よりパワフルなジェネレーティブAIソリューションを開発者に提供することを目的としています。
概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話に新しいアプローチを生み出します。このシステムは、Whisper、Linly、Microsoft Speech Services、SadTalkerなどの複数の技術を統合しています。
概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化、非構造化を問わず、データを検索可能にするプロセスを簡素化する。
包括的な紹介 Botnowは、プラグイン、ナレッジベース、ワークフローを通じて、開発者が高品質なインテリジェンスを低い敷居で迅速に構築できるように設計された、次世代のAIインテリジェンス作成および配布プラットフォームです。このプラットフォームは、サードパーティのプラットフォームへのインテリジェンスの公開をサポートし、APIコールとWeb SDKを提供します。
概論 ai-gradioはオープンソースのPythonツールキットで、開発者が複数のAIモデルを簡単に統合して使用できるように設計されています。Gradio上に構築されたこのプロジェクトは、幅広いAIモデルとサービスをサポートする統一されたインターフェースを提供します。テキスト処理、音声処理、動画処理のいずれであっても、ai-gradioは...
ChatGPTのようにObsidianでLLM(Local Large Language Model)を使いたいですか?もし答えがイエスなら、このガイドはまさにあなたのためのものです!ObsidianにDeepSeek-R1モデルをインストールして使用するための詳細な手順を説明します。
概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResearcherは、SERPAPI、Jina、O...を含む様々なサービスと技術を活用しています。
最近、国産のオープンソースAI知識ベースフレームワークKAG(Knowledge Augmented Generation)を見つけた。 KAGはAnt Groupと浙江大学などが共同で立ち上げたもので、バーティカルドメインの知識ベース構築にフォーカスしている。論文データによると、KAG ...
2007年、スティーブ・ジョブズが初代iPhoneを世に送り出し、スマートフォンの新時代を切り開いたことを覚えているだろうか。それから10年以上が経ち、スマートフォンはますます高性能になったが、技術革新のボトルネックには到達していないようだ。テクノロジーは殻の変化の上に成り立っている」と誰もが嘆いていた矢先、AI業界のOpenAI...
概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。ColiVaraはPDF、DOCX、PPTXなど100種類以上のファイル形式をサポートし、自動...