AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計970記事

タグ: AIのオープンソースプロジェクト 21ページ

zChunk:基于Llama-70B的通用语义分块策略-首席AI分享圈

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkはZeroEntropyが開発した新しいチャンキング戦略で、一般的なセマンティック・チャンキングのソリューションを提供する。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索時に高いS/N比を維持します。

Hibiki:实时语音翻译模型,保留原声特点的流式翻译-首席AI分享圈

Hibiki:リアルタイム音声翻訳モデル、元の音声の特徴を保持したストリーミング翻訳

はじめに 響きは、Kyutai Labsによって開発された高忠実度のリアルタイム音声翻訳モデルです。従来のオフライン翻訳とは異なり、Hibikiはターゲット言語の自然な音声翻訳を生成し、ユーザーが話している間にリアルタイムでテキスト翻訳を提供することができます。このモデルはマルチストリームアーキテクチャを採用しており、同時に...

Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话-首席AI分享圈

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます!

一般的な紹介 Qwen4Macは、Qwen Large Language Model (LLM)をMacのメニューバーに統合し、ユーザーがいつでも簡単に呼び出して使えるようにするために設計されたオープンソースプロジェクトです。このプロジェクトはandreaturchetによって開発・保守されており、ユーザーがQwenに直接アクセスして使用するための簡単な方法を提供します。

口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)-首席AI分享圈

Pocket AI:DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。

ポケットAI(PocketPal AI中国語版)は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。小型言語モデル(SLM)をベースにしており、インターネット接続のない携帯電話でも動作し、特に中国のユーザーエクスペリエンスに適応しています。Pocket AIは複数のスモールランゲージモデルをサポートしています。

Kokoro WebGPU:浏览器中离线运行的文本转语音服务-首席AI分享圈

ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス

一般的な紹介 ココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供するココロ音声合成(TTS)モデルのWebGPUバージョンです。このプロジェクトでは、WebGPU技術を利用し、ユーザーがブラウザ上でローカルに効率的な音声合成を実行できるようにしています。

OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划-首席AI分享圈

OpenHealthForAll:個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード

概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllは、ユーザーが自分の健康情報をより良く管理・分析できるように、ローカルで運営される健康アシスタントを提供します。このプロジェクトがサポートするのは...

Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术-首席AI分享圈

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

一般的な紹介 Agentic Security は、開発者とセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースの LLM (Large Language Model) 脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、ストレステストのためにLLM APIを統合することができ、幅広い...

CogVLM2:开源多模态模型,支持视频理解与多轮对话-首席AI分享圈

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

一般的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供するように設計されている。このモデルは画像理解、多ラウンド対話、ビデオ理解をサポートし、最大8Kの長さのコンテンツを扱うことができる。

VisoMaster:强大且易用的图片/视频换脸和编辑软件-首席AI分享圈

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

一般的な紹介 VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、強力で使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成します。

基于RAG构建提供健康建议的小助手(实验项目)-首席AI分享圈

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築(パイロット・プロジェクト)

包括的な紹介 LLM-RAG-Longevity-Coachは、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するために設計された大規模言語モデリング(LLM)と検索拡張世代(RAG)技術に基づくチャットボットです。Tyler Burleighによって開発されたこのプロジェクトは、ユーザーインターフェースの構築にStreamlitを利用し、...

Maestro:简化主流开源视觉语言模型微调过程的工具-首席AI分享圈

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化・高速化し、誰もが独自の視覚マクロモデルをトレーニングできるようにします。Florence-2、PaliGemma ...などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。

One-Prompt-One-Story:文本提示生成角色身份一致的图像-首席AI分享圈

ワン・プロンプト・ワンストーリー:テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す

包括的な紹介 One-Prompt-One-Story(1Prompt1Story)は、1つのプロンプトから一貫した画像を生成できるように設計された革新的なテキストから画像への生成ツールである。ICLR 2025でTao Liuらによって発表されたこのプロジェクトは、トレーニング不要のアプローチを採用しており、文字の同一性を維持しながら、...

为Next.js应用程序添加RAG驱动的在线聊天工具-首席AI分享圈

Next.jsアプリケーションにRAG駆動型オンラインチャットツールを追加する

包括的な紹介 Upstash RAG Chat Componentは、Next.jsアプリケーション向けに設計されたReactコンポーネントで、RAG(Retrieval Augmented Generation)技術に基づくAIチャット・インターフェースを提供します。このコンポーネントは、類似検索用の Upstash Vector、大規模言語モデル(LL...

AudioNotes:快速提取音视频内容并生成结构化笔记-首席AI分享圈

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

AudioNotesは、FunASRとQwen2をベースにした、オーディオ/ビデオから構造化ノートへのシステムです。オーディオやビデオのコンテンツを素早く抽出し、構造化されたMarkdownノートを生成するための大きなモデルを呼び出すことができます。本システムは、複数の...

Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具-首席AI分享圈

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

総合紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む様々なファイル形式をサポートしています。

Rowfill:批量提取文档结构化信息并自动化分析-首席AI分享圈

ロウフィル:文書からの構造化情報の一括抽出と自動分析

包括的な紹介 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。Rowfillは、高度なAI技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、ネイティブのLarge Language Models(LLM)とOpenAIのビジュアルモデルをサポートしており、データを確実に隠蔽します。

PRAG:提升问答系统性能的参数化检索增强生成工具-首席AI分享圈

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(Large Language Model: LLM)のパラメータ空間に外部の知識を直接埋め込むことで、生成を強化することを目的とした革新的な検索補完型生成ツールである。このツールは、従来の文脈検索-拡張生成の手法を克服している。

GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告-首席AI分享圈

GPTリサーチャー:ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

一般的な紹介 GPT ResearcherはLarge Language Model (LLM)に基づいた自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。エージェントの作業を並列化することで、安定したパフォーマンスと高速化を実現し、正確で偏りのない情報を提供します。

ja日本語