AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計910記事

タグ: AIのオープンソースプロジェクト 42ページ

Pyramid Flow:快手推出的开源版

Pyramid Flow:Racerが発表した "Kringle "のオープンソース版で、SD3をベースとし、8GB未満のGPUで動作する(ワンクリックデプロイメント版)。

一般的な紹介 Pyramid Flowは、フローマッチング技術に基づいた効率的な自己回帰映像生成手法である。ピラミッドフローは、異なる解像度やノイズレベル間を補間することで、より高い計算効率で映像コンテンツの生成と伸張を可能にする。

Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署-首席AI分享圈

Dify: ジェネレーティブAIアプリケーション開発プラットフォーム、ビジュアルオーケストレーション、プライベートデプロイメントサポート

包括的な紹介 Difyは、大規模言語モデル(LLM)をベースとしたネイティブAIアプリケーションの迅速な構築と運用を支援するために設計された、オープンソースのジェネレーティブAIアプリケーション開発プラットフォームです。このプラットフォームは、エージェント構築からAIワークフローオーケストレーション、RAG検索、モデル管理など様々な機能を提供し、AIアプリケーションの開発をサポートします。

Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)-首席AI分享圈

Datalab:専用のOCR認識AIモデル、PDF to Markdown(オープンソース/API)

包括的な紹介 Datalabは、OCR、レイアウト分析、PDFからMarkdownへの変換などに焦点を当てた高度なAIモデルを幅広く提供しています。これらのモデルは高性能であるだけでなく、使いやすくオープンソースです。プラットフォーム上のMarkerモデルは、表を含むPDFを素早く正確にMarkdownに変換することができます...

ModelBest(面壁智能):全球领先的轻量高性能端侧大模型-首席AI分享圈

ModelBest:世界をリードする軽量・高性能エンドサイド・ビッグモデル

ModelBestは、軽量かつ高性能な大型モデルの開発に注力する企業であり、高度なAI技術をメインストリーム家電や日常生活の様々なエンドデバイスに適用することに専念しています。同社のMiniCPMシリーズのエンドサイド・モデルは、非常に高い演算能力とメモリ使用効率、少ないパラメータ数で知られています。

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案-首席AI分享圈

Podcastfy:NotebookLMのポッドキャスティング機能に代わるオープンソースの多言語音声会話ツール、マルチソースコンテンツ

一般的な紹介 PodcastfyはオープンソースのPythonパッケージで、生成人工知能(GenAI)技術を使って、ウェブコンテンツ、PDFファイル、テキスト、画像、youtube動画、その他多くのソースを魅力的な多言語音声ダイアログに変換します。従来のユーザーインターフェイスベースのものとは異なり...

One API:多模型API管理与负载均衡,分发系统-首席AI分享圈

One API:マルチモデルのAPI管理と負荷分散、配信システム

包括的な紹介 One APIは、OpenAI ChatGPT、Anthropic Claude、Google PaLM 2、Geminiなどの幅広いビッグモデルをサポートする、オープンソースのインターフェース管理および配布システムです。このシステムは、標準的なOpenAI APIフォーマットを介してすべてのビッグモデルにアクセスし、ロードバランシング、トークン...

文多多 AiPPT:AI生成PPT,演讲稿生成-首席AI分享圈

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。

Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频-首席AI分享圈

Easegen:オープンソースデジタルヒューマンコース制作プラットフォーム、PPTワンクリック生成クローンデジタルヒューマン講義ビデオ

概論 Easegenは、AI技術による教育コンテンツ制作・管理の効率化を目指したオープンソースのデジタルヒューマン講座作成プラットフォームです。このプラットフォームは、コース制作、ビデオ管理からインテリジェントな質問までのワンストップソリューションを提供し、ユーザーは、デジタル人間説明ビデオコースを作成し、AIを使用することができます...

Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts-首席AI分享圈

Open Canvas: コード編集が可能なコラボレーション・キャンバス、OpenAI Canvasのオープンソース版/Claude Artifacts

LangChainはOpen Canvasというオープンソースのウェブアプリケーションを提供します。このアプリケーションは、デュアルエージェントメモリ機能と、実行の詳細を観察するための統合されたスミスを内蔵し、ドキュメントの編集とコラボレーション体験を強化するように設計されています。このプラットフォームはOpenAIの "Canvas "にインスパイアされていますが、いくつかの点で...

AutoGen Studio:多代理系统AutoGen的简易用户界面版-首席AI分享圈

AutoGen Studio:マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計された、AutoGenによるユーザーインターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます。

MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具-首席AI分享圈

MeetingMind: OpenAI Whisperを利用したオープンソースのインテリジェント会議記録・要約ツール

概要 MeetingMindは、ビジネスミーティングの記録と要約の効率を改善するために設計された高度なAIアプリケーションです。このアプリは、OpenAIのWhisperテクノロジーを統合して正確な音声テキスト化を実現し、IBM WatsonのAIを使用して、書き起こされたテキストの重要なポイントを分析・抽出します。

Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能-首席AI分享圈

Coqui TTS (xTTS):多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

包括的な紹介 Coqui TTSは、ディープラーニング技術に基づいたオープンソースの高度な音声合成(TTS)ツールキットです。Coqui TTSは、ディープラーニング技術をベースとしたオープンソースの先進的な音声合成ツールキットであり、研究環境と実運用環境の両方でテストされ、複数の言語の音声合成をサポートする豊富な機能とモデルのセットを提供しています。

MemFree:本地知识库与搜索信息混合的AI搜索引擎-首席AI分享圈

MemFree:地域の知識ベースと検索情報を混合するAI検索エンジン

概要 MemFreeは、テキスト、画像、文書、ウェブページを検索し、質問することができる高度なハイブリッドAI検索エンジンです。テキスト、マインドマップ、画像、動画の検索結果にワンクリックでアクセスできる。MemFreeの目標は、ユーザーの知識ベースとインターネット全体から...

BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)-首席AI分享圈

BlinkShot:プロンプトワードを入力してリアルタイム画像生成(Flux Schnellモデルへのフリーアクセス)

概要 BlinkShotは、Together AIとFlux Schnellの技術を利用したオープンソースのリアルタイムAI画像ジェネレーターで、ユーザーがプロンプトを入力すると同時に高品質の画像を生成することができます。このプラットフォームは完全に無料で、デザイナー、アーティスト、コンテンツ制作者向けに、ユーザーのカスタマイズや二次開発をサポートしています。

FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRは、学術研究と産業アプリケーションの橋渡しをするために、アリババのDharma Instituteによって開発されたオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、話者検証、発話...など、幅広い音声認識機能をサポートしています。

UltraPixel:革新超高分辨率图像生成技术,图像细节丰富-首席AI分享圈

UltraPixel:細部まで鮮明な超高解像度画像生成技術

一般的な紹介 UltraPixelは、非常に高品質で詳細な画像を作成するために設計された、高度な超高解像度画像生成技術です。このプロジェクトはGitHubユーザーのcatcathhによって開発され、NeurIPS 2024で発表された。UltraPixelは1Kから6Kまでのあらゆる解像度の画像をサポートする。

SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天-首席AI分享圈

SiYuan (SiYuan Notes): AIライティング/Q&Aチャットをサポートするプライバシー優先の個人知識管理ソフトウェア

概要:SiYuan Notes(SiYuan)はプライバシーを第一に考えた個人向けナレッジマネジメントソフトウェアであり、完全なオープンソースでセルフホスティングをサポートしている。TypeScriptとGolangで書かれており、きめ細かいブロックレベルの参照とMarkdownのWYSIWYG編集を提供する。SiYuan Notesは、ユーザを支援するように設計されています...

阿布量化交易系统:基于Python的开源量化交易平台-首席AI分享圈

アブ・クオンツ取引システム:Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなど様々な金融商品のバックテストと取引をサポートする。機械学習技術を組み合わせ...

Knowledge Table:高效提取与探索结构化数据的开源工具-首席AI分享圈

知識テーブル:構造化データの効率的な抽出と探索のためのオープンソースツール

包括的な紹介 ナレッジテーブル(Knowledge Table)は、非構造化ドキュメントから構造化データを抽出し、探索するプロセスを簡素化するために設計されたオープンソースプロジェクトです。ユーザは、自然言語クエリインターフェースを介して、表やグラフなどの構造化された知識表現を作成することができます。このツールは、カスタムの抽出ルールやフォーマットをサポートしています...

ja日本語