AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1

AIツール 54ページ

TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具-首席AI分享圈

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルに基づいたリアルタイム音声翻訳ツールで、英語と中国語のリアルタイム音声翻訳用に設計されています。Zoomなどのビデオ会議ソフトにシームレスに統合することができ、クロスリンガルcommunication.TransRoutのリアルタイム翻訳をサポートします。

opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现-首席AI分享圈

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的なAIプロジェクトで、インテリジェントなノートテイク対話システムの実現を目指しています。Build Fast with AIチームによって開発されたこのプロジェクトは、テキストコンテンツを...

Open Deep Research:生成基于网络搜索内容的AI研究报告-首席AI分享圈

オープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成

包括的な紹介 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート生成ツールです。TypeScriptで開発され、Next.js 15フレームワーク上に構築されたこのプロジェクトは、Azure Bing Search APIとGoogle Geminiを統合している。

Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)-首席AI分享圈

必要なのは視覚だけ:視覚言語モデルを用いた知的文書検索システムの構築 (Vision RAG)

包括的な紹介 Vision-is-all-you-needは革新的なビジュアルRAG(Retrieval Augmented Generation)システム実証プロジェクトであり、文書処理領域にビジュアル言語モデリング(VLM)を適用する新境地を開くものである。従来のテキストチャンキング手法とは異なり、このシステムでは、視覚言語モデルを直接使用してPDFファイルのページを処理する...

Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能-首席AI分享圈

Scira (MiniPerplx): Perplexityを模倣したオープンソースプロジェクトで、AI対話、ウェブ検索、天気クエリなどを統合している。

概論 MiniPerplx (Sciraに改名) はミニマリストデザインのAI搭載検索エンジンであり、様々な便利な機能を統合し、ユーザーにあらゆる情報検索サービスを提供します。このプロジェクトでは、Next.js、Tailwind CSS、Vercel AI SDKなどの最新のテクノロジースタックを使用しています。

Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务-首席AI分享圈

Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス

包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最大の特徴は、リアルタイムナレッジグラフと検索拡張生成 (RAG) テクノロジーを組み合わせることで、ユニークな...

LuminaBrush:使用智能绘画工具为图像添加照明打光效果-首席AI分享圈

LuminaBrush:スマートペイントツールで画像にイルミネーションを加える

LuminaBrushは、人工知能技術を搭載した照明効果のための革新的なインタラクティブ画像編集ツールです。このプロジェクトでは、画像を処理するために2段階のフレームワークを使用している。第1段階では、入力画像を「均一な照明」ルックに変換し、第2段階では、ユーザーの落書きアクションに基づいて照明効果を生成する。これは...

Diagramming AI:使用AI在线设计UML图和工作流程图-首席AI分享圈

図解AI:AIを使ってオンラインでUML図やワークフロー図をデザインする

概論 Diagramming AIは、人工知能技術を利用して、UMLダイアグラムやワークフロー・チャートを即座に設計・編集できる強力なオンライン・ツールです。このサイトでは、フローチャート、シーケンス図、ガントチャートなど、さまざまなダイアグラム形式を提供しており、ユーザーはテキストを入力するだけで、適切なダイアグラムを生成することができます。を通して...

Reshot AI:实时编辑面部表情,人像图片面部表情精细控制-首席AI分享圈

リショットAI:表情のリアルタイム編集、ポートレート写真の表情の微調整

一般的な紹介 Reshot AIは、顔の表情、目の方向、頭のポーズをリアルタイムで調整することに特化した、強力なオンラインAIフォトエディターです。ユーザーは簡単な操作で素早く写真を編集し、高品質なプロフェッショナル写真を作成することができます。Reshot AIは正確な目の編集を提供します...

MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程-首席AI分享圈

MetaGPT:自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク

包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan(アレクサンダー・ウー)によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを複雑なタスクを完了するための協調的なエンティティに結合することである。

HiDream(智象大模型):基于视觉多模态基础模型的AIGC创作平台-首席AI分享圈

HiDream:視覚的マルチモーダルベースモデルに基づくAIGCオーサリングプラットフォーム

HiDream.aiは、世界をリードする視覚的マルチモーダルベースモデルとアプリケーションの構築に焦点を当てた生成人工知能スタートアップです。同社が自社開発した「HiDream.ai」は、世界初の拡散トランスフォーマー(DiT...

Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目-首席AI分享圈

Groq AppGen: Groq APIを使用したLlama 3.3 70B HTMLコード生成機能の実証実験プロジェクト

一般的な紹介 Groq AppGenは、Groq Inc.によって開発され、オープンソース化された革新的なインタラクティブ・ウェブ・アプリケーション・ジェネレーターです。このプロジェクトは、HTMLコード生成のためのLlama 3.3 70Bモデルのパワーを実証しています。GroqのLarge Language Model (LLM) APIを統合することで、ユーザーは自然言語...

llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集-首席AI分享圈

llms.txt Generator: Webサイトのコンテンツを素早くキャプチャし、LLMトレーニング用テキストデータセットを生成します。

包括的な紹介 llmstxt-generatorは、大規模言語モデル(LLM)の学習と推論のための高品質なテキストデータセットを準備することに特化した、専門的なウェブコンテンツの抽出と統合ツールです。Mendable AIによって開発されたこのツールは、@firecrawl_devによって提供されたウェブクローリング技術とGPT-4-miniを使用しています。

Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手-首席AI分享圈

Roo Code (Roo Cline): Clineをベースに強化された自律型プログラミングアシスタント、インテリジェントIDEプログラミングアシスタント

概要 Roo Code (旧Roo Cline)Roo Code (Roo Cline)は、VS Codeの強力な拡張プラグインであるClineをベースに強化された自律プログラミングアシスタントです。このツールは統合開発環境(IDE)での自律的なコーディングを可能にし、ファイルの作成と編集ができます。

Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型-首席AI分享圈

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます!

概論 Raycast-G4F(GPT4Free)は、GPT-4、Llama-3を含む様々な高度なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能はリアルタイムのダイアログストリーミング機能を提供するだけでなく、ウェブ検索、ファイルアップロード、画像生成、その他多くの機能をサポートしています。

Twelve Labs:理解视频内容的多模态AI解决方案,视频搜索、生成、嵌入API服务-首席AI分享圈

Twelve Labs: 動画コンテンツの理解、動画検索、生成、APIサービスの組み込みのためのマルチモーダルAIソリューション

一般的な紹介 Twelve Labsは、動画理解に特化したマルチモーダルAI企業であり、高度なAI技術を通じて、ユーザーが大量の動画コンテンツを理解し、処理できるよう支援することに専念している。そのコア・テクノロジーには、アクション、オブジェクト、画面上のテキストなど、動画から主要な特徴を抽出できる動画検索、生成、埋め込みが含まれる。

Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎-首席AI分享圈

Gemini Search: Gemini 2.0 Flashで構築されたPerplexityスタイルのAI検索エンジン

概要 Gemini-Searchは、Google Gemini 2.0の技術に基づいてプロジェクトを構築するオープンソースのインテリジェントな検索エンジンです。このプロジェクトは、TypeScriptの開発を使用し、Perplexity検索エンジンのコア機能を複製することにコミットしており、FlashとGrounding技術の組み合わせは、ユーザーに提供する...

ja日本語