AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計970記事

タグ: AIのオープンソースプロジェクト 28ページ

Micro Agent:AI编程智能体,自动生成代码并测试、修复代码-首席AI分享圈

マイクロ・エージェント:コードを自動生成し、テストと修正を行うAIプログラミング・インテリジェンス。

一般的な紹介 Micro-Agentは、Builder.ioによって開発されたオープンソースのAIコーディング・アシスタントであり、コードを自動的に生成してテストする機能を開発者に提供するように設計されている。自然言語による記述を理解することでテストケースを生成し、すべてのテストがパスするまでコードを繰り返し実行する。

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspberry Piなど様々なプラットフォームに対応し、ネットワーク接続がない環境でもリアルタイムに音声認識・音声合成を行うことができます。

Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化-首席AI分享圈

Eko: デスクトップとブラウザの自動化のための自然言語によるインテリジェント・ボディ・ワークフローの構築

概論 Eko は、自然言語記述によって効率的なインテリジェント・エージェントのワークフローを構築するために設計された、プロダクショングレードの JavaScript フレームワークです。開発者が深いプログラミングをすることなく、AI 技術を使って日常的なタスクを自動化できるよう設計されています。Eko は、カウントにおける AI の使用をサポートする統一インターフェースを提供します。

Agent Inbox:与AI智能体进行人机交互的管理界面-首席AI分享圈

エージェント・インボックス:AIインテリジェンスとのヒューマンコンピュータインタラクションのための管理インターフェース

一般的な紹介 Agent InboxはLangChainチームによって開発されたオープンソースプロジェクトで、AIインテリジェンスと対話するための新しいユーザーエクスペリエンスを提供します。このプロジェクトにより、ユーザは一元化されたインターフェイスを通して、複数のAIインテリジェンスとのインタラクションを管理し、最適化することができます。Agent Inboxは、複数のコンフィギュレーションをサポートし、...

Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容-首席AI分享圈

ソーシャルメディア・エージェント:ソーシャルメディア・コンテンツを自動生成・管理するソーシャルメディア用インテリジェント・アシスタント

一般的な紹介 ソーシャルメディアエージェント(SMA)は、新しいエージェントインボックスによってインタラクション情報を管理するオープンソースプロジェクトであり、ユーザがソーシャルメディアコンテンツを自動的に生成・管理できるように設計されています。このプロジェクトはLangChainチームによって開発され、高度な自然言語処理技術と人間とコンピュータのコラボレーションを利用しています。

Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程-首席AI分享圈

エグゼクティブAIアシスタント:AIエグゼクティブアシスタント、電子メールを読むためのリマインダー、仕事のスケジュールを計画する

概要 Executive AI Assistant (EAIA)はAIベースのアシスタントツールで、ユーザーの日々のタスクを自動化・管理するために設計されています。LangChain社によって開発されたこのツールは、電子メールの処理、スケジュール管理、タスク管理などを行うことができます。EAIAは、Open...のような様々なAPIやサービスと統合することによってこれを行います。

MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色-首席AI分享圈

MangaNinjia:アニメのモノクロ線画に素早く色をつける自動線画着色ツール。

総合紹介 MangaNinjiaはAlibaba Tongyi Visual Intelligence Lab (Ali-Vilab)によって開発されたオープンソースプロジェクトで、線画着色処理の自動化に焦点を当てています。このツールは、ディープラーニング技術によって参照画像の正確なカラーマッチングを実現し、漫画制作の効率を大幅に向上させる。

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: ココロでオーディオブックを作成、電子書籍をオーディオブックに変換

概要 Audiblezは、電子書籍(.epub形式など)をオーディオブック(.m4b形式など)に変換するためのオープンソースプロジェクトです。このプロジェクトでは、Kokoroの高品質音声合成技術を利用して、複数の言語と音声をサポートしています。ユーザーは、簡単なコマンドラインで電子ブックを変換できます。

Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识-首席AI分享圈

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。このプロジェクトは、sunnynexusチームによって開発されています。

ラマ3.2推論WebGPU:ブラウザでラマ3.2を動かす

一般的な紹介 Transformers.jsはHugging Faceが提供するJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行できるように設計されている。このライブラリはHugging FaceのPython用transformersライブラリと同等であり、様々なプリ...

MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布-首席AI分享圈

MoneyPrinter V2:短いYouTube動画とTwitterコンテンツを自動生成し、公開する

一般的な紹介 MoneyPrinter V2はFujiwaraChokiによって開発されたオープンソースプロジェクトです。このプロジェクトは主にTwitter自動化、YouTubeショートビデオ生成、アフィリエイトマーケティングなどの機能を統合しています。ユーザはPythonスクリプトを使ってコンテンツ...

RTranslator:语音实时翻译安卓应用,免费且支持离线使用-首席AI分享圈

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイス用に設計されたほぼオープンソースの無料オフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の言語を話しているかのように他の人と会話をすることができます。RTranslatorは、対話を含む複数のモードをサポートしています...

Gemini Next Chat:一键免费部署您的私人多模态Gemini应用-首席AI分享圈

Gemini Next Chat: ワンクリックで、プライベートなマルチモーダルGeminiアプリを無料でデプロイできます!

一般的な紹介 Gemini Next Chatは、ユーザーがプライベートGeminiアプリケーションを簡単にデプロイできるように設計されたオープンソースプロジェクトです。このプロジェクトは、Gemini 1.5とGemini 2.0のマルチモーダルモデルをサポートしており、ユーザーはVercel上でワンクリックするだけで無料でデプロイすることができます。

AutoMouser:マウスアクションをAI経由でSelenium Pythonスクリプトに変換するブラウザ自動化コードの生成

概要 AutoMouserは、ユーザーのインタラクションをインテリジェントに追跡し、OpenAIのGPTモデルを使用してSeleniumテストコードを自動的に生成するChrome拡張機能です。ユーザーのブラウザ操作を記録し、堅牢でメンテナンス可能なPython Seleniumスクリプトに変換します。

Vanna:利用RAG技术将文本生成精准SQL查询-首席AI分享圈

Vanna: RAG技術を使ったテキストからの正確なSQLクエリの生成

一般的な紹介 VannaはMITライセンスのオープンソースPythonフレームワークで、RAG(Retrieval Augmented Generation)技術を使ってSQLクエリを生成することに重点を置いている。ユーザはRAGモデルを訓練し、自分のデータに適用し、質問をすると、Vannaは適切なSQLクエリを返す。これらのクエリは自動的に...

SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频-首席AI分享圈

SVFR:ビデオ顔修復を実装する統一フレームワーク、白黒、ぼやけたポートレート古いビデオの修復

包括的な紹介 SVFR(Stable Video Face Restoration)は、基本顔復元(Basic Face Restoration: BFR)、色付け、修復、およびそれらの組み合わせタスクをサポートする、ビデオ顔復元のための統一フレームワークである。このフレームワークは、生成と動きのアプリオリを利用し、統一的な顔復元フレームワークを通してタスク固有の情報を統合し、...

LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话-首席AI分享圈

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingはオープンソースのリアルタイムインタラクティブデジタルヒューマンシステムで、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーム処理、リップシンクロナイゼーションなど、数多くの最先端技術を統合しています。このシステムは、リアル ...

Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑-首席AI分享圈

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助ける、強力なオープンソースのAIプログラミングアシスタントツールです。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitワークフローにシームレスに統合し、...

JoyGen:音频驱动的3D深度感知人像说话视频编辑工具-首席AI分享圈

ジョイジェン:音声駆動型3D奥行き認識型トーキングビデオ編集ツール

包括的な紹介 JoyGenは、音声による表情生成の問題を解決することに重点を置いた、話す顔のための革新的な2段階映像生成フレームワークである。Jingdong Technologyのチームによって開発されたこのフレームワークは、高度な3D再構成技術と音声特徴抽出法を用いて、話者のアイデンティティ特徴と表情係数を正確にキャプチャします。

ja日本語