StableAnimator:キャラクターの特徴を維持した高品質のビデオアニメーションを生成します。包括的な紹介 StableAnimatorは、参照画像と一連のポーズをもとに、後処理なしで高品質な映像を合成できる、革新的なエンドツーエンドの同一性保持映像拡散フレームワークである。このプロジェクトは復旦大学によって開発された。最新のAIリソース# AI画像から動画へ1年前050.8K
忘れてください:あなたのコンピュータの未使用GPUグラフィックスパワーを共有し、お金を稼いで科学研究を支援しましょう!包括的な紹介 Nevermindは、アイドル状態のグラフィックカードの演算能力を利用して科学計算を行い、収益を得るプラットフォームです。ユーザーは、自分のコンピュータのアイドル状態のGPUリソースを共有することで、科学研究と技術進歩をサポートし、同時に一定の金銭的見返りを得ることができます。このプラットフォームは、科学の進歩を促進し、科学研究の重要な問題を解決することを目的としています。最新のAIリソース# AI副業お金儲けプロジェクト1年前081.1K
ソニック:音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。最新のAIリソース# AI Java オープンソースプロジェクト# AIデジタルマン12ヶ月前069.4K
オープンソースのAIフルスタックツール!Ollama+Qwen2.5-Codeのrunbolt.newで、ワンクリックでウェブサイトを生成!Cursor、V0、Bolt.newから最近のWindsurfまで、AIプログラミング・ツールは最近とてもホットだ。 この記事では、まずオープンソースのソリューションであるBolt.newについて話をしよう。Bolt.newは、製品発表からわずか4週間で400万ドルの収益を上げた。 このサイトはどうしようもない状態...AIハンズオンチュートリアル1年前041.8K
Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル(LLM)です。従来の音声認識システムとは異なり、Ultravoxは音声認識(ASR)ステージを別途用意する必要がなく、音声を直接高次元空間に...最新のAIリソース# AIビッグモデルネイティブダイアログツール# AI Java オープンソースプロジェクト1年前062.6K
infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。包括的な紹介 無限ズーム安定拡散(Infinite Zoom Stable Diffusion)は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...最新のAIリソース# AI Java オープンソースプロジェクト# AI動画変換スタイル1年前056.4K
Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツールはじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...最新のAIリソース# AI Java オープンソースプロジェクト#ポート同期1年前0100.8K
ロールアップ長文ベクトルモデル チャンキング戦略 コンペティションロングテキスト・ベクター・モデルは、10ページ分のテキストを1つのベクターにエンコードできる。 多くの人はこう考える。 必ずしもそうではない。 直接使ってもいいのか?チャンクすべきか?最も効率的な分割方法は?この記事では、長文ベクトルモデルの様々なチャンキング戦略について徹底的に議論し、その結果を分析します。AI知識ベース1年前039.7K
リサーチラビット:ネイティブのLLMを使用し、ユーザーが指定したトピックに自動的にドリルダウンし、サマリーを生成するWebリサーチとレポート作成。はじめに Research Rabbitは、LLM(Large Language Model)ベースのウェブリサーチおよび要約アシスタントです。ユーザがリサーチトピックを提供すると、Research Rabbitは検索クエリを生成し、関連するウェブ結果を取得し、これらの結果を要約します...最新のAIリソース# AI Java オープンソースプロジェクト# 詳細な調査レポートの作成12ヶ月前065.3K
返信gAI:ライターのツイートを自動収集し、あらゆるXユーザーの文体を模倣する一般的な紹介 返信 gAIはLangChainベースのAIツールで、X(旧Twitter)ユーザーのAIクローンを作成するように設計されています。このツールは、ユーザーのツイートを自動的に収集し、長期的なメモリに保存し、インクリメントの検索を使用することによってこれを行います...最新のAIリソース# AIロールプレイ1年前045.8K
ChatGPT-Canvasは、私たちの学術論文のアシストレビューと自動修正を行います。前回のアップデートは、ChatGPTのキャンバスの新機能についての説明でした。しかし、Canvasの様々な機能を簡単に説明しただけで、Canvasのアカデミックな応用の詳細については説明しませんでした。そこで、今回はCanvasのアカデミックな応用についてゆっくり説明します。AIハンズオンチュートリアル1年前055.3K
Lipdub: ビデオを翻訳し、言語の壁を取り除き、多言語字幕とリップシンクをサポートします。概要 Lipdubは革新的なAI動画翻訳アプリで、ユーザーが動画コンテンツを多言語に翻訳し、リップシンクできるように設計されています。Lipdubを使用すると、ユーザーは簡単にビデオを録画し、リアルタイムで27の異なる言語に翻訳することができます。このアプリのリ...最新のAIリソース# AI翻訳#ポート同期1年前054K
AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース(GUI)を提供します。最新のAIリソース# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク1年前049.3K
OpenAI-o1の実力は?論文執筆の質を向上させるために論文を深く最適化する! 30の秀逸なプロンプトワードを共有する!UCIの物理学博士がo1をテストしたところ、彼が1年かけて完成させた博士論文のコードが、AIによって1時間足らずで実装されることがわかった。o1のモデルは、博士論文のコードを修正するのに十分な強度をすでに持っている!これはまた、学術論文の書き方に革命を起こすことを意味する。 プロンプトの言葉を注意深く構成することによって...AIユーティリティ・コマンド1年前049.3K
論文の初稿を3時間で仕上げる! ChatGPT 学位論文執筆の全過程を網羅(プロンプト・ワードテンプレート付き)特に、圧倒的な情報量、細かなディテール、延々と続く書き直しに直面すると、論文の執筆は困難な挑戦になりがちです。この記事では、ChatGPTを使って学術論文の初稿を仕上げるまでの全プロセス(トピックの選択から文献レビュー、論文全体まで)をご紹介します...AIユーティリティ・コマンド1年前054K
スタンフォード大学のオープンソースChatGPTエッセイ作文プロンプト学術論文では、研究成果を伝えるために、明確で簡潔かつ説得力のある表現が不可欠です。しかし、英語を母国語としない研究者の多くは、学術論文を書いたり推敲したりする際に言葉の壁に直面する。この問題に対処するため、スタンフォード大学は、オープンソースプロジェクトを通じて、一連の効率的な論文タッチアップメンテーションを共有した...AIユーティリティ・コマンド1年前050.1K
LLMキューを効果的にテストする方法 - 理論から実践まで完全ガイド I. プロンプトのテストの根本的な原因:LLMはプロンプトに対して非常に敏感であり、微妙な言い回しの変更によって出力が大きく異なる可能性がある テストされていないプロンプトは次のようなものを生み出す可能性がある。AI知識ベース1年前042.1K
HelloMeme:ローカルの忠実度の高い表現アクション一貫性のある画像やビデオを生成、Runway Act oneオープンソースピンポン!包括的な紹介 HelloMemeはHelloVisionによって開発されたオープンソースプロジェクトであり、空間編み目アテンションを統合することによって、拡散モデルに高レベルで忠実なストリップを埋め込むことを目的としている。最新のAIリソース# AI画像から動画へ# AI Java オープンソースプロジェクト# AI動画変換スタイル1年前053.5K
キューワードは、ビデオオプショットの生成を正確に制御するためにタイムスタンプを追加します。ヘイローAIのビデオを例に、キューを書く: 00:00 猫の目、ズームイン 00:02 グレイのタビーの猫、ズームアウト 00:04 森の中の大きな木の下で草の上に横たわるグレイのタビーの猫 長くて6秒のビデオなので、最後のショットに2秒残す...AIユーティリティ・コマンド1年前049.9K
CYAN.AI (Cyan Puppet Technology): アクション生成大規模モデル、2D映像から3Dアクションデータを生成するAIプラットフォーム概論 Cyanpuppets Technologies(Cyanpuppets)は、畳み込みニューラルネットワーク(CNN)とディープ・ニューラル・ネットワーク(DNN)アルゴリズムにより、2D動画から3Dアクションデータを生成することに特化したAI技術のリーディングカンパニーである。同社の主力製品であるCYAN.AIプラットフォームは、高解像度の3Dアクションデータを生成することができる。最新のAIリソース# AI画像生成エイド1年前065.9K
QuickMagic:AIモーションキャプチャー技術で高画質なアニメーション動画を簡単作成概要 QuickMagic AIは、シンプルなビデオを高品質な3Dアニメーションに変換するために設計された、高度なAI駆動型モーションキャプチャツールです。アニメーター、ゲーム開発者、デジタルコンテンツ制作者など、QuickMagic AIは高速かつ正確なモーションキャプチャーを実現します。最新のAIリソース# AI画像生成エイド# AI動画変換スタイル1年前082.5K
Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。概要 Chunkrは、PDF、PPTX、DOCX、ExcelファイルをRAG(Retrieval Augmented Generation)やLLM(Large Language Modelling)で使用するのに適したデータに変換するためのセルフホストAPIです。このプロジェクトはLumina...によって開発されました。最新のAIリソース# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング1年前051.8K
カード絵のプロンプトワード:誠実さを表現するワークウィークの絵を生成する;; ━━━━━━━━━━━━━━ ;; 作者: 李继刚 ;; 版本: 0.1 ;; 模型: Claude Sonnet ;; 用途: 将真心话转化为周报 ;; ━━━━━━━━━━━━━━ ;; 设...AIユーティリティ・コマンド1年前041.8K
ChatMCP: MCPプロトコルを実装し、複数のLLMモデルをサポートするAIチャットクライアントChatMCPの概要 ChatMCPはModel Context Protocol (MCP)を実装するために設計されたオープンソースのAIチャットクライアントです。GitHubユーザーのdaodao97によって開発されたこのプロジェクトは、O...のような様々な大規模言語モデル(LLM)をサポートしています。最新のAIリソース# AI統合マルチモデル対話プラットフォーム1年前068.5K
Zoo: テキストから3Dモデリングが可能なハードウェア設計用CADソフトウェア概論 Zooは最新のハードウェア設計のために構築されたCADソフトウェアプラットフォームです。Zooの主な機能には、Text-to-CADインターフェース、モデリングアプリケーション、差分ビューアーなどがあります。最新のAIリソース# AIテキストとイメージを3Dへ1年前075.8K
Conch AI VideoはComfyUIノードにどのように統合されていますか?Conch AI (MiniMax)のビデオ生成を画像領域でより良く使用するために、ComfyUIノードを保守しています。 ComfyUI MiniMax Videoは、MiniMax AIを統合した強力な拡張機能です。AIアンサー1年前056.6K
GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング1年前076.8K
CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル(LLM)を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...最新のAIリソース# AI Java オープンソースプロジェクト1年前059.7K
AI検索ツールPK、知識検索の神3強は?「パープレキシティ」「シークレットタワー」「Felo」を徹底比較まだ百度で情報検索しているの?効率が悪すぎる! 情報爆発時代、必要な情報を正確に入手することは、希少な能力となっています。検索能力を向上させる第一歩は、検索エンジンを変えることです! 従来の検索エンジンは、広告や複雑な情報が多いだけでなく、効率が悪く、検索結果の判断が難しい。AIニュース1年前053.2K
Sourcery:AIコードレビューでコード品質と技術的負債管理を自動改善概要 SourceryはAIベースのコードレビューツールで、開発者が自動的にコード品質を改善し、開発生産性を向上させるように設計されている。GitHubとGitLabのリポジトリに統合され、すべてのプルリクエストを即座にレビューし、人間のようなサロゲートを提供することができます...最新のAIリソース# AIプログラミング1年前056.1K
Codiga: IDE内のコード問題をリアルタイムで検出し、コード品質とセキュリティを向上させるための修正案を提供する。概要 Codigaは、開発者がコードを書きながらリアルタイムで潜在的な問題を検出し、修正できるように設計された強力な静的コード解析ツールです。このプラットフォームは、複数のプログラミング言語と、VS Code、JetBrains、Visu...などの統合開発環境(IDE)をサポートしています。最新のAIリソース# AIプログラミング1年前057.4K
世界中のプログラマーが使っている2024年のベストAIコーディングアシスタントツール17選まえがき 「良い仕事のための良い道具は、良い仕事のための良い道具である」ということわざがあるように、プログラマーにとって良い道具を選ぶことは特に重要である。良いツールを選ぶことは、プログラマーにとって特に重要である。コードの自動化であれデバッグであれ、AIコーディング・アシスタントはあなたの時間を節約し、コードの質を向上させることができる。この記事では、世界中のプログラマーが最も頻繁に使用しているものをいくつか紹介する...AIニュース1年前056.9K
プロジェクト・マリナー:ブラウザ・オートメーション、ヒューマン・コンピュータ・インタラクションの未来を探る研究プロトタイプ(未発表)概論 Project Marinerは、人間とコンピュータのインタラクションの未来を探るためにGoogle DeepMindが立ち上げた研究プロトタイプである。このプロジェクトは、Gemini 2.0の強力なマルチモーダル理解および推論機能を活用し、ブラウザの自己...最新のAIリソース# デスクトップ・オートメーション・インテリジェンス1年前051.9K
Devin、自律型AIプログラミング・アシスタントを使ってオープンソース・コミュニティ向けに問題のあるコードを修正 Devinの正式ローンチの一環として、Devinチームプランの500ACUを、選ばれたオープンソースプロジェクトメンテナに無料で提供します。今すぐapp.devin.aiにアクセスして登録し、osi@cogniti...AIニュース1年前044.8K
ジェミニ2.0リリース:インテリジェンティアの時代のために作られた新しいAIモデルグーグルおよびアルファベットCEO、スンダル・ピチャイより:情報は人類の進歩の中心にあります。だからこそ私たちは26年間、世界中の情報を整理し、アクセスしやすく便利なものにすることに取り組んできました。それはまた、私が...AIニュース1年前051.6K
Jules:GitHubワークフローのバグ修正など、PythonやJavaScriptのコーディング作業を自動化する実験的なAIコードアシスタント。概要 JulesはGoogle LabsのAIコードアシスタントで、開発者のプログラミング効率向上を支援するために設計されている。最新のGemini 2.0フラッシュモデルを統合し、開発者にインテリジェントなコード提案とGithub上での自動化を提供することができます...最新のAIリソース# AIプログラミング1年前060.5K
ZoSugar: オンライン写真加工ツール、ワンクリックキーイング、透かし除去、写真修復、ポートレート編集総合紹介 ZuoSugar(PicWish)は、豊富なオンライン写真編集ツールを提供し、すべてのプラットフォームの使用をサポートするインテリジェントなAI画像処理プラットフォームです。ユーザーは簡単にワンクリックでキーイング、透かし除去、ぼやけた写真を鮮明に、ロスレスズーム、画像トリミング、画像圧縮、白黒写真を完成できます。最新のAIリソース# AI 画像の拡大と復元# AIイメージエディター# AIキーイングによる背景変更1年前061.5K
NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。最新のAIリソース# AI画像生成エイド# AI Java オープンソースプロジェクト1年前071.6K
Wasitai:画像がAIによって生成されたかどうかをチェックするシンプルなツール。はじめに Wasitaiは、AIによって生成された画像かどうかを簡単に検出できる強力で便利なツールです。画像生成分野におけるAIの進歩に伴い、テキストやスケッチ、その他の画像からリアルで高品質な画像を生成するためのツールやプラットフォームが数多く提供されている。しかし、すべての...最新のAIリソース# AI画像生成エイド# AIオープンサービス1年前076.5K
ソングライターPPT:数秒でPPTに任意のドキュメント、永久無料PPTインテリジェント生成ツール一般的な紹介 シンガーPPTは、永久に無料のPPTスマートジェネレータツールです。ユーザーは簡単にPPTに任意のトピックや材料を変換し、美しいテンプレートやカスタマイズされたテンプレートの多くを適用することを選択することができます。ウェブサイトだけでなく、便利な操作体験を提供するだけでなく、ユーザーを介してPPTプログラムを共有する...最新のAIリソース# AI生成プレゼンテーション/PPT1年前050.5K
ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...最新のAIリソース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション1年前067.7K
Tafi:カスタム3Dキャラクターを最速で作成、AIキャラクター生成(ベータ版)概 要 Tafiは、AI技術により3Dキャラクターの作成プロセスを簡素化することに特化した、世界をリードする3Dコンテンツ作成プラットフォームです。プロのアーティストもホビーユーザーも、Tafiを使って簡単に高品質な3Dキャラクターを作成することができます。このプラットフォームでは、数百万もの高解像度...最新のAIリソース# AIテキストとイメージを3Dへ1年前054.1K
Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール概要 Sketch-Genは、アーティストやデザイナーが高品質な線画やスケッチを素早く生成できるように設計された、AI技術ベースの線画・スケッチ生成ツールです。Paints-UNDOプロジェクトから生まれたこのツールは、高度な機械学習モデルを使用しています。最新のAIリソース# AI画像生成エイド# AI Java オープンソースプロジェクト1年前058.8K
AIフィッティングの精神、ワンクリックでどんなキャラクターもドレスアップ可能AIフィッティングが可能なモデルやツールの多くは、充電が必要であったり、エクストラネット上で魔法を使用する必要があったり、ローカルに配備する必要があったりすると書いたが、最もシンプルで簡単に使用できたり、陵がAIフィッティング機能をリリースした。 その1.5モデルの新しいアップグレードの発表後、レーサーの下でケリンAIプラットフォームは、リリースしました...AIハンズオンチュートリアル1年前050.9K
PydanticAI: PydanticでジェネレーティブAIアプリを作れば、本番レベルのAIアプリが簡単に作れる概論 PydanticAIはPydanticベースのPythonエージェントフレームワークで、生成AIアプリケーションの開発を簡素化するために設計されています。Pydanticチームによって開発され、幅広いモデル(OpenAI、Gemini、Groqなど)と...最新のAIリソース# AI Java オープンソースプロジェクト1年前055.4K
Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。最新のAIリソース# AI Java オープンソースプロジェクト1年前074.8K
クロード3.5ソネットでAIスタートアップのトレンド分析エージェントを構築Pythonコード50行未満でフル機能のAIエージェントアプリを(ステップバイステップガイド)AIツールは、起業家がトレンドを特定し、意思決定を行う方法を変えているが、スタートアップの機会を分析するためのスケーラブルなソリューションを構築するには、多くの場合、複数のデータソースを統合し、それらを迅速に処理する必要がある。しかし...AIハンズオンチュートリアル1年前055.4K
Dia Browser: ブラウザのタスクを自動化する統合AIツールにより、インテリジェントなブラウジング体験を提供(未公開)概要 Dia Browserは、The Browser Companyが開発した新しいスマートブラウザで、高度なAIツールを統合することで、より効率的なブラウジング体験をユーザーに提供することを目的としている。このブラウザは2025年初頭に正式リリースされる予定で、主な機能は...最新のAIリソース# デスクトップ・オートメーション・インテリジェンス1年前057K
カーソルとウィンドサーフを1時間で月500ドル相当のデビンに変える!前回の記事では、完全自動プログラミングを可能にするエージェント型AI、Devinについて説明した。CursorやWindsurfといった他のエージェント型AIツールに比べ、Devinはプロセス・プランニングや自己進化に優れている。AIハンズオンチュートリアル1年前046.5K
E2M: 複数のファイル形式をMarkdownに変換し、簡単に統一されたドキュメントフォーマットを実現する概要 E2M (Everything to Markdown)は、様々なファイルフォーマットをMarkdownフォーマットに変換するために設計されたオープンソースのPythonライブラリです。このツールは、doc、docx、epub、html、htm、u...などのフォーマットをサポートしています。最新のAIリソース# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング1年前058.2K
cursor-vip:10%または20%の割引価格、CURSOR Proを使用するための自動ライセンス(共有アカウントクレジットに注意してお支払いください。)概要 cursor-vipはスマートコードエディターCURSORのために設計されたツールサービスで、ユーザーはアカウントにログインすることなくVIPスマートチップ機能を楽しむことができます。このツールはMacOS、Linux、Windowsシステムに対応しています。最新のAIリソース# AIオープンサービス1年前095.7K
ハイブリッドVincennesビデオ:高品質のビデオのリアルな映像を生成し、テンセントは、大規模なモデルのオープンソースのビデオ生成総合紹介 テンセント混元テキスト生成動画(Yuanbao APPで利用可能)は、テンセントが開始したAI技術に基づく動画生成プラットフォームです。このプラットフォームは、強力な分野横断的知識と自然言語理解力を備えた騰訊混合元ビッグモデルを活用し、ユーザーのテキスト記述に基づいて高品質の動画を生成する。最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストからビデオへ1年前067.1K
OpenAIが "小中学校教員向けChatGPT無料講座 "を公開2024年11月20日、OpenAIはK-12の教師がChatGPTを授業に導入するための無料オンラインコースを開始した。 このコースはChatGPT Founda...AIニュース1年前050.1K
Llama OCR: 3行のコードで画像をMarkdownに変換するOCRライブラリ。概要 Llama OCRは、Llama 3.2 VisionをベースにしたOCR(光学式文字認識)ライブラリで、文書をMarkdown形式に変換することができます。このライブラリーはNutlope社によって開発され、Togetherを使用しています。最新のAIリソース# AI Java オープンソースプロジェクト# OCR# Free Large Model API1年前058.7K
Invideo AI: AIが生んだビデオツール|プロフェッショナルビデオ制作・編集プラットフォームInvideo AI 概要 InVideo は、ビデオ作成プロセスを簡素化するために設計されたオンラインビデオ編集プラットフォームです。ビデオ制作の初心者でもプロでも、InVideoは高品質なビデオを素早く作成するのに役立ちます。このプラットフォームでは、5,000以上の...最新のAIリソース# AI動画生成ツール# AIオーディオ/ビデオ・エディター1年前069.9K
Clevrr Computer: PyAutoGUIライブラリでデスクトップ操作のインテリジェンスを自動化する一般的な紹介 Clevrr Computerは、PyAutoGUIライブラリを使用してシステム操作を自動化することを目的としたオープンソースプロジェクトです。このプロジェクトはAnthropicにインスパイアされ、PyAutoGUIライブラリを使用して正確かつ効率的に操作を実行できる自動化エージェントを設計しました。最新のAIリソース# AI Java オープンソースプロジェクト# デスクトップ・オートメーション・インテリジェンス1年前058.1K
Smart Spectrumオープンプラットフォーム、初の無料マルチモーダルビジョンモデルGLM-4V-Flashをオンラインで、無制限に使用できます!2024年8月のフリーオープン言語モデルに続き、Wisdom Spectrumは128Kコンテキスト/4K出力長のbigmodel GLM-4-Flashフルボリュームフリーオープンをサポートします! 本日、bigmodelオープンプラットフォーム(bigmodel...AIニュース# Free Large Model API1年前070.8K
Director: 自然言語記述によるビデオ検索、編集、生成ワークフローのためのインテリジェントビデオエージェントフレームワーク概要 Directorは、インテリジェントなビデオエージェントを構築することで、ビデオインタラクションとワークフローを簡素化し、最適化するために設計されたオープンソースのフレームワークです。このフレームワークは、VideoDBの "video-as-data "インフラストラクチャに基づいており、検索、編集、コンパイル、生成などの複雑なビデオタスクを処理することができます。最新のAIリソース# AI Java オープンソースプロジェクト# AIオーディオ/ビデオ・エディター1年前055.9K
MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストおよび音声/ビデオ要約ツール# MCPサービス1年前058.5K
LongWriter:ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル(LLM)に基づいており、10,000語以上の長文を生成することができます。最新のAIリソース# AI Java オープンソースプロジェクト1年前057K
Plate: 豊富なプラグイン拡張機能をサポートしたAI駆動型リッチテキストエディタ概要 PlateはReactとTypeScriptで構築されたAI搭載のリッチテキストエディタで、高度にカスタマイズ可能で拡張性の高い編集体験を提供するように設計されています。Slate.jsをコアに利用し、モダンなUIと組み合わせている。最新のAIリソース# AIライティング# AI Java オープンソースプロジェクト1年前084.6K
Sora: テキストからAIビデオへ、ビデオ編集クリエイティブスイート一般的な紹介 Soraは、OpenAIによる先進的なビデオ生成ツールで、人工知能技術によってユーザーが簡単に高品質なビデオコンテンツを作成できるように設計されています。Soraは、拡散モデルを使用して、静的ノイズから始まる多段階のノイズ除去プロセスによって完全なビデオを生成します。ユーザーは...最新のAIリソース# AI画像から動画へ# AIテキストからビデオへ# AI動画変換スタイル1年前075.4K
古書の知識:古書資料の無料オンライン閲覧・検索、古書原文のAIアシスタントによる現地語解釈総合紹介 魯甸古書は、北京大学とByteDance Public Welfareが共同で立ち上げた古書デジタル化プラットフォームで、古書の無料オンライン閲覧・検索サービスを一般に提供することを目的としている。周易』、『左伝』、『礼記』などの古典籍を含む2,200点以上の古書資料を集め、高画質で...最新のAIリソース# AI教育ツール1年前052.7K
Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。一般的な紹介 MinimaはオープンソースのRAG(Retrieval-Augmented Generation)ソリューションで、ChatGPTのローカル展開と統合をサポートしています。プロジェクトはdmayborodaによって管理されており、その目的は...最新のAIリソース# AI Java オープンソースプロジェクト# 知識検索とRAGフレームワーク1年前048.5K
MuseGAN: マルチトラック音楽/サウンドトラックを生成し、複数の楽器の音楽クリップを簡単に作成するためのオープンソースモデル一般的な紹介 MuseGANはGenerative Adversarial Networks (GAN)に基づいた音楽生成プロジェクトで、マルチトラック(マルチ楽器)の音楽を生成するように設計されています。MuseGANはLakh Pianorを使用しています。最新のAIリソース# AI Java オープンソースプロジェクト# AIミュージック1年前051.4K
MoneyPrinterTurbo:ビデオテーマを入力すると、ワンクリックでビデオコピーと短いHDビデオを生成します。総合紹介 MoneyPrinterTurboはオープンソースプロジェクトで、先進的なAIビッグモデル技術を利用して、ワンクリックで短いHDビデオを生成する機能を実現します。ユーザーは動画のテーマやキーワードを提供するだけで、システムが自動的に動画コピー、動画クリップ、動画字幕を生成します。最新のAIリソース# AI Java オープンソースプロジェクト# AI動画生成ツール1年前060K
Docling:様々なフォーマットのドキュメントをサポート MarkdownやJSONへの解析とエクスポート PDFサポート OCR包括的な紹介 Doclingは、PDF、DOCX、PPTX、XLSX、画像、HTML、AsciiDocおよびMarkdownを含む幅広い文書形式をサポートする強力な文書解析およびエクスポートツールです。最新のAIリソース# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング1年前0101.7K
オープンソースの1.6Bミニ・モデル "リトル・フォックス"、類似モデルの "クウェン "と "ジェンマ "を凌駕 GPT-1のパラメーター数は1億1700万(1億1700万)だったが、第4世代のGPT-4はパラメーター数を18000に更新した...。AIニュース1年前037.9K
メタ、ラマ3.3をリリース、70Bのパラメータはラマ3.1より強い 405B - より小さく、より速く、より強くMeta社は、700億パラメータを持つ大規模言語モデルLlama 3.3を発表した。これは、その前身である405BパラメータのLlama 3.1の性能に匹敵し、Llama 3.1 405Bに比べて入力コストを10分の1に削減する!命令...AIニュース1年前066K
Model Context Provider CLI: クロードに依存しない、あらゆる大規模モデルでMCPサービスを使用するためのコマンドラインツール。包括的な紹介 モデルコンテキストプロバイダCLI(mcp-cli)は、モデルコンテキストプロバイダサーバと対話するためのプロトコルレベルのコマンドラインツールです。このツールによって、ユーザーはコマンドを送信したり、データを照会したり、サーバーが提供する様々なリソースと対話したりすることができます...最新のAIリソース# AI Java オープンソースプロジェクト# MCPサービス1年前052.9K
インテリジェント・ドキュメンテーション: Dify Chatflowによる効率的な入札書類作成自然言語対話型データベース 読み書き 年末になると入札シーズンが到来し、入札書類のような大きな文書の作成には頭を悩ませることが多い。 正確で専門的な内容であることはもちろん、自社の強みをアピールする必要があり、専門的な知識とコピーライティングのスキルの両方が試される。その両方があってもなお、時間がかかる......。AIハンズオンチュートリアル1年前070K
騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー本記事では、Dify v0.12.1バージョンを使用し、主にDifyワークフローのHTTPノードを紹介し、siliconflowのtencent/HunyuanVideoインターフェイスを呼び出すために、テキストを介して、ビデオの具体的な実装を生成します。その中で、Di...AIハンズオンチュートリアル1年前056K
AIMedia:ホットスポットを自動的に収集し、ニュースを自動的に生成し、すべての主要なプラットフォーム上で自動的に公開する完全自動のホスト型AIメディアソフトウェア。総合紹介 AIMediaは、話題のニュースやAIが作成した記事を自動的に取得し、主要なプラットフォームに自動的に公開するために設計された統合ソフトウェアです。本ソフトウェアは、Today's headlines、Xiaohongshu、WeChat public numberなどの様々なプラットフォームをサポートしています。最新のAIリソース# AIライティング1年前074.7K
ベースモデルのAmazon Novaファミリー:包括的なジェネレーティブ人工知能(Gen AI)サービスの提供 推論とトレーニングのために構築されたInferentiaとTrainiumチップから、Amazon Bedrockにおける業界最高の基盤モデルの提供、AI主導の...AIニュース1年前042.5K
コンクAI国際版、オンライン第二声クローン機能、中国語と英語は非常によく音読!コンチAPPを使用したことがある場合は、その声のクローンを使用したことがあり、効果は非常に良いですが、APPの音声アシスタントとしてのみ使用することができます。 今回、Conch AIビデオ国際版公式サイト、新しい "オーディオ "チャンネルでは、簡単に自分の声をクローンすることができます。 音声合成のメインインターフェイスに戻る...AIニュース1年前044.3K
ControlFlow:制御された透明なAIインテリジェンス・ボディ・ワークフローを構築するためのPythonフレームワーク概論 ControlFlowはPrefectHQによって開発されたPythonフレームワークで、AIワークフローの構築と管理に特化している。ワークフローを定義し、大規模言語モデル(LLM)生成にタスクを委譲するための、構造化された開発者指向のフレームワークを提供します。最新のAIリソース# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク1年前048.7K
ビデオの顔交換にはどのようなソフトウェアを使用していますか?ビデオフェイススワッピング技術科学:一般的なソフトウェアの推奨と応用分析 ビデオフェイススワッピング技術とは? ビデオフェイススワッピング技術とは、人工知能とディープラーニングに基づく画像処理技術であり、1つの顔を別の顔に置き換え、動的な表情や頭の動きの自然な一貫性を維持することができる。近年では、この...AIアンサー1年前073.8K
Smart Composer: ローカルノートを参照するためのスマートライティングとセマンティック検索のためのObsidianプラグイン概論 Smart ComposerはObsidianノート作成ソフトウェア用に設計されたスマートライティングアシスタントプラグインです。人工知能技術を使って、文脈を意識したチャットアシスタント、スマートライティングアシスタント、ワンクリック編集機能を提供します。このプラグインは、ユーザーの...最新のAIリソース# AIノート1年前084.5K
ConsisID:キャラクタ一貫性のある映像を生成するポートレート参照マップ、迅速な多端末統合包括的な紹介 ConsisIDは、北京大学のYuan Rong氏のグループによって開発されたオープンソースプロジェクトであり、周波数分解技術によって、同一性のあるテキストからビデオへの生成(IPT2V)を実現することを目的としている。プロジェクトの中核は、DiT(Diffusion Transfor...最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストからビデオへ1年前057.6K
GraphRAG Visualizer: Microsoft GraphRAGアーティファクトを視覚化・探索するツールはじめに GraphRAG Visualizer は、Microsoft GraphRAG の成果物を視覚化し、探索するために設計されたウェブベースのツールです。アップロードされたPar...最新のAIリソース# AI Java オープンソースプロジェクト#ナレッジグラフ1年前064.4K
Windsurf: インターフェース自動化テストのコードを書くためのツールWindsurfはユーザーに高いコーディング能力を要求せず、同時に生成されるコードの精度も高い。Windsurfはユーザに高いコーディング能力を要求せず、同時に生成されるコードの精度も高い。 さらに、生成されるテストケースのシナリオカバレッジは...AIハンズオンチュートリアル1年前054.4K
EMO: 似顔絵画像と人の声の音声をもとに、高品質な似顔絵動画を生成。総合紹介 YUE Portrait EMOは、阿里雲大型モデルサービスプラットフォーム「百精(モデルスタジオ)」が提供する高品質なポートレートダイナミックビデオ生成ツールです。このツールは、肖像画像と人の声の音声ファイルに基づいて、リアルな肖像モーションビデオを生成します。YUE Portrait EMO...最新のAIリソース# AIデジタルマン1年前051K
Rubbrband:会話形式で画像や動画を生成・編集できる多目的プラットフォーム概要 Rubbrbandは、画像や動画の生成・編集に特化した汎用性の高いメディア生成プラットフォームです。高度なAI技術を駆使し、テキストから画像への変換、概念モデルのトレーニングなど、ユーザーが簡単に高品質なビジュアルコンテンツを作成できるよう、幅広い機能を提供しています。いいえ...最新のAIリソース# AIイメージエディター# AIオンライン画像生成1年前047.7K
Project IDX: クラウドに統合されたマルチ開発環境のためのAI IDE、グーグルの無料ウェブベースAIコードエディター包括的な紹介 Project IDXは、Googleが提供するAI支援のフルスタック、マルチプラットフォームのアプリケーション開発ワークスペースである。Google Cloudをベースとし、複数のフレームワークと言語をサポートし、多くのGoogle製品とサービスを統合しています。最新のAIリソース# AI IDE# AIプログラミング11ヶ月前063.1K
Crawlee: Node.jsによる信頼性の高いWebクローラとブラウザ自動化ツールの構築一般的な紹介 CrawleeはApifyによって開発されたオープンソースのウェブクローラーとブラウザ自動化ライブラリで、Node.js環境用に設計されています。JavaScriptとTypeScriptをサポートしており、Puppeteer...最新のAIリソース# AI Java オープンソースプロジェクト1年前053.6K
FliFlik:AI画像処理クライアント、ワンクリックで画像HD、拡大、ノイズ除去、透かし除去が可能概要 FliFlikは効率的で便利なデジタル処理サービスを提供するマルチメディアソリューションプラットフォームです。写真、オーディオ、ビデオなど、FliFlikは高度なAI技術でそれらを最適化し、向上させることができます。このプラットフォームはWindows...最新のAIリソース# AI 画像の拡大と復元# AIキーイングによる背景変更1年前057.6K
携帯電話のカメラをコンピュータのカメラにする方法と、携帯電話のカメラをコンピュータに接続する方法は?現代生活において、ビデオ会議、オンライン学習、ライブストリーミングは日常生活の重要な一部となっている。しかし、多くのコンピューターには、鮮明さを求めるニーズに応えられない質の低いカメラが搭載されている。そんな時、過小評価されている資源である携帯電話のカメラを使えば、簡単に高画質のパソコン用カメラに変身させることができる。ピックアップ ...AIアンサー1年前056K
Observers:OpenAI互換のAPIリクエストデータを追跡するAI observabilityのための軽量ライブラリ概要 Observersは、生成AI APIに包括的な観測機能を提供するために設計されたオープンソースのPython SDKです。このライブラリにより、ユーザーはAIモデルとのインタラクションを簡単に追跡・記録し、これらの観測結果を複数のバックエンドに保存することができます。どのような...最新のAIリソース# AI Java オープンソースプロジェクト1年前046.8K
AI工学部:1.キュー・エンジニアリング🚀 プロンプト・エンジニアリング プロンプト・エンジニアリングは、ジェネレーティブAIの時代における重要なスキルであり、言語モデルが望ましい出力を生成するよう導くための効果的な命令を設計する技術と科学である。DataCampによると、この新しい分野には...AI知識ベース1年前038.3K
BISHENG:エンタープライズAIアプリケーション構築のためのオープンソースLLM DevOpsプラットフォーム包括的な紹介 BISHENGは、次世代のエンタープライズAIアプリケーションのために設計されたオープンソースのLLM(大規模言語モデル)DevOpsプラットフォームです。このプラットフォームは、生成AIワークフロー、RAG(Retrieval Augmented Generation)、インテリジェントエージェント、統合モデル管理などの強力で包括的な機能を提供します。最新のAIリソース# ローコードワークフロー# インテリジェントボディ開発フレームワーク1年前084.7K
Knowledge Graph Studio (WhyHow): ナレッジグラフの作成と管理のためのオープンソースプラットフォーム。包括的な紹介 Knowledge Graph Studio (KGS) は、RAGネイティブなナレッジグラフの作成と管理のプロセスを簡素化するために設計されたオープンソースのプラットフォームです。このプラットフォームは、ルールベースのエンティティ解決、モジュール式のグラフ構築、柔軟なデータ...最新のAIリソース# AI Java オープンソースプロジェクト#ナレッジグラフ1年前074.9K
GLM-PC(スマート・スペクトラム・ブル)が社内ダウンロードで正式リリース、コンピュータを本当にコントロールできるAIGLM-PC(ブル)の紹介 GLM-PCはCogAgentモデルに基づいたデスクトップアプリケーションであり、自然言語コマンドによって複雑なタスクを迅速に実行することができる。タスクプランニングとインターフェイス理解能力を持ち、ユーザの指示に従って自律的にコンピュータの様々な操作を行うことができる。 使用上の注意...最新のAIリソース# デスクトップ・オートメーション・インテリジェンス1年前055.4K
PSHuman: リアルな3Dポートレートモデルを生成。概要 PSHumanは、マルチビュー拡散技術に基づいた単一画像の3Dポートレート再構成ツールです。PSHumanのコアテクノロジーは、クロススケール・マルチビュー拡散であり、...最新のAIリソース# AIテキストとイメージを3Dへ1年前061K
プログラミングを知らない人でもウィンドサーフを使って完全なアプリを書けるようにする方法プログラミングを知らない男がウィンドサーフで月に100万ドル稼いでいる」というインターネット上のニュースを鵜呑みにしてはいけない。彼は本当にプログラミングを知らないかもしれないが、彼の父親はそうだった。プログラミングを少しも知らなければ、あるいは英語さえ知らなければ、完全なプログラムを書くのは本当に難しい。インターネットにはプログラミングに詳しい人がたくさんいて、ウィンドサーフの実際の使い方を教えてくれます。AIハンズオンチュートリアル1年前049.7K
AI工学アカデミー:2.1 RAGをゼロから実装する概要 このガイドでは、純粋なPythonを使ってシンプルなRAG(Retrieval Augmented Generation)システムを作成する手順を説明します。埋め込みモデルと大規模言語モデル(LLM)を使って、関連ドキュメントを検索し、ユーザークエリに基づいてレスポンスを生成します。 https...AI知識ベース1年前035.9K
レポートMAIstro:ビジネス分析、期末レポートなど、カスタムトピックに関する詳細なレポートを作成します。概要 レポートmaistroは、自然言語処理技術により、ユーザーが簡単にカスタムレポートを作成できるように設計された強力なツールです。このツールはLangChainテクノロジーを利用し、ユーザーから提供されたトピックや構造を詳細なレポートに変換します。最新のAIリソース# AI Java オープンソースプロジェクト# 詳細な調査レポートの作成12ヶ月前040.6K
TRELLIS:複数のフォーマットをサポートし、柔軟な編集が可能なマイクロソフト開発の3Dアセット生成モデル概 要 TRELLISは、マイクロソフトが開発した大規模3Dアセット生成モデルです。テキストや画像のプロンプトを受け取り、ラジアルフィールド、3Dガウシアン、メッシュなど、さまざまな形式で高品質な3Dアセットを生成することができます。TRELLISの中核をなすのは、統一された構造化潜在...最新のAIリソース# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ1年前070.3K
GraphCast:拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツールはじめに GraphCastはGoogle DeepMindによって開発された先進的な天気予報ツールで、ディープラーニング技術によって中期的な世界の天気予報の精度を向上させることを目的としている。このプロジェクトでは、事前に学習された様々なモデルとサンプルコードを提供しており、ユーザーはこれらのコードをリソースとして利用することができます。最新のAIリソース# AI Java オープンソースプロジェクト1年前050.7K
ChatGPT名状しがたい名前!"デビッド・メイヤー "とは何者か、なぜ彼はAIの活動を止めたのか?OpenAIは、David Mayerという名前が内部のプライバシーツールによってフラグを立てられたことを確認し、「場合によっては、ChatGPTはプライバシーを保護するために人々に関する情報の一部を提供しないことがある」と述べた。 この週末、ChatGPTユーザーは...AIニュース1年前046.8K