AIシェアリングサークル

ポーンをアーチにしてキングをシェアするデイ！

Google Vids：プロンプトの指示と文書から始めるマーケティング説明ビデオの作成

はじめに Google Vidsは、Google Workspaceスイートに含まれるAIを活用した動画作成ツールで、ユーザーが仕事関連の動画コンテンツを簡単に作成・共有できるように設計されています。簡単なプロンプトとクリップの統合により、ユーザーはストーリーを作成できます...

最新のAIリソース # AIイメージエディター # AIテキストからビデオへ

1年前

060.1K

TableGPT2: 表形式データ統合のためのマルチモーダルモデル

包括的な紹介 TableGPT2は浙江大学のチームによって開発されたマルチモーダルモデルで、表形式データの統合と処理に焦点を当てている。このモデルは、強力な汎用言語とコーディング能力を維持しながら、表データ関連のタスクで優れた性能を発揮できるよう、事前に訓練され、微調整されている。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

054.7K

Context：无缝集成各类数据源源，多角色Agent自动化完成不同工作场景内容

コンテキスト：さまざまなデータソースのシームレスな統合、さまざまな作業シナリオを完了するためのマルチロールエージェントの自動化コンテンツ

概要 Context Autopilotは、高度な統合とオフィスの自動化を通じてチームの生産性を向上させるために設計された、ContextのインテリジェントなAI生産性ツールです。このツールは、世界初のコンテキストエンジンContext-1...

最新のAIリソース #インテリジェント・ボディ・アプリケーション

1年前

054.7K

即将推出可灵（Kling）1.5：“自定义模型”用自己的视频素材训练人物一致性角色。

近日公開予定のクリング1.5：「カスタムモデル」は、独自のビデオ映像でキャラクターをトレーニングします。

従来の動画生成の常識を覆す Kling AIの「カスタムモデル」機能では、ユーザーは10～30本の動画（それぞれ10秒以上の長さ）をアップロードすることで、キャラクターのトレーニングを行うことができる。このプロセスは、従来の画像トレーニングモデルとは大きく異なり、Kling AIはビデオ映像をキャラクター...

AIニュース

1年前

055.5K

EyeLevel（GroundX）：多模态企业文档数据处理平台，从RAG源头消除LLMs幻觉

EyeLevel（GroundX）：RAGソースからLLMの幻想を排除するマルチモーダル企業文書データ処理プラットフォーム

総合紹介 EyeLevelは、複雑な企業コンテンツを大規模言語モデリング（LLM）処理に適したデータに変換することで、データの錯覚を防ぐことに注力しています。独自のデータ変換エンジンとマルチモーダル処理技術により、EyeLevelは複雑な表やグラフを変換することができます。

最新のAIリソース # AIオープンサービス

1年前

056.1K

WebSpy：ウェブサイトのSEO指標で、ウェブサイトのリクエストを分析、テストし、ウェブサイトのパフォーマンスを最適化します。

一般的な紹介 WebSpyは、開発者やテスターのために設計された強力なWebサイト分析とテストツールです。複数のリクエストタイプ（GET、POST、PUT、PATCH、DE...など）をサポートし、ウェブサイトのHTTPリクエストとレスポンスを監視、編集することができます。

最新のAIリソース # AIオープンサービス

1年前

052.2K

fal: リッチメディアクラス開発者のためのジェネレーティブ・マクロモデリングAPI

一般的な紹介 falは、画像、ビデオ、音声を含む高品質な生成メディアモデルを用いてリアルタイムAIアプリケーションを構築するためのオンラインAI推論プラットフォームです。コールドスタート不要、従量課金制です。falは、Stable Dif...

最新のAIリソース # AIオープンサービス

1年前

075.3K

VideoChat：自定义形象和音色克隆的实时语音交互数字人，支持端到端语音方案和级联方案

VideoChat：カスタムイメージとトーンクローニングによるリアルタイムの音声対話型デジタルパーソンは、エンドツーエンドの音声ソリューションとカスケードソリューションをサポートします。

概要 VideoChatは、オープンソース技術に基づくリアルタイム音声対話デジタルパーソンプロジェクトで、エンドツーエンドの音声スキーム（GLM-4-Voice - THG）とカスケードスキーム（ASR-LLM-TTS-THG）の両方をサポートしています。このプロジェクトでは、ユーザーがデジタルパーソンをカスタマイズすることができます。

1年前

062.7K

Ichigo (llama3-s): ローカルリアルタイム音声AIアシスタント、オープンソース版Siri

はじめに Ichigoはオープンソースのリアルタイム音声AIプロジェクトで、テキストベースの言語モデルをネイティブな「聞き取り」機能で拡張することを目的としています。このプロジェクトでは、MetaのChameleon論文にインスパイアされた初期のフュージョン技術を使用している。

1年前

062.6K

SFT-data-builder：利用免费大模型API生成AI训练数据，0成本大模型训练数据生成

SFT-data-builder：無料のビッグモデルAPIを使用してAIのトレーニングデータを生成。

包括的な紹介 SFT-data-builderは、無料のBig Model APIとユーザーのプライベートドメインデータを組み合わせて、高品質のSFTトレーニングデータを生成するために設計されたオープンソースプロジェクトです。このツールは、複数のAIモデル形式をサポートし、ワンクリック生成、バッチ生成、柔軟な編集、ローカル...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

056.6K