AIシェアリングサークル

ポーンをアーチにしてキングをシェアするデイ!
Google Vids:从提示指令和文档开始创作营销讲解视频

Google Vids:プロンプトの指示と文書から始めるマーケティング説明ビデオの作成

はじめに Google Vidsは、Google Workspaceスイートに含まれるAIを活用した動画作成ツールで、ユーザーが仕事関連の動画コンテンツを簡単に作成・共有できるように設計されています。簡単なプロンプトとクリップの統合により、ユーザーはストーリーを作成できます...
1年前
060.1K
TableGPT2:表格数据集成的多模态模型

TableGPT2: 表形式データ統合のためのマルチモーダルモデル

包括的な紹介 TableGPT2は浙江大学のチームによって開発されたマルチモーダルモデルで、表形式データの統合と処理に焦点を当てている。このモデルは、強力な汎用言語とコーディング能力を維持しながら、表データ関連のタスクで優れた性能を発揮できるよう、事前に訓練され、微調整されている。
1年前
054.7K
Context:无缝集成各类数据源源,多角色Agent自动化完成不同工作场景内容

コンテキスト: さまざまなデータソースのシームレスな統合、さまざまな作業シナリオを完了するためのマルチロールエージェントの自動化 コンテンツ

概要 Context Autopilotは、高度な統合とオフィスの自動化を通じてチームの生産性を向上させるために設計された、ContextのインテリジェントなAI生産性ツールです。このツールは、世界初のコンテキストエンジンContext-1...
1年前
054.7K
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。

近日公開予定のクリング1.5:「カスタムモデル」は、独自のビデオ映像でキャラクターをトレーニングします。

従来の動画生成の常識を覆す Kling AIの「カスタムモデル」機能では、ユーザーは10~30本の動画(それぞれ10秒以上の長さ)をアップロードすることで、キャラクターのトレーニングを行うことができる。このプロセスは、従来の画像トレーニングモデルとは大きく異なり、Kling AIはビデオ映像をキャラクター...
1年前
055.5K
EyeLevel(GroundX):多模态企业文档数据处理平台,从RAG源头消除LLMs幻觉

EyeLevel(GroundX):RAGソースからLLMの幻想を排除するマルチモーダル企業文書データ処理プラットフォーム

総合紹介 EyeLevelは、複雑な企業コンテンツを大規模言語モデリング(LLM)処理に適したデータに変換することで、データの錯覚を防ぐことに注力しています。独自のデータ変換エンジンとマルチモーダル処理技術により、EyeLevelは複雑な表やグラフを変換することができます。
1年前
056.1K
WebSpy:网站SEO指标分析和测试网站请求,优化网站性能

WebSpy:ウェブサイトのSEO指標で、ウェブサイトのリクエストを分析、テストし、ウェブサイトのパフォーマンスを最適化します。

一般的な紹介 WebSpyは、開発者やテスターのために設計された強力なWebサイト分析とテストツールです。複数のリクエストタイプ(GET、POST、PUT、PATCH、DE...など)をサポートし、ウェブサイトのHTTPリクエストとレスポンスを監視、編集することができます。
1年前
052.2K
fal:为开发者提供富媒体类生成式大模型API服务

fal: リッチメディアクラス開発者のためのジェネレーティブ・マクロモデリングAPI

一般的な紹介 falは、画像、ビデオ、音声を含む高品質な生成メディアモデルを用いてリアルタイムAIアプリケーションを構築するためのオンラインAI推論プラットフォームです。コールドスタート不要、従量課金制です。falは、Stable Dif...
1年前
075.3K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat:カスタムイメージとトーンクローニングによるリアルタイムの音声対話型デジタルパーソンは、エンドツーエンドの音声ソリューションとカスケードソリューションをサポートします。

概要 VideoChatは、オープンソース技術に基づくリアルタイム音声対話デジタルパーソンプロジェクトで、エンドツーエンドの音声スキーム(GLM-4-Voice - THG)とカスケードスキーム(ASR-LLM-TTS-THG)の両方をサポートしています。このプロジェクトでは、ユーザーがデジタルパーソンをカスタマイズすることができます。
1年前
062.7K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): ローカルリアルタイム音声AIアシスタント、オープンソース版Siri

はじめに Ichigoはオープンソースのリアルタイム音声AIプロジェクトで、テキストベースの言語モデルをネイティブな「聞き取り」機能で拡張することを目的としています。このプロジェクトでは、MetaのChameleon論文にインスパイアされた初期のフュージョン技術を使用している。
1年前
062.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder:無料のビッグモデルAPIを使用してAIのトレーニングデータを生成。

包括的な紹介 SFT-data-builderは、無料のBig Model APIとユーザーのプライベートドメインデータを組み合わせて、高品質のSFTトレーニングデータを生成するために設計されたオープンソースプロジェクトです。このツールは、複数のAIモデル形式をサポートし、ワンクリック生成、バッチ生成、柔軟な編集、ローカル...
1年前
056.6K