AIシェアリングサークル

最新のAI製品、プロジェクト、フレームワーク、論文解釈などを毎日共有〜。
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - AI音声合成とサウンドクローニングツール

Fish Audioは、テキスト音声合成(TTS)と音声クローンをサポートする強力な生成AI音声合成ツールです。ユーザーはテキストを入力するだけで、自然で滑らかな音声に変換することができ、プラットフォームはさまざまな言語と音声スタイルを提供し、さまざまなシナリオやユーザー...
2ヶ月前
02.8K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - Google DeepMindの手話翻訳モデル

SignGemmaは、Google DeepMindが提供する世界で最も強力な手話通訳AIモデルであり、アメリカ手話(ASL)の英語テキストへの正確な翻訳をサポートする。このモデルはマルチモーダルトレーニングに基づいており、視覚データとテキストデータを組み合わせることで、手話の動作をリアルタイムで捉え、素早くテキストに翻訳する。
2ヶ月前
03.6K
FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - ブラックフォレストの画像生成・編集モデル

FLUX.1 Kontextは、Black Forest Labs社の画像生成・編集モデルで、コンテキストを意識した画像処理技術を提供する。このモデルは、テキストや画像の合図に対する反応を理解し、オブジェクトの修正、スタイルの変換、背景の置換などのタスクを実行しながら、コーナー...
2ヶ月前
03.2K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - Ali Tongyi オープンソース自律検索AIエージェント

WebAgentは、Alibaba Tongyi Labsが開発したオープンソースの自律型検索AIエージェントで、強力なエンドツーエンドの自律型情報検索と多段階の推論機能を備えています。WebAgentは、人間のようにネットワーク環境を能動的に認識、判断、行動することができ、学術研究やビジネスの意思決定に広く利用されています。
2ヶ月前
03.1K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

リンコードIDE - 同義リンコード、AIネイティブ開発環境ツールを発表

Spirit Code IDEは、同義Spirit Codeが発売したAIネイティブ統合開発環境(IDE)で、千題の3大モデルに深く適応し、強力なプログラミング知能体モードを持っており、プロジェクトの認識、コードの検索、端末操作の実行などのタスクを自律的に完了することをサポートします。MCPツールをサポートし、Magic Hitch MCP Squareの3...
2ヶ月前
02.9K
BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL - Wordpressがオープンソースのマルチモーダルベースモデルを発表

BAGELは、ByteDanceによってオープンソース化されたマルチモーダルベースモデルで、140億のパラメータを持ち、そのうち70億がアクティブである。このモデルベースとMixed Transformer Expert Architecture (MoT)は、それぞれ独立した2つのエンコーダで画像のピクセルレベルとセマンティックレベルの特徴をキャプチャし、画像、テキスト、ビデオの効率的な処理をサポートします。
2ヶ月前
03K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
2ヶ月前
03.4K
幻舟AI - 一站式AI短片创作平台,批量生成各类型视频内容

Phantom Boat AI - ワンストップのAIショートフィルム制作プラットフォーム、様々なタイプの映像コンテンツを一括生成

Phantom Boat AIは、CM、プロモ、アニメーションなど、様々なタイプの映像コンテンツの効率的な一括生成をサポートする、ワンストップの強力なAIショートフィルム作成プラットフォームです。Midjourney、Runwayをはじめとする世界最先端のAIモデルをベースとしたこのプラットフォームは、脚本作成から...
2ヶ月前
02.5K
Circuit Tracer - Anthropic开源的模型内部工作机制可视化工具

Circuit Tracer - モデルの内部構造を視覚化するAnthropicのオープンソースツール

Circuit Tracerは、大規模な言語モデルの内部動作を研究するためのAnthropic社のオープンソースツールです。帰属グラフ(attribution graph)の生成に基づいて、モデルが特定の出力を生成する際に経る内部ステップを明らかにする...
2ヶ月前
03.3K
Google AI Edge Gallery - 谷歌推出的AI应用,支持手机运行AI模型

Google AI Edge Gallery - グーグル、AIモデル搭載の携帯電話をサポートするAIアプリを発表

Google AI Edge Galleryは、機械学習(ML)とジェネレーティブ人工知能(GenAI)モデルをネイティブデバイス上で体験・利用できる、グーグルの実験的AIアプリです。このアプリはAndroid端末に対応しています。
3ヶ月前
03.3K