注目のAIツール一覧｜30ページ目

CrewAI：複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク

包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...

1年前

075.2K

CrewAI + Command-R7B 100行のコードでインテリジェントなニュース生成

CrewAIのマルチインテリジェンス・コラボレーションとCohere Command-R7Bビッグモデルに基づいて、システムは24時間ニュースルームを持つように、調査から執筆までの全プロセスを自動化することができる。

AIハンズオンチュートリアル

1年前

076.3K

Cohere AIがRerank 3.5を発表：関連知識ソート技術の新時代へ

概要情報爆発時代において、組織はコンテンツを見つけるためだけでなく、効率と生産性を向上させるためにも検索テクノロジーに頼るようになった。しかし、従来の検索モデルでは、ユーザーの意図を正しく理解できないことが多く、その結果、不正確で関連性のない、あるいは不完全な検索結果になってしまう。このような経験は、ユーザーをイライラさせるだけでなく...

AIニュース

1年前

048.5K

OpenAi 新プロジェクト、0ベースで研究知識ベースを構築！人工排除は当然の結論

誰でも0ベースからカスタマイズできる「研究知識ベースモデル」。人為的な顧客サービスのモデルアウトは当然の結論になった！ OpenaiがリリースしたProjectの特徴】 1.Projectへのファイルアップロードをサポートし、特定分野の知識ベースを構築する 2. 2.ネットワーキング検索をサポートし、リアルタイムで最新の...

AIニュース

1年前

043.8K

LightLLM：大規模言語モデルの推論と処理のための効率的な軽量フレームワーク

包括的な紹介 LightLLMはPythonベースのLarge Language Model (LLM)推論とサービスのフレームワークで、軽量設計、拡張の容易さ、効率的なパフォーマンスで知られています。このフレームワークは、FasterTransfor... を含む様々な有名なオープンソースの実装を活用しています。

最新のAIリソース # オープンソース大型モデルツールのローカル展開

1年前

064.1K

コマンドR7B：検索と推論の強化、多言語サポート、高速で効率的な生成AI

私たちのRファミリーの中で最小のモデルは、一般的なGPUやエッジデバイス上で強力なAIアプリケーションを構築するための一流のスピード、効率、品質を提供します。本日、エンタープライズ向けに特別に開発された大規模言語モデル（LLM）であるCommand R7Bをリリースできることを嬉しく思います。

AIニュース

1年前

045.5K

Artab：ブラウザで開いた新しいタブで世界の名画を表示、Chromeプラグイン

一般的な説明 Artabは、新しいタブを開くたびに世界の素晴らしい芸術作品を紹介するように設計されたブラウザ拡張機能です。この拡張機能はChrome、Edge、Firefoxブラウザで利用できます。Artabを使用すると、ユーザーはブラウズすることができます...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

059.2K

智谱发布的免费视觉模型GLM-4V-Flash并发数限制提升到10，这次生产环境够用了

スマートスペクトラムは、ビジョンモデルGLM-4V-Flashの同時実行数制限を10に引き上げ、本番環境向けに無償リリースしました。

GLM-4Vシリーズ GLM-4Vシリーズには、異なるアプリケーションシナリオに適した3つのモデルがあります。 GLM-4V-Plus：優れたマルチモーダル理解能力を持ち、最大5枚の画像を同時に処理でき、ビデオコンテンツの理解もサポートしているため、複雑なマルチメディア分析シナリオに適しています。 ...

AIニュース

1年前

076.3K

VideoFX（Veo2）：高い物理的状態の再現性とネイティブ4Kビデオ出力を備えたAI生成クリエイティブビデオ

概要 VideoFXは、クリエイティブで視覚的に美しいビデオコンテンツを簡単に作成できるように設計された、Google Labsの革新的なビデオ生成ツールです。このツールは、高度な Veo 2.0 テクノロジーを利用して、さまざまなクリエイティブな用途に適した幅広いビデオ効果と編集機能を提供します。

最新のAIリソース # AIテキストからビデオへ

1年前

063.8K

ImageFX：Google实验室推出的图像生成工具，提供独特的图像提示词聚合选项

ImageFX: Google Labsが提供する画像生成ツール。

はじめに ImageFXはGoogle Labsの強力な画像生成ツールです。簡単なテキスト入力で、アイデアを高品質な画像に変換することができます。このツールは、高度な人工知能技術を使用し、様々なスタイルやテーマでの画像生成をサポートします。

最新のAIリソース # AIオンライン画像生成

1年前

066.7K

ウィスク：複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します！

概要 WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマ、シーン、スタイルをミックスできるように設計されています。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用します...

最新のAIリソース # AIイメージスタイルコントロール

10ヶ月前

065.1K

グーグル、AIビデオ「Veo2」、AIマッピング「Imagen3」を発表

今年初め、グーグルは動画生成モデル「Veo」と最新の画像生成モデル「Imagen 3」を発表した。それ以来、これらのモデルを使って人々がアイデアを実現するのを見るのはエキサイティングなことである。

AIニュース

1年前

043.9K

シリコンクラウド、高速ビデオモデル「Mochi-1-Preview」を発表

先日、GenmoAIは高忠実度のアクションと堅牢なキューフォロー機能を備えたビデオ生成モデルmochi 1 preview (10B)をオープンソース化し、現在480p解像度のビデオ生成をサポートしている。本日、シリコンベースのフローであるSiliconCloudが、mochiの推論アクセラレーション・バージョンを公開した。

AIニュース

1年前

040.3K

国内パソコンへのコパイロットのインストール方法

Windows 11ユーザーの場合、梯子を掛けてもコパイロットボタンが国に表示されないので、多くのユーザーにとっては少し不便だ。しかし、この記事は、タスクバーにコパイロットを表示する便利な方法を介して達成することができ、その使用は正方形にすることができます...

AIアンサー

1年前

052.1K

这个AI设计软件厉害了，只要一张产品图就能生成专业的电商主图，爆款产品这不就来了嘛。

このAI設計ソフトウェアは素晴らしいです、限り、製品の画像は、プロの電子商取引のメイン画像を生成することができ、よく来ていない製品をポップアップ。

競争の激しい今日のeコマース市場において、いかにして商品を多くの選択肢の中から目立たせるかは、あらゆるブランドやビジネスが直面しなければならない課題となっている。 Eコマースを成功させる重要な要素の1つとして、ビジュアルマーケティングの重要性はいくら強調してもしすぎることはありません。魅力的でプロフェッショナルな商品イメージのディスプレイは...

AIニュース

10ヶ月前

045.1K

Difyが提供するAPIをOpenAIのインターフェイスと互換性のあるフォーマットに変換するにはどうすればよいですか？

Difyに取り組んだことのある人なら誰でも知っているはずだが、Difyは素晴らしいAIアプリだが、それが提供するAPIはOpen AIと互換性がない。この解決策は？

AIアンサー

1年前

074.3K

Leffa：高保真模特虚拟试穿与人物姿势调整，Meta开源的可控人物图像生成模型

Leffa：高忠実度モデルのバーチャル試着とキャラクターポーズ調整、メタ・オープンソース制御キャラクター画像生成モデル

包括的な紹介 Leffaは、制御可能なキャラクター画像を生成するための統一されたフレームワークであり、キャラクターの外見（バーチャルフィッティングなど）やポーズ（ポーズ転送など）の精密な操作を可能にする。このフレームワークは、ターゲットクエリをアテンション層の正しい参照キーにフォーカスさせることで、細かいディテールの歪みを大幅に低減する。

1年前

063.4K

MMAudio：ビデオ映像に同期した効果音やサウンドトラックを生成する、ビデオと音声のマルチモーダル共同トレーニングツール

一般的な紹介 MMAudioは、マルチモーダルな共同トレーニングによって高品質な同期音声を生成することを目的としたオープンソースプロジェクトである。香港中文大学のHo Kei Chengらによって開発されたこのプロジェクトの主な機能は、ビデオやテキスト入力に基づいて同期された音声を生成することである。

1年前

066.1K

H2O GPT: ネイティブAI対話および文書処理ツールの柔軟な構成

一般的な紹介 H2O GPTは、プライベート化されたチャットとドキュメント処理機能を提供することを目的としたオープンソースプロジェクトです。このプロジェクトはApache 2.0ライセンスに基づいており、LLaMa2、Mistral、Falconなどの様々なGPTモデルをサポートしています。...

1年前

052.1K

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル（LLM）の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...

1年前

061.4K

LocalGPT：ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。

1年前

060.7K

PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム

一般的な紹介 PrivateGPTは、インターネットに接続せずに大規模言語モデル（LLM）を使って文書をクイズすることを可能にする、本番環境で利用可能なAIプロジェクトです。このプロジェクトは、100%のデータプライバシーを保証し、すべてのデータはユーザの実行環境で処分されます...

1年前

057.8K

AutoGPT：ワークフロー自動化と自律的タスク実行のためのインテリジェントな身体構築プラットフォーム

包括的な紹介 AutoGPTは、継続的に稼働するAIエージェントの作成、導入、管理を支援し、複雑なワークフローを自動化するために設計された強力なプラットフォームです。Significant Gravitas社によって開発されたこのプラットフォームは、幅広いツールと機能を提供し、ユーザがAIエージェントに集中できるようにします。

1年前

059.1K

Vizcom：スケッチをリアルなレンダリングに変換するデザインツール

概論 Vizcomは、デザインやクリエイティブのプロフェッショナルのための革新的なツールです。AI技術により、ユーザーのスケッチをフォトリアリスティックなレンダリングや3Dモデルに素早く変換することで、デザイン効率を劇的に向上させます。ユーザーは、Vizcomのワークベンチ上でシームレスに共同作業を行うことができます。

最新のAIリソース # AI落書きジェネレーション絵画

1年前

082.2K

YOO履歴書：インテリジェントな履歴書生成ツール、大規模な工場の履歴書サンプルのオンライン生産、就職活動の成功率を高める。

概要 YOO履歴書は珠海碧宇科技有限公司によって開発されたインテリジェントな履歴書作成ツールです。新入生から経験豊富な求職者まで、YOOレジュメはパーソナライズされた履歴書テンプレートと...

最新のAIリソース # AI生活効率化アシスタント

1年前

050.5K

DragGAN: インタラクティブな画像編集ツール、ポイント＆クリックとドラッグ＆ドロップによる画像位置のコントロール

概要 DragGANは、Generative Adversarial Networks（GAN）をベースとしたインタラクティブな画像編集ツールである。Xingang PanらによってSIGGRAPH 2023で発表され、ポイント・アンド・クリックやドラッグ・アンド・ドロップの簡単な操作で直感的に操作できることを目的としている...

1年前

057.4K

リダ・ライティング：ワンクリックでエッセイを作成、無料でトピックを選んでエッセイのアウトラインを作成、エッセイを推敲、文献データを引用

総合紹介リダライティングは、学術論文執筆に特化したAIプラットフォームであり、ユーザーの論文執筆タスクを効率的に完了させることを目的としている。論文のタイトルを入力すると、ユーザーはワンクリックで最大50,000語の完全な論文コンテンツを生成することができます。このプラットフォームは、自由なトピックの選択、アイデアのアウトラインなど、様々な機能を提供しています。

最新のAIリソース # AIライティング #論文

1年前

056.3K

ピッチ：AI生成またはテンプレートを使用してオンラインでプロフェッショナルなPPTプレゼンテーションを作成する

概要 Pitchは、急成長するチームのために設計されたオンラインプレゼンテーション作成プラットフォームです。豊富なテンプレートと強力なコラボレーションツールで、プロフェッショナルなプレゼンテーションを簡単に作成できます。営業チーム、デザインチーム、マーケティングチームのいずれであっても、Pitch...

最新のAIリソース # AI生成プレゼンテーション/PPT

1年前

064.1K

Ajelix：智能化Excel数据分析工具，接入多种数据源，AI生成各类可视化分析图表

Ajelix：インテリジェントなExcelデータ分析ツール、様々なデータソースへのアクセス、様々なタイプの視覚的分析チャートを生成するAI

概要 Ajelixはデータ分析とビジネスインテリジェンスに特化したプラットフォームであり、ExcelとGoogle Sheetsの使用を簡素化し、強化するための様々なAIツールを提供している。このプラットフォームには、エクセルの数式ジェネレーターやデータ...

最新のAIリソース # AIデータ分析

1年前

067.7K

PDFgen：あらゆる種類のPDF契約書テンプレートを生成し、文書処理を簡素化するキー

概要 PDFgenは、簡単なテキストプロンプトからPDFテンプレートを生成することに特化した人工知能ベースのツールです。このプラットフォームの主な機能はPDF作成の自動化であり、特に文書を定期的に扱う企業や個人に適しています。PDFgenはREST APIを提供します。

最新のAIリソース # AIライティング

1年前

061.6K

Deepnote：専門的なデータ分析と科学チームのコラボレーションのためのAI搭載プラットフォーム

概要 Deepnoteは、データ分析およびデータサイエンスチームのために設計されたコラボレーションノートブックプラットフォームです。Python、SQL、ノーコード分析を組み合わせ、50以上のデータソースに接続することができます。DeepnoteはGPT-4を活用し、汎用的なデータ分析機能を提供します。

最新のAIリソース # AIデータ分析

1年前

062.1K

PDFGPT: PDF 文書の要約と Q&A 機能の提供

一般的な紹介 PDFGPTは、PDFファイルを処理するために設計された人工知能ベースのツールです。ユーザーはPDF文書をアップロードし、ツールを使って文書の要約を取得し、関連する質問に答えることができます。PDFGPTは、学生、研究者、ジャーナリスト、ビジネスプロフェッショナルのいずれにもご利用いただけます。

最新のAIリソース # AIテキストおよび音声/ビデオ要約ツール

1年前

056.9K

Qwen-Agent：基于Qwen的智能代理应用框架，包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。

1年前

075.1K

ICLR 惊现[10,10,10,10]满分论文，ControlNet作者新作——IC-Light V2适配Flux

ICLR驚きの[10,10,10,10,10]フルスコアペーパー、ControlNet著者の新作 - IC-Light V2のFluxへの適応

10点が4つ！平均点が4.76点しかないICLRでは珍しいことだが、これはかなりの打撃だ。査読者の度肝を抜いた論文は、コントロールネットの著者ルミン・ジャンによる新作「IC-Light」だ。

AIニュース

1年前

050.3K

ミニカバー：ブログ、ショートビデオ、ソーシャルメディアなどにパーソナライズされたカバーを作成するために設計されたオンラインカバーメーカー！

概要 Mini-Coverは、ブログやショートビデオ、ソーシャルメディアなどのプラットフォーム用にパーソナライズされたカバーを生成するために設計されたオープンソースのオンラインカバー生成ツールです。JLinMrによって開発されたこのツールは、シンプルで効率的なソリューションを提供し、ユーザーのニーズに合ったカバーを素早く生成することを目的としています。

1年前

058.3K

パレートの法則（80/20の法則）を手がかりとした効率的なコア知識の学習

スナックプロンプトのサイトでは、非常にシンプルでありながら、16Kビューに近いホットなプロンプトが、学習の重要な部分を見つけるために2の法則または8の法則を使用することを中心にしています。パレートの原理（パレート）は、20%の概念に注目することを提案している。

AIユーティリティ・コマンド

1年前

054.7K

免费领取：微软 Windows 云桌面电脑，配置 6 核 12G 内存（非VPS）

無料で入手: Microsoft WindowsクラウドデスクトップPC 6コア 12G RAM構成 (VPSではありません)

マイクロソフトのWindowsクラウドデスクトップは、6コア、12G RAM、回数無制限で構成されている。体験は非常にシルキーでスムーズで、ほとんど遅延はない。まずURLを入力： https://learn.microsoft.com/zh-cn/tra...

AIハンズオンチュートリアル

1年前

044K

2024 RAG目録、RAG応用戦略 100以上

2024年を振り返ると、大きなモデルは日々変化し、何百もの知的体が競争している。AI応用の重要な一翼を担うRAGもまた、「英雄と領主の集団」である。年初はModularRAGが熱を帯び続け、GraphRAGが話題を呼び、中旬にはオープンソースツールが本格化し、ナレッジグラフが...

AI知識ベース

1年前

053.6K

MarkItDown：Microsoftドキュメントインテリジェント変換ツール、様々なファイルをMarkdown形式に変換

一般的な紹介 MarkItDownはMicrosoftによって開発されたPythonツールで、様々なファイルやオフィス文書をMarkdown形式に変換するように設計されています。このツールは、PDF、PowerPoint、Word、Excel、ダイアグラム...など、幅広い種類のファイルをサポートしています。

1年前

064.6K

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア：クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス（CLI）で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。

1年前

061.5K

ZenUML: シンプルなテキストコードに基づくシーケンス図とフローチャートの作成

ZenUMLは、シーケンス図やフローチャートの作成に特化した、マルチプラットフォーム対応のダイアグラム・アズ・コード・ソリューションです。ブラウザ上でダイアグラムをリアルタイムにレンダリングすることで、サーバーサイドのインタラクションの遅延を回避し、非効率的なドラッグ＆ドロップ操作や読み込みの遅いアニメーションによってユーザーの思考プロセスが中断されることを防ぎます。

最新のAIリソースインフォグラフィック付き# AIホワイトボード

1年前

063.3K

Ilya Sutskever在NeurIPS炸裂宣判：预训练将结束，数据压榨到头了

イリヤ・スーツケバーがNeurIPSで憤慨し、こう宣言した。

推論は予測不可能だから、信じられないような予測不可能なAIシステムから始めなければならない。イリヤがついに登場し、さっそく驚くべきことを語ってくれた。今週金曜日、OpenAIの元チーフ・サイエンティストであるイリヤ・スーツケバーが、Global ...

AIニュース

1年前

062.2K

マイクロソフトの新モデル：ファイ-4が登場、大型モデルに匹敵する14Bのパラメータを持つ

わずか140億(14B)のパラメータを持つPhi-4は、革新的な学習方法と高品質なデータにより、いくつかの大規模モデルに匹敵する、あるいはそれを上回る性能を示している。本論文では、Phi-4のアーキテクチャ、特徴、学習方法、および、その実用的な応用例について詳述する。

AIニュース

1年前

047.5K

Best-of-N 越狱法：对输入内容进行简单的随机变形并反复尝试，就能让主流 AI 系统突破安全限制产生有害回应

Best-of-N脱獄：入力の単純なランダムモーフィングと、主流のAIシステムにセキュリティ制約を突破させて有害な反応を生成させる試みを繰り返す。

近年、生成AI（GAI）や大規模言語モデル（LLM）の急速な発展に伴い、その安全性や信頼性の問題が注目されている。最近の研究で、Best-of-N jailbreak（略してBoN）と呼ばれる手法が発見された...

AI知識ベース

1年前

045.2K

Swarms: マルチインテリジェンス・オーケストレーション・フレームワーク、エンタープライズ・プロダクション・ツール

概要 Swarmsは、効率的なエージェント管理とタスク処理によってビジネスの生産性を向上させるために設計された、エンタープライズグレードのプロダクション対応マルチエージェント・オーケストレーション・フレームワークです。複数のモデル、複数のメモリシステム、カスタムエージェントの作成をサポートするこのフレームワークは、モジュール設計と包括的なロギング機能を提供し、システム...

1年前

050.7K

レクセラのAIインテリジェンスがLangGraphで品質管理を推進する方法

RexeraがどのようにLangGraphに移行し、不動産ビジネスプロセスのための強力な品質管理インテリジェンスを作成し、大規模言語モデル（LLM）応答の精度を大幅に向上させたかをご覧ください。レクセラはAIを活用した自動化により、手作業に革命を起こしています。

AIニュース

1年前

050.2K

StableAnimator：キャラクターの特徴を維持した高品質のビデオアニメーションを生成します。

包括的な紹介 StableAnimatorは、参照画像と一連のポーズをもとに、後処理なしで高品質な映像を合成できる、革新的なエンドツーエンドの同一性保持映像拡散フレームワークである。このプロジェクトは復旦大学によって開発された。

最新のAIリソース # AI画像から動画へ

1年前

054.7K

忘れてください：あなたのコンピュータの未使用GPUグラフィックスパワーを共有し、お金を稼いで科学研究を支援しましょう！

包括的な紹介 Nevermindは、アイドル状態のグラフィックカードの演算能力を利用して科学計算を行い、収益を得るプラットフォームです。ユーザーは、自分のコンピュータのアイドル状態のGPUリソースを共有することで、科学研究と技術進歩をサポートし、同時に一定の金銭的見返りを得ることができます。このプラットフォームは、科学の進歩を促進し、科学研究の重要な問題を解決することを目的としています。

最新のAIリソース # AI副業お金儲けプロジェクト

1年前

092.3K

ソニック：音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作

概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。

1年前

073.1K

AI全栈利器开源！带你用Ollama+Qwen2.5-Code跑bolt.new，一键生成网站

オープンソースのAIフルスタックツール！Ollama+Qwen2.5-Codeのrunbolt.newで、ワンクリックでウェブサイトを生成！

Cursor、V0、Bolt.newから最近のWindsurfまで、AIプログラミング・ツールは最近とてもホットだ。この記事では、まずオープンソースのソリューションであるBolt.newについて話をしよう。Bolt.newは、製品発表からわずか4週間で400万ドルの収益を上げた。このサイトはどうしようもない状態...

AIハンズオンチュートリアル

1年前

044.7K

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

包括的な紹介 Ultravoxは、リアルタイム音声処理のために設計された革新的なマルチモーダル大規模言語モデル（LLM）です。従来の音声認識システムとは異なり、Ultravoxは音声認識（ASR）ステージを別途用意する必要がなく、音声を直接高次元空間に...

1年前

066.4K

infinite-zoom-stable-diffusion：生成无限缩放循环视频

infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。

包括的な紹介無限ズーム安定拡散（Infinite Zoom Stable Diffusion）は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...

1年前

059.8K

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...

1年前

0104.7K

ロールアップ長文ベクトルモデルチャンキング戦略コンペティション

ロングテキスト・ベクター・モデルは、10ページ分のテキストを1つのベクターにエンコードできる。多くの人はこう考える。必ずしもそうではない。直接使ってもいいのか？チャンクすべきか？最も効率的な分割方法は？この記事では、長文ベクトルモデルの様々なチャンキング戦略について徹底的に議論し、その結果を分析します。

AI知識ベース

1年前

042.7K

Research Rabbit：使用本地LLM进行网页研究和报告撰写，自动深入用户指定主题并生成总结。

リサーチラビット：ネイティブのLLMを使用し、ユーザーが指定したトピックに自動的にドリルダウンし、サマリーを生成するWebリサーチとレポート作成。

はじめに Research Rabbitは、LLM（Large Language Model）ベースのウェブリサーチおよび要約アシスタントです。ユーザがリサーチトピックを提供すると、Research Rabbitは検索クエリを生成し、関連するウェブ結果を取得し、これらの結果を要約します...

1年前

069.9K

返信gAI：ライターのツイートを自動収集し、あらゆるXユーザーの文体を模倣する

一般的な紹介返信 gAIはLangChainベースのAIツールで、X（旧Twitter）ユーザーのAIクローンを作成するように設計されています。このツールは、ユーザーのツイートを自動的に収集し、長期的なメモリに保存し、インクリメントの検索を使用することによってこれを行います...

最新のAIリソース # AIロールプレイ

1年前

048.7K

ChatGPT-Canvasは、私たちの学術論文のアシストレビューと自動修正を行います。

前回のアップデートは、ChatGPTのキャンバスの新機能についての説明でした。しかし、Canvasの様々な機能を簡単に説明しただけで、Canvasのアカデミックな応用の詳細については説明しませんでした。そこで、今回はCanvasのアカデミックな応用についてゆっくり説明します。

AIハンズオンチュートリアル

1年前

060K

Lipdub: ビデオを翻訳し、言語の壁を取り除き、多言語字幕とリップシンクをサポートします。

概要 Lipdubは革新的なAI動画翻訳アプリで、ユーザーが動画コンテンツを多言語に翻訳し、リップシンクできるように設計されています。Lipdubを使用すると、ユーザーは簡単にビデオを録画し、リアルタイムで27の異なる言語に翻訳することができます。このアプリのリ...

最新のAIリソース # AI翻訳 #ポート同期

1年前

058.3K

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース（GUI）を提供します。

1年前

052.9K

OpenAI-o1有多厉害？深度优化论文，提升论文写作质量！30个极品提示词分享

OpenAI-o1の実力は？論文執筆の質を向上させるために論文を深く最適化する！ 30の秀逸なプロンプトワードを共有する！

UCIの物理学博士がo1をテストしたところ、彼が1年かけて完成させた博士論文のコードが、AIによって1時間足らずで実装されることがわかった。o1のモデルは、博士論文のコードを修正するのに十分な強度をすでに持っている！これはまた、学術論文の書き方に革命を起こすことを意味する。プロンプトの言葉を注意深く構成することによって...

AIユーティリティ・コマンド

1年前

052.5K

論文の初稿を3時間で仕上げる！ ChatGPT 学位論文執筆の全過程を網羅（プロンプト・ワードテンプレート付き）

特に、圧倒的な情報量、細かなディテール、延々と続く書き直しに直面すると、論文の執筆は困難な挑戦になりがちです。この記事では、ChatGPTを使って学術論文の初稿を仕上げるまでの全プロセス（トピックの選択から文献レビュー、論文全体まで）をご紹介します...

AIユーティリティ・コマンド

1年前

057.8K

スタンフォード大学のオープンソースChatGPTエッセイ作文プロンプト

学術論文では、研究成果を伝えるために、明確で簡潔かつ説得力のある表現が不可欠です。しかし、英語を母国語としない研究者の多くは、学術論文を書いたり推敲したりする際に言葉の壁に直面する。この問題に対処するため、スタンフォード大学は、オープンソースプロジェクトを通じて、一連の効率的な論文タッチアップメンテーションを共有した...

AIユーティリティ・コマンド

1年前

053.7K

LLMキューを効果的にテストする方法 - 理論から実践まで完全ガイド

I. プロンプトのテストの根本的な原因：LLMはプロンプトに対して非常に敏感であり、微妙な言い回しの変更によって出力が大きく異なる可能性があるテストされていないプロンプトは次のようなものを生み出す可能性がある。

AI知識ベース

1年前

045.8K

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

HelloMeme：ローカルの忠実度の高い表現アクション一貫性のある画像やビデオを生成、Runway Act oneオープンソースピンポン！

包括的な紹介 HelloMemeはHelloVisionによって開発されたオープンソースプロジェクトであり、空間編み目アテンションを統合することによって、拡散モデルに高レベルで忠実なストリップを埋め込むことを目的としている。

1年前

058.2K

キューワードは、ビデオオプショットの生成を正確に制御するためにタイムスタンプを追加します。

ヘイローAIのビデオを例に、キューを書く： 00:00 猫の目、ズームイン 00:02 グレイのタビーの猫、ズームアウト 00:04 森の中の大きな木の下で草の上に横たわるグレイのタビーの猫長くて6秒のビデオなので、最後のショットに2秒残す...

AIユーティリティ・コマンド

1年前

053.9K

CYAN.AI（青色木偶科技）：动作生成大模型，实现2D视频生成3D动作数据的AI平台

CYAN.AI (Cyan Puppet Technology): アクション生成大規模モデル、2D映像から3Dアクションデータを生成するAIプラットフォーム

概論 Cyanpuppets Technologies（Cyanpuppets）は、畳み込みニューラルネットワーク（CNN）とディープ・ニューラル・ネットワーク（DNN）アルゴリズムにより、2D動画から3Dアクションデータを生成することに特化したAI技術のリーディングカンパニーである。同社の主力製品であるCYAN.AIプラットフォームは、高解像度の3Dアクションデータを生成することができる。

最新のAIリソース # AI画像生成エイド

1年前

070.3K

QuickMagic：AIモーションキャプチャー技術で高画質なアニメーション動画を簡単作成

概要 QuickMagic AIは、シンプルなビデオを高品質な3Dアニメーションに変換するために設計された、高度なAI駆動型モーションキャプチャツールです。アニメーター、ゲーム開発者、デジタルコンテンツ制作者など、QuickMagic AIは高速かつ正確なモーションキャプチャーを実現します。

最新のAIリソース # AI画像生成エイド # AI動画変換スタイル

1年前

088.4K

Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。

概要 Chunkrは、PDF、PPTX、DOCX、ExcelファイルをRAG（Retrieval Augmented Generation）やLLM（Large Language Modelling）で使用するのに適したデータに変換するためのセルフホストAPIです。このプロジェクトはLumina...によって開発されました。

1年前

055.2K

カード絵のプロンプトワード：誠実さを表現するワークウィークの絵を生成する

;; ━━━━━━━━━━━━━━ ;; 作者: 李继刚 ;; 版本: 0.1 ;; 模型: Claude Sonnet ;; 用途: 将真心话转化为周报 ;; ━━━━━━━━━━━━━━ ;; 设...

AIユーティリティ・コマンド

1年前

045.3K

ChatMCP: MCPプロトコルを実装し、複数のLLMモデルをサポートするAIチャットクライアント

ChatMCPの概要 ChatMCPはModel Context Protocol (MCP)を実装するために設計されたオープンソースのAIチャットクライアントです。GitHubユーザーのdaodao97によって開発されたこのプロジェクトは、O...のような様々な大規模言語モデル（LLM）をサポートしています。

最新のAIリソース # AI統合マルチモデル対話プラットフォーム

1年前

074.7K

Zoo: テキストから3Dモデリングが可能なハードウェア設計用CADソフトウェア

概論 Zooは最新のハードウェア設計のために構築されたCADソフトウェアプラットフォームです。Zooの主な機能には、Text-to-CADインターフェース、モデリングアプリケーション、差分ビューアーなどがあります。

最新のAIリソース # AIテキストとイメージを3Dへ

1年前

081.3K

Conch AI VideoはComfyUIノードにどのように統合されていますか？

Conch AI (MiniMax)のビデオ生成を画像領域でより良く使用するために、ComfyUIノードを保守しています。 ComfyUI MiniMax Videoは、MiniMax AIを統合した強力な拡張機能です。

AIアンサー

1年前

060.2K

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。

1年前

081.7K

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル（LLM）を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

062.9K

AI搜索工具PK，三大知识搜索神器谁最强？Perplexity、秘塔、Felo深度对比

AI検索ツールPK、知識検索の神3強は？「パープレキシティ」「シークレットタワー」「Felo」を徹底比較

まだ百度で情報検索しているの？効率が悪すぎる！情報爆発時代、必要な情報を正確に入手することは、希少な能力となっています。検索能力を向上させる第一歩は、検索エンジンを変えることです！従来の検索エンジンは、広告や複雑な情報が多いだけでなく、効率が悪く、検索結果の判断が難しい。

AIニュース

1年前

056.2K

Sourcery：AIコードレビューでコード品質と技術的負債管理を自動改善

概要 SourceryはAIベースのコードレビューツールで、開発者が自動的にコード品質を改善し、開発生産性を向上させるように設計されている。GitHubとGitLabのリポジトリに統合され、すべてのプルリクエストを即座にレビューし、人間のようなサロゲートを提供することができます...

最新のAIリソース # AIプログラミング

1年前

060.1K

Codiga: IDE内のコード問題をリアルタイムで検出し、コード品質とセキュリティを向上させるための修正案を提供する。

概要 Codigaは、開発者がコードを書きながらリアルタイムで潜在的な問題を検出し、修正できるように設計された強力な静的コード解析ツールです。このプラットフォームは、複数のプログラミング言語と、VS Code、JetBrains、Visu...などの統合開発環境（IDE）をサポートしています。

最新のAIリソース # AIプログラミング

1年前

061.2K

世界中のプログラマーが使っている2024年のベストAIコーディングアシスタントツール17選

まえがき「良い仕事のための良い道具は、良い仕事のための良い道具である」ということわざがあるように、プログラマーにとって良い道具を選ぶことは特に重要である。良いツールを選ぶことは、プログラマーにとって特に重要である。コードの自動化であれデバッグであれ、AIコーディング・アシスタントはあなたの時間を節約し、コードの質を向上させることができる。この記事では、世界中のプログラマーが最も頻繁に使用しているものをいくつか紹介する...

AIニュース

1年前

060.9K

Project Mariner：浏览器自动化，探索未来人机交互的研究原型（未发布）

プロジェクト・マリナー：ブラウザ・オートメーション、ヒューマン・コンピュータ・インタラクションの未来を探る研究プロトタイプ（未発表）

概論 Project Marinerは、人間とコンピュータのインタラクションの未来を探るためにGoogle DeepMindが立ち上げた研究プロトタイプである。このプロジェクトは、Gemini 2.0の強力なマルチモーダル理解および推論機能を活用し、ブラウザの自己...

最新のAIリソース # デスクトップ・オートメーション・インテリジェンス

1年前

055.1K

Devin、自律型AIプログラミング・アシスタントを使ってオープンソース・コミュニティ向けに問題のあるコードを修正

Devinの正式ローンチの一環として、Devinチームプランの500ACUを、選ばれたオープンソースプロジェクトメンテナに無料で提供します。今すぐapp.devin.aiにアクセスして登録し、osi@cogniti...

AIニュース

1年前

048K

ジェミニ2.0リリース：インテリジェンティアの時代のために作られた新しいAIモデル

グーグルおよびアルファベットCEO、スンダル・ピチャイより：情報は人類の進歩の中心にあります。だからこそ私たちは26年間、世界中の情報を整理し、アクセスしやすく便利なものにすることに取り組んできました。それはまた、私が...

AIニュース

1年前

055.3K

Jules：实验性AI代码助手，可自动执行Python和JavaScript编码任务，例如GitHub工作流中的错误修复。

Jules：GitHubワークフローのバグ修正など、PythonやJavaScriptのコーディング作業を自動化する実験的なAIコードアシスタント。

概要 JulesはGoogle LabsのAIコードアシスタントで、開発者のプログラミング効率向上を支援するために設計されている。最新のGemini 2.0フラッシュモデルを統合し、開発者にインテリジェントなコード提案とGithub上での自動化を提供することができます...

最新のAIリソース # AIプログラミング

1年前

064.8K

ZoSugar: オンライン写真加工ツール、ワンクリックキーイング、透かし除去、写真修復、ポートレート編集

総合紹介 ZuoSugar（PicWish）は、豊富なオンライン写真編集ツールを提供し、すべてのプラットフォームの使用をサポートするインテリジェントなAI画像処理プラットフォームです。ユーザーは簡単にワンクリックでキーイング、透かし除去、ぼやけた写真を鮮明に、ロスレスズーム、画像トリミング、画像圧縮、白黒写真を完成できます。

1年前

064.7K

NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。

包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。

1年前

076.1K

Wasitai：画像がAIによって生成されたかどうかをチェックするシンプルなツール。

はじめに Wasitaiは、AIによって生成された画像かどうかを簡単に検出できる強力で便利なツールです。画像生成分野におけるAIの進歩に伴い、テキストやスケッチ、その他の画像からリアルで高品質な画像を生成するためのツールやプラットフォームが数多く提供されている。しかし、すべての...

最新のAIリソース # AI画像生成エイド # AIオープンサービス

1年前

083.1K

ソングライターPPT：数秒でPPTに任意のドキュメント、永久無料PPTインテリジェント生成ツール

一般的な紹介シンガーPPTは、永久に無料のPPTスマートジェネレータツールです。ユーザーは簡単にPPTに任意のトピックや材料を変換し、美しいテンプレートやカスタマイズされたテンプレートの多くを適用することを選択することができます。ウェブサイトだけでなく、便利な操作体験を提供するだけでなく、ユーザーを介してPPTプログラムを共有する...

最新のAIリソース # AI生成プレゼンテーション/PPT

1年前

053.4K

ChatFree（ChatAnywhere-2）：使用GPT API创建的本地Copilot，支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。

概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...

1年前

071.5K

Tafi：カスタム3Dキャラクターを最速で作成、AIキャラクター生成（ベータ版）

概要 Tafiは、AI技術により3Dキャラクターの作成プロセスを簡素化することに特化した、世界をリードする3Dコンテンツ作成プラットフォームです。プロのアーティストもホビーユーザーも、Tafiを使って簡単に高品質な3Dキャラクターを作成することができます。このプラットフォームでは、数百万もの高解像度...

最新のAIリソース # AIテキストとイメージを3Dへ

1年前

057.8K

Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール

概要 Sketch-Genは、アーティストやデザイナーが高品質な線画やスケッチを素早く生成できるように設計された、AI技術ベースの線画・スケッチ生成ツールです。Paints-UNDOプロジェクトから生まれたこのツールは、高度な機械学習モデルを使用しています。

1年前

063.6K

AIフィッティングの精神、ワンクリックでどんなキャラクターもドレスアップ可能

AIフィッティングが可能なモデルやツールの多くは、充電が必要であったり、エクストラネット上で魔法を使用する必要があったり、ローカルに配備する必要があったりすると書いたが、最もシンプルで簡単に使用できたり、陵がAIフィッティング機能をリリースした。その1.5モデルの新しいアップグレードの発表後、レーサーの下でケリンAIプラットフォームは、リリースしました...

AIハンズオンチュートリアル

1年前

054.9K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: PydanticでジェネレーティブAIアプリを作れば、本番レベルのAIアプリが簡単に作れる

概論 PydanticAIはPydanticベースのPythonエージェントフレームワークで、生成AIアプリケーションの開発を簡素化するために設計されています。Pydanticチームによって開発され、幅広いモデル（OpenAI、Gemini、Groqなど）と...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

058.8K

Steel Browser：自动化网页浏览器API，构建控制浏览器操作的智能体与应用

Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI

概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

078.2K

クロード3.5ソネットでAIスタートアップのトレンド分析エージェントを構築

Pythonコード50行未満でフル機能のAIエージェントアプリを（ステップバイステップガイド）AIツールは、起業家がトレンドを特定し、意思決定を行う方法を変えているが、スタートアップの機会を分析するためのスケーラブルなソリューションを構築するには、多くの場合、複数のデータソースを統合し、それらを迅速に処理する必要がある。しかし...

AIハンズオンチュートリアル

1年前

059.3K

Dia Browser：提供智能浏览体验，集成AI工具，在浏览器中自动化处理任务（未上线）

Dia Browser: ブラウザのタスクを自動化する統合AIツールにより、インテリジェントなブラウジング体験を提供（未公開）

概要 Dia Browserは、The Browser Companyが開発した新しいスマートブラウザで、高度なAIツールを統合することで、より効率的なブラウジング体験をユーザーに提供することを目的としている。このブラウザは2025年初頭に正式リリースされる予定で、主な機能は...

最新のAIリソース # デスクトップ・オートメーション・インテリジェンス

1年前

060.3K

カーソルとウィンドサーフを1時間で月500ドル相当のデビンに変える！

前回の記事では、完全自動プログラミングを可能にするエージェント型AI、Devinについて説明した。CursorやWindsurfといった他のエージェント型AIツールに比べ、Devinはプロセス・プランニングや自己進化に優れている。

AIハンズオンチュートリアル

1年前

049.5K

E2M: 複数のファイル形式をMarkdownに変換し、簡単に統一されたドキュメントフォーマットを実現する

概要 E2M (Everything to Markdown)は、様々なファイルフォーマットをMarkdownフォーマットに変換するために設計されたオープンソースのPythonライブラリです。このツールは、doc、docx、epub、html、htm、u...などのフォーマットをサポートしています。

1年前

061.4K

cursor-vip：一、二折价格，自动化授权使用 CURSOR Pro（共享账号额度谨慎付费）

cursor-vip：10％または20％の割引価格、CURSOR Proを使用するための自動ライセンス（共有アカウントクレジットに注意してお支払いください。）

概要 cursor-vipはスマートコードエディターCURSORのために設計されたツールサービスで、ユーザーはアカウントにログインすることなくVIPスマートチップ機能を楽しむことができます。このツールはMacOS、Linux、Windowsシステムに対応しています。

最新のAIリソース # AIオープンサービス

1年前

0101.7K

ハイブリッドVincennesビデオ：高品質のビデオのリアルな映像を生成し、テンセントは、大規模なモデルのオープンソースのビデオ生成

総合紹介テンセント混元テキスト生成動画（Yuanbao APPで利用可能）は、テンセントが開始したAI技術に基づく動画生成プラットフォームです。このプラットフォームは、強力な分野横断的知識と自然言語理解力を備えた騰訊混合元ビッグモデルを活用し、ユーザーのテキスト記述に基づいて高品質の動画を生成する。

1年前

071.4K

OpenAIが "小中学校教員向けChatGPT無料講座 "を公開

2024年11月20日、OpenAIはK-12の教師がChatGPTを授業に導入するための無料オンラインコースを開始した。このコースはChatGPT Founda...

AIニュース

1年前

053.4K

AIツールが見つからない？こちらをお試しください！