AIニュース

合計526記事
微软“画图”应用也将加入“Copilot”按钮,Windows Insider 测试用户可抢先体验

マイクロソフトの "ペイント "アプリには "Copilot "ボタンも追加され、Windows Insiderテスターはその一部を覗くことができる!

Windows Insiderのユーザーは、まもなく別の新しいアプリでCopilotアイコンを目にすることになる。新しくロールアウトされたアップデートのおかげで、CanaryチャンネルとDevチャンネルのInsiderテストユーザーには、AIが動作するこの新しいボタンが表示されます...
6ヶ月前
01.1K
研究表明:RL 在学习可泛化知识方面优于 SFT,尤其在多模态任务中展现出更强的推理与视觉识别能力

RLは、特にマルチモーダル課題において、汎化可能な知識の学習においてSFTを上回り、より強力な推論能力と視覚認識能力を示すことが示された。

简介 在人工智能领域,基础模型(如大型语言模型和视觉语言模型)已经成为推动技术进步的核心力量。然而,如何有效地提升这些模型的泛化能力,使其能够适应各种复杂多变的现实场景,仍然是一个重大挑战。当前,监督...
6ヶ月前
01.3K
TokenVerse:谷歌开源了多图风格混合创意工具 Whisk

TokenVerse: Google、複数の画像スタイルをミックスするクリエイティブツール「Whisk」をオープンソース化

1.はじめに:画像生成の新時代 今日のデジタル時代において、画像生成技術は目覚ましい進歩を遂げている。あなたがデザイナーであれ、アーティストであれ、パーソナライズされたコンテンツを作りたい一般人であれ、画像生成ツールはあなたのアイデアに命を吹き込む手助けをしてくれる。しかし、従来の画像...
7ヶ月前
01.3K
Text2Edit:文本驱动视频广告创作的原生多模态模型(未发布)

Text2Edit:テキスト駆動型動画広告作成のためのネイティブ・マルチモーダルモデル(未発表)

概要 Text2Editは、GitHubでホストされているオープンソースプロジェクトで、効率的なテキスト編集と広告生成機能を提供することを目指しています。このプロジェクトの主な目的は、使いやすいインターフェースと強力な広告生成機能によって、ユーザーがテキストコンテンツを素早く処理し、高品質の広告を生成できるようにすることです。
7ヶ月前
01.5K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
7ヶ月前
02K
推荐免费且不限次数使用的 AI 工具

無料で使い放題のおすすめAIツール

今天给大家带来一份独家福利 ---- 精心筛选的免费 AI 工具大合集! 这些工具不仅免费,而且不限使用次数,能帮你轻松搞定写作、绘画、视频、PPT&图表制作等各种创作需求。无论你是学生、职场...
7ヶ月前
01.4K
快刀青衣:2025年一定要上手的10个AI工具

ファストダガー・グリーン:2025年に手に入れるべき10のAIツール

01Gammaタスクシナリオ:素早くPPTを作成する。 適用される人々:第三者の広告代理店、個人のコンサルタント、企業の社内トレーナー、および多くのPPTを作成する必要がある他の人々。 推奨理由:生成されたPPTページは見栄えが良く、デザインセンスがある。修正が簡単で、複数のバージョンをエクスポートする必要がなく、リンクが...
7ヶ月前
02.1K