AIニュース

合計526記事
豆包端到端实时语音大模型上线!智商情商双在线,中文语音对话断崖式领先

Beanbag エンド・ツー・エンドのリアルタイム音声グランドモデルがオンラインに!IQとEQがオンラインになり、中国語の音声対話が崖っぷちに立たされている!

今日、Beanbag APPは、新しいエンドツーエンドのリアルタイム音声通話機能が正式にオンラインであることを発表した "プレリリース "を再生することなく、直接、すべてのユーザーのテストを満たすために、使用するために誰もが無料で、フルボリュームに開きます。 Beanbagリアルタイム音声ビッグモデルウェブサイト:https://team.doubao.com...
1年前
054.9K
亚马逊 All in AI Agent:AWS 的下一个增长点?

Amazon All in AI Agent:AWSの次の成長分野?

最近、アマゾンはAI分野で多くの動きを見せている。消費者向け音声アシスタント「アレクサ」のアップグレードだけでなく、AWS内にAIエージェントに特化した新チームを立ち上げた。この一連の動きは、アマゾンがAIエージェントの分野を積極的に敷いていることを示している。
12ヶ月前
054.9K
对标 Cursor 的 AI编辑器 Trae 上手体验

CursorをベンチマークするAIエディターTraeのハンズオン

中国のディープカスタマイゼーション Traeは、インターフェイスやインタラクション、またはコンテンツであるかどうか、多くのディープカスタマイゼーションのための中国の環境に基づいており、完全に中国の文化です。VScodeまたはCursorのインポート設定から直接使用し、難なく始めることができます。
9ヶ月前
054.4K
ARC-AGI-2 成绩揭晓:全部 AI 模型推理能力遭遇滑铁卢

ARC-AGI-2の結果が明らかに:すべてのAIモデルの推論能力がウォータールーに適合

汎用人工知能(AGI)の進歩を測るベンチマークは非常に重要である。効果的なベンチマークは能力を明らかにし、優れたベンチマークは研究の方向性を鼓舞する。アーク賞財団は、ARC-AGIシリーズのベンチマークを通じてそのような役割を果たすことを約束し、研究努力を真の...
11ヶ月前
054.3K
Google iOS 版本 App 不再支持 Gemini,用户得下载独立 App

GoogleのiOS版アプリはGeminiをサポートしていないため、ユーザーはスタンドアロンのアプリをダウンロードする必要がある。

アップルの携帯電話のグーグル・アプリにはジェミニ機能が搭載されなくなり、ジェミニを使いたい人は別のアプリをダウンロードしなければならなくなった。 最近、グーグルは、iOS版のグーグルアプリにジェミニ機能を追加すると発表した。
1年前
054.1K
FLUX.1 官方发布的图像编辑套件,覆盖:修复、扩展、提取深度图、提取Canny、混合图像风格

FLUX.1 正式リリースされた画像編集スイート:修復、拡張、デプスマップ抽出、キャニー抽出、ミックスイメージスタイル

本日、FLUX.1 Toolsをリリースいたします。FLUX.1 Toolsは、FLUX.1の基本的なテキスト生成画像モデルに制御性と操作性を追加し、実画像や生成画像の修正や再作成をサポートするために設計されたモデルスイートです。リリース時点では、FLUX.1 T...
1年前
054.1K
Cline推出“Memory Bank”:告别AI助手健忘症,项目上下文永不丢失

クラインが「メモリーバンク」を発表:AIアシスタントの記憶喪失にさよならを、プロジェクトの文脈を失わないために

有能なアシスタントと二人三脚で仕事をしていると、いつもあなたのニーズを素早く理解し、的確な答えを返してくれるのに、ちょっとした休憩のたびに、まるで記憶喪失になったかのように、プロジェクトの背景や技術的なアーキテクチャ、最も基本的な要件でさえも、一から説明し直さなければならなくなった経験はありませんか?A...を頼りにしている人たちにとって
12ヶ月前
053.9K
Cursor爆红,但Cursor不是国内AI编程的出路

カーソルは爆発的な人気だが、国産AIプログラミングの出口はカーソルではない

2021年、マイクロソフトはGitHub Copilotを発表し、プログラミング界で最も注目されるAIツールに躍り出た。 GitHub Copilotは、ユーザーが提供した関数名、コメント、コードスニペットなどのコンテキスト情報に基づいて、完全なコード関数を自動生成することができ、コーディング...
1年前
053.3K
大型语言模型工程师工具箱:精选120+实用库资源

大規模言語モデリング・エンジニアのツールキット:120以上の有用な図書館資料のセレクション

人工知能の分野では、大規模言語モデリング(LLM)技術が急速に変化しており、様々なツールライブラリが登場している。開発者がLLM開発の課題にうまく対処できるように、本論文では、120以上の有用なLLMライブラリを機能カテゴリ別に分類したツールボックスを編集し、四角 ...
12ヶ月前
053.3K
通义万相视频升级,登顶VBench,视频支持生成中文,镜头质感拉满

Tongyi万向ビデオのアップグレード、VBenchのトップ、中国語生成のためのビデオサポート、レンズのテクスチャを完全に引っ張る

2025年は始まったばかり、AI動画生成は技術的ブレイクスルーを迎えようとしている? 今朝、アリ社の動画生成モデル「同伊万向」がバージョン2.1に大幅アップグレードされたことが発表された。 今回発表されたモデルには、「同伊万向2.1 Extreme Edition」と「同伊万向2.1 Professional Edition」の2つのバージョンがあり、前者は効率的な映像生成に重点を置いている。
1年前
053K
快刀青衣:2025年一定要上手的10个AI工具

ファストダガー・グリーン:2025年に手に入れるべき10のAIツール

01Gammaタスクシナリオ:素早くPPTを作成する。 適用される人々:第三者の広告代理店、個人のコンサルタント、企業の社内トレーナー、および多くのPPTを作成する必要がある他の人々。 推奨理由:生成されたPPTページは見栄えが良く、デザインセンスがある。修正が簡単で、複数のバージョンをエクスポートする必要がなく、リンクが...
1年前
052.2K
智谱发布自主执行任务Agent——AutoGLM:这次让Agent主动操作各类设备执行任务

Smart Spectrum、自律タスク実行エージェント「AutoGLM」をリリース:今回、エージェントはあらゆるデバイスを能動的に操作してタスクを実行できるようになる

人間と機械との関わり方にパラダイム・シフトが起きている。これは、会話だけのチャットボットから、手、頭脳、目を持つ自律型エージェントへの進化のためである。 エージェントを探求する最初の大手モデル企業の1つとして、Smart Spectrumは今日、いくつかの新展開をもたらしました...
1年前
051.7K
2024年17款全球程序员都在使用的最佳AI编码助手工具

世界中のプログラマーが使っている2024年のベストAIコーディングアシスタントツール17選

まえがき 「良い仕事のための良い道具は、良い仕事のための良い道具である」ということわざがあるように、プログラマーにとって良い道具を選ぶことは特に重要である。良いツールを選ぶことは、プログラマーにとって特に重要である。コードの自動化であれデバッグであれ、AIコーディング・アシスタントはあなたの時間を節約し、コードの質を向上させることができる。この記事では、世界中のプログラマーが最も頻繁に使用しているものをいくつか紹介する...
1年前
051.7K
告别本地开发环境!腾讯、微软、谷歌免费在线 AI IDE 助你快速上手开发

ローカル開発環境にサヨナラ!Tencent、Microsoft、Googleが提供する無料のオンラインAI IDEが、あなたの開発をサポートします!

背景 クラウドコンピューティングと人工知能(AI)技術の急速な発展に伴い、オンライン統合開発環境(IDE)は現代の開発作業にとって重要なツールとなっている。特に今日ますます普及しているAIとクラウド開発では、オンラインIDEは面倒なローカル環境設定を省くだけでなく、強力な...
1年前
051.5K
Cursor:AI编程时代的革命性IDE,开发者效率跃升的利器还是过誉的玩具?

Cursor:AIプログラミング時代の革命的なIDEか、開発者が効率を飛躍させるツールか、それとも過大評価されたおもちゃか?

ソフトウェア開発プロセスを再構築するAIの波の中で、独自のポジショニングと急成長の勢いを持つCursorは、開発者コミュニティで熱い議論の焦点となっている。VSCodeカーネルをベースにAI機能を深く統合したこのコードエディタは、従来の開発モデルを破壊できるのか。今回は、その技術的特徴について見ていこう。
1年前
051K
必须了解的7款AI音频制作工具,用于增强和生成声音、语音及音乐

サウンド、ボイス、音楽を強化・生成するためのAIオーディオ制作ツール7選

進化を続けるオーディオ制作の分野において、人工知能は大きな進歩を遂げており、クリエイターのサウンドデザインへのアプローチ方法に革命をもたらす一連のツールを提供している。ポッドキャスト制作者、ミュージシャン、コンテンツ制作者にとって、これらの進歩は、より効率的なワークフローと高品質のオーディオエフェクトを意味します。
1年前
051K
kimi推出视觉版o1,用视觉思考并解决问题

キミ、視覚的に問題を考え解決するビジュアル版O1を発表

誰もがAIツールを使っていて、私たちはAIが一歩一歩発展し、成長していくのを見てきました。ほとんどの場合、私たちはテキストを使ってチャットをしていましたが、カーネルは「いつか絵についてうまく考えることができたらいいのに」と考えていたことがありました。 何度もAIについて研究した後、後にKimiを使ってみて、それは...
1年前
050.9K
全球最佳商业AI产品评测报告

世界最高のビジネスAI製品レビューレポート

はじめに 今日、人工知能技術の急速な発展の中で、あらゆる種類のAIツールが私たちの生活や仕事のあらゆる側面に浸透している。音声処理、文書対話からコンテンツ作成、画像生成、ソフトウェア開発やデータ分析に至るまで、AIは従来のワークフローや産業パターンを驚くべきスピードで変えつつある。
1年前
050.8K
Hugging Face 推出 Agent 智能体排行榜: 谁是工具调用领域的领导者?

ハギング・フェイスがエージェント・インテリジェンスのボディ・ランキングを発表:ツール・コーリングのリーダーは?

エヌビディアのジェンスン・フアン最高経営責任者(CEO)は、AIインテリジェンスを「デジタル労働力」と称えているが、このような見解を持つテックリーダーは彼だけではない。 マイクロソフトのサティア・ナデラCEOも、インテリジェント・ボディ技術がビジネスのあり方を根本的に変えると考えている。 これらのインテリジェント・ボディは、外部の労働者と協働することができる...
1年前
050.4K
Google 搜索“AI 模式”上线:剑指 Perplexity 与 ChatGPT

Google検索 "AIモード "が始動:PerplexityとChatGPTを狙う

最近、グーグル検索は、ジェネレーティブ・エクスペリエンス(SGE)に「AIモード」(AI Mode)と呼ばれる実験的な機能を導入した。これは、複雑なクエリを処理でき、強力な推論機能を備えたジェミニ2.0ビッグモデルを搭載し、直接...
12ヶ月前
050.3K
AI搜索工具PK,三大知识搜索神器谁最强?Perplexity、秘塔、Felo深度对比

AI検索ツールPK、知識検索の神3強は?「パープレキシティ」「シークレットタワー」「Felo」を徹底比較

まだ百度で情報検索しているの?効率が悪すぎる! 情報爆発時代、必要な情報を正確に入手することは、希少な能力となっています。検索能力を向上させる第一歩は、検索エンジンを変えることです! 従来の検索エンジンは、広告や複雑な情報が多いだけでなく、効率が悪く、検索結果の判断が難しい。
1年前
050.1K
Mistral AI 发布 Codestral 25.01 模型:更大、更快、更强的编程专用模型

ミストラルAIがコードストラル25.01をリリース:より大きく、より速く、より強力なプログラミング専用モデル

Tabキーのスピードでコードを書こう。今日からContinue.devで利用可能で、他の主要なAIコードアシスタントにも間もなく導入される。 この1年のAIにおける技術革新の中で、コード生成が最も重要であったことは間違いない。組み立てラインが製造を合理化するのと同様に、コード生成もまた、製造業を効率化するものである。
1年前
049.8K
Cursor、Windsurf和Cline:8 个必备的 MCP 插件

カーソル、ウィンドサーフ、クライン:MCPに欠かせない8つのプラグイン

インテリジェント・ボディ(エージェント)技術の急速な発展に伴い、MCP(モデル・コミュニケーション・プロトコル)プロトコルは、その使いやすさと効率性から、インテリジェント・ボディのエコシステムにおける中核的な通信規格として徐々に定着してきた。より多くのヘッドAIコードエディター...
12ヶ月前
049.5K
Runway 推出 Gen-4:新一代 AI 视频生成模型,主打世界一致性与可控性

ランウェイが「Gen-4」を発表:世界の一貫性とコントロール性を重視した新世代のAI映像生成モデル

人工知能研究会社Runwayはこのほど、次世代メディア世代AIモデルシリーズ「Runway Gen-4」を発表した。このモデルは、現在のAIビデオ生成に蔓延する一貫性の課題に対処し、コンテンツ生成の制御性を向上させるよう設計されており、より安定したAIビデオ生成への移行を示すものである。
11ヶ月前
049.4K
DashInfer-VLM,多模态SOTA推理性能,超vLLM!

DashInfer-VLM, マルチモーダルSOTA推論性能, ultra-vLLM!

はじめに DashInfer-VLMは、視覚的なマルチモーダル大規模モデルVLMのための推論アーキテクチャであり、特にQwen VLモデルの推論高速化のために最適化されている。 DashInfer-VLMと他のVLMの推論高速化フレームワークとの最大の違いは、VIT部分を...
1年前
049.4K
MiniMax 首次开源MiniMax-01,4M超长上下文,全新架构,挑战Transformer

MiniMax初のオープンソースMiniMax-01、4Mの超ロング・コンテキスト、新アーキテクチャ、トランスフォーマーに挑戦

MoE」+「本番環境向けの前例のない規模でのライトニング・アテンション」+「フレームワークからCUDAレベルまでのソフトウェアとエンジニアリングのリファクタリング」を足すとどうなるか?「何が得られるのか? 答えは、上位モデルの能力を均等化し、コンテキストの長さを改善するモデルだ...。
12ヶ月前
049.4K
Sealos Devbox 发布:部署云端原生开发环境

Sealos Devboxリリース:クラウドネイティブ開発環境のデプロイ

水滴は衝撃という最も原始的な攻撃方法で太陽系を攻撃した!しかし、それはとても効率的だ。 コンテナ、オーケストレーション、CI/CD、DevOpsに翻弄され、何の役にも立たない用語の数々を発明した後、私たちは結局、これらのオペレーションはすべて、開発者をますます窮地に追い込む、単なる飾りであることに気づく。 結局...
1年前
049.2K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast:プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。
1年前
049.2K
苹果 Mac Studio 性能怪兽登场:重塑大模型部署与专业工作流

アップルのMac Studioパフォーマンス・モンスターが登場:大規模モデルの導入とプロフェッショナルなワークフローを刷新する

アップルは先日、ハードウェアの大幅なアップグレードを受けたプロフェッショナル向けデスクトップクラス・ワークステーション、新型Mac Studioを発表した。最も注目すべき点は、Mac Studioのラインナップに初めてM4 Maxチップが導入されたことで、M3 ...
12ヶ月前
048.9K
70% 完成度陷阱:AI 辅助编码的最后 30% 挑战

70%完成の罠:AIアシストコーディングのための30%最終チャレンジ

ここ数年、AIによる開発に深く関わってきて、興味深い現象に気づいた。エンジニアがAIを使うことで生産性が大幅に向上したと報告する一方で、私たちが日常的に使っている実際のソフトウェアが大幅に改善されたようには見えないのだ。何が起こっているのだろうか? その答えが明らかにしたのは、私たち...
1年前
048.8K
重磅!OpenAI再遭人事动荡,GPT之父离职

OpenAI、GPTの父が退社し、またも人事異動に見舞われる

AI界隈で大ニュースが炸裂した。GPTの父」として業界で知られる伝説のOpenAI研究者、アレック・ラドフォードが、独立研究のために同社を退社すると発表したのだ。ChatGPTのコアテクノロジーであるGPTシリーズのチーフデザイナーとして、ラドフォードの決断は...。
1年前
048.7K
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。

近日公開予定のクリング1.5:「カスタムモデル」は、独自のビデオ映像でキャラクターをトレーニングします。

従来の動画生成の常識を覆す Kling AIの「カスタムモデル」機能では、ユーザーは10~30本の動画(それぞれ10秒以上の長さ)をアップロードすることで、キャラクターのトレーニングを行うことができる。このプロセスは、従来の画像トレーニングモデルとは大きく異なり、Kling AIはビデオ映像をキャラクター...
1年前
048.5K
JetBrains 开源 Mellum:专为代码补全设计的专用模型

JetBrainsオープンソースMellum:コード補完のために設計された特殊モデル

ソフトウェア開発ツールのプロバイダーであるジェットブレインズはこのほど、コード補完のために特別に設計された言語モデルであるMellumの基本バージョンをオープンソース化し、Hugging Faceプラットフォームで利用できるようにしたと発表した。この動きは、ソフトウェア開発におけるAIの透明性を促進するためのものである。
10ヶ月前
048.3K
智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级

Smart Spectrum GLM-PCオープン体験:コンピュータを自律的に操作するマルチモーダルエージェントがバージョンアップ

GLM-PCは、CogAgentのマルチモーダルモデルに基づいた世界初の一般向けターンキーコンピュータエージェントです。人間のようにコンピュータを「観察」し「操作」することができ、ユーザが様々なコンピュータ・タスクを効率的に完了できるよう支援する。 202年以来...
1年前
047.9K
Copilot in OneDrive 2025年新功能路线

OneDriveのコパイロット 2025 新機能ルート

OneDriveのコパイロット機能は非常に強力で、1カ所からすべてのファイルを全体として把握し、複数のファイルを要約・比較し、複雑な作業をこなしてきた。 もちろん、上記の機能はMicrosoft 365 copilot business editionに加入する必要があるが...。
1年前
047.8K
「AI搜索」测评基准首期榜单发布!4o领先幅度小,国内大模型表现亮眼,共5大基础11大场景14大模型

AI検索」評価ベンチマークの第1回リストが発表された!4oのトップマージンは小さく、5拠点、11シナリオ、14モデルの合計で国産大型モデルが冴え渡る。

中国ビッグモデル「AI検索」(SuperCLUE-AISearch)ベンチマーク評価のリリースは、検索と組み合わせたビッグモデルの能力を詳細に評価するものである。この評価では、ビッグモデルの基本的な能力だけでなく、シナリオアプリケーションでのパフォーマンスにも焦点を当てています。評価では、次のような5つの基本的な能力をカバーしています。
1年前
047.7K
NVIDIA 发布 AI-Q 蓝图,连接 AI Agent 塑造未来工作模式

NVIDIAがAI-Qブループリントを発表、AIエージェントをつなげて仕事の未来を形作る

人工知能(AI)エージェントは、複雑なタスクを自動化し、生産性を大幅に向上させる能力を持ち、ビジネスオペレーションにおける新しいデジタルワークフォースとして台頭してきている。しかし、個々のエージェントの能力には限界があり、その真の可能性は共同作業にある。異なるAIエージェントが...
11ヶ月前
047.6K