AIニュース

合計526記事
MiniMax 首次开源MiniMax-01,4M超长上下文,全新架构,挑战Transformer

MiniMax初のオープンソースMiniMax-01、4Mの超ロング・コンテキスト、新アーキテクチャ、トランスフォーマーに挑戦

MoE」+「本番環境向けの前例のない規模でのライトニング・アテンション」+「フレームワークからCUDAレベルまでのソフトウェアとエンジニアリングのリファクタリング」を足すとどうなるか?「何が得られるのか? 答えは、上位モデルの能力を均等化し、コンテキストの長さを改善するモデルだ...。
7ヶ月前
018.3K
苹果 Mac Studio 性能怪兽登场:重塑大模型部署与专业工作流

アップルのMac Studioパフォーマンス・モンスターが登場:大規模モデルの導入とプロフェッショナルなワークフローを刷新する

アップルは先日、ハードウェアの大幅なアップグレードを受けたプロフェッショナル向けデスクトップクラス・ワークステーション、新型Mac Studioを発表した。最も注目すべき点は、Mac Studioのラインナップに初めてM4 Maxチップが導入されたことで、M3 ...
7ヶ月前
018.3K
“agent”一词令人沮丧,GPT-4级模型已不值一提,大神程序员盘点「大模型的2024」

エージェント」という言葉は憂鬱であり、GPT-4モデルはもはや言及する価値もなく、偉大なプログラマーたちは「ビッグモデル2024」を見定めている。

専門家は一般的に、2024年はAGIの年だと考えている。この年、ビッグモデル業界は劇的に変化する。オープンAIのGPT-4はもはや手の届かない存在ではなく、画像・映像生成モデルはますますリアルになり、マルチモーダルなビッグ言語モデル、推論モデル、知的...
9ヶ月前
018.2K
Anthropic CEO 妄言“中国威胁”,为美国 AI 霸权主义撑腰

Anthropic社CEO、「中国の脅威」を訴えて米国のAI覇権を支持

解説:1.中国のAI開発を中傷し、「中国脅威論」を展開する この記事の著者は、米国の立場に立ち、ディープシークなど中国AI企業の技術進歩が米国にもたらすいわゆる「脅威」を意図的に誇張し、いわゆる「○○脅威」と強引に結びつける論調で、この論調は...に満ちている。"XXXの脅威"、この議論には...
8ヶ月前
018.1K
即将推出可灵(Kling)1.5:“自定义模型”用自己的视频素材训练人物一致性角色。

近日公開予定のクリング1.5:「カスタムモデル」は、独自のビデオ映像でキャラクターをトレーニングします。

従来の動画生成の常識を覆す Kling AIの「カスタムモデル」機能では、ユーザーは10~30本の動画(それぞれ10秒以上の長さ)をアップロードすることで、キャラクターのトレーニングを行うことができる。このプロセスは、従来の画像トレーニングモデルとは大きく異なり、Kling AIはビデオ映像をキャラクター...
11ヶ月前
018.1K
免费!! Github联合Azure免费向开发者提供包括o1在内顶级闭源开源模型API调用

無料! GithubがAzureと手を組み、o1を含むクローズドソースのトップオープンソース・モデルAPIコールを開発者に無料提供する。

画面上には、さまざまなモデルAPIの設定情報が散りばめられたコードがびっしりと表示され、テーブルの上のコーヒーはとっくに冷めている。 これは、AIアプリケーションを構築しようとする際の多くの開発者の本音を反映している。面倒な環境設定、APIの高コスト、不十分なドキュメントサポート......。 統一されたAPIがあればいいのだが......」。
10ヶ月前
018.1K
Sealos Devbox 发布:部署云端原生开发环境

Sealos Devboxリリース:クラウドネイティブ開発環境のデプロイ

水滴は衝撃という最も原始的な攻撃方法で太陽系を攻撃した!しかし、それはとても効率的だ。 コンテナ、オーケストレーション、CI/CD、DevOpsに翻弄され、何の役にも立たない用語の数々を発明した後、私たちは結局、これらのオペレーションはすべて、開発者をますます窮地に追い込む、単なる飾りであることに気づく。 結局...
9ヶ月前
018.1K
Ray2 视频模型:自然运动与电影级视觉的视频生成模型

Ray2映像モデル:自然な動きと映画のような映像のための映像生成モデル

Luma Labsは、ルーマの画期的なマルチモーダルアーキテクチャに基づく革新的なモデルであるRay2により、AIを活用した映像生成のベンチマークを再び設定し、デジタルコンテンツ制作の飛躍的な飛躍を指先にもたらします。ルーマの画期的なマルチモーダルアーキテクチャに基づくこの革新的なモデルは、デジタルコンテンツ制作に飛躍的な進歩をもたらし、リアルで鮮明な映像コンテンツを指先で楽しめるようにします。Ra...
8ヶ月前
018.1K
LangChain 团队论 MCP:AI Agent 工具扩展的新方向?

LangChainチームのMCP:AIエージェント・ツールのスケーリングの新しい方向性?

最近、モデル・コンテキスト・プロトコル(MCP)がAIの分野で大きな関心を呼んでいる。この技術は、「ユーザーがエージェントを制御することなく、基本的なエージェントのツール機能を拡張するにはどうすればよいか」という中心的な問題に取り組むことを目的としている。 この技術は、MC...
7ヶ月前
018K
全面解析Notepads功能:实现Cursor编辑器与聊天之间无缝上下文共享

メモ帳機能全解説:カーソルエディターとチャットのシームレスなコンテキスト共有

カーソルはいいものだが、いいものでもいろいろとうまくいかないことがある。うまくいかない会話(チャットであれコンポーザーであれ)は、別のドッキングステーションを開くことで解決できることが多いが、文脈は失われてしまう。 しかし、文脈は失われてしまう。
10ヶ月前
018K
全球最佳商业AI产品评测报告

世界最高のビジネスAI製品レビューレポート

はじめに 今日、人工知能技術の急速な発展の中で、あらゆる種類のAIツールが私たちの生活や仕事のあらゆる側面に浸透している。音声処理、文書対話からコンテンツ作成、画像生成、ソフトウェア開発やデータ分析に至るまで、AIは従来のワークフローや産業パターンを驚くべきスピードで変えつつある。
7ヶ月前
018K
MiniMax多模态生成技术再创新:主体参考,参考人像图片生成风格一致视频

MiniMaxマルチモーダル生成技術が刷新:被写体リファレンス、肖像リファレンス画像でスタイリスティックに一貫した動画を生成

劇場での生活を体験するために様々な役柄に挑戦してみたい、監督になって一組一組のショットの振り付けをしてみたい、脚本家としてパラレルワールドの無限の可能性について書いてみたいなど、誰もが心の中に映画の夢を持っている。 コンクAIは、さまざまな人が映画へのアプローチ方法を持つことを可能にする、夢を作る機械なのだ。新年早々、Conch AIはグローバルな...
9ヶ月前
018K
Luma Photon 图像生成模型:用自然语言描述迭代生成图像,兼顾画质与创意

ルマフォトン画像生成モデル:画質と創造性のバランスを考慮した自然言語記述による画像の反復生成

Luma Labsは、クリエイティブな表現、スマートなテクノロジー、パーソナライゼーションの頂点を極める最先端のAI画像生成モデル、Luma PhotonとPhoton Flashを発表します。画期的なアーキテクチャー・デザインに基づき、この2つのモデルは、単に画像を生成するだけではありません。
8ヶ月前
018K
全球首个多语言 ColBERT:Jina ColBERT V2 和它的‘俄罗斯套娃’技术

世界初の多言語ColBERT:Jina ColBERT V2とその「ロシアの入れ子人形」技術

RAGドメインにおいて、マルチベクトルモデルColBERTは、文書の各トークンに対して独立したベクトルを生成することにより、検索精度の向上をもたらす。しかし、ColBERTはストレージ要件の劇的な増加をもたらし、英語しかサポートしないため、適用範囲が限定される。 これらの問題を解決するために、我々は...
1年前
017.9K
谷歌 发布 AI Co-scientist,Gemini 驱动的智能科研助手

グーグル、ジェミニ搭載の知的研究アシスタント「AI Co-scientist」を発表

科学研究という広大な分野において、科学者は、その類まれな才能と創造性、そして膨大な文献から得た洞察力と専門知識をもって、新たな、そして実行可能な研究の方向性を切り開き、その後の発見への道を切り開き続ける探検家のような存在である。しかし、多くの分野において、研究者はしばしば...
8ヶ月前
017.9K
Cohere AI 推出 Rerank 3.5:相关知识排序技术的新时代

Cohere AIがRerank 3.5を発表:関連知識ソート技術の新時代へ

概要 情報爆発時代において、組織はコンテンツを見つけるためだけでなく、効率と生産性を向上させるためにも検索テクノロジーに頼るようになった。しかし、従来の検索モデルでは、ユーザーの意図を正しく理解できないことが多く、その結果、不正確で関連性のない、あるいは不完全な検索結果になってしまう。このような経験は、ユーザーをイライラさせるだけでなく...
10ヶ月前
017.8K
苹果推出新款MM1 AI模型

アップル、新しいAIモデルMM1を発表

アップルの研究者は、視覚と言語理解を組み合わせて高度な機能を実現するマルチモーダルAIモデル・ファミリーであるMM1に関する新しい論文を発表した。 詳細:MM1モデルは、画像キャプション、画像テキストデータ、およびプレーンテキストデータを慎重に組み合わせて動作します...
2年前
017.8K
海螺问问v2.9.1新春版发布:10秒钟克隆你的声音为亲友送祝福

コンク・アスクv2.9.1旧正月版リリース:10秒であなたの声をクローンし、友人や家族にお祝いを送る

ConchQがモバイル版v2.9.1をリリースし、多くのエキサイティングな機能を追加しました。コンチQは旧正月に最適なギフトです!コンチQは旧正月のための素晴らしい贈り物です。 今すぐアップグレードして、旧正月の新しい遊び方をアンロックしましょう。 10秒であなたの声をクローンして、心の音をアンロック...
1年前
017.8K
专属“AI 伙伴”:微软 Copilot 发布记忆、行动等多项重要新功能

専用「AIパートナー」:マイクロソフト・コパイロットがメモリ、アクション、その他の重要な新機能をリリース

マイクロソフトは、AIアシスタント「Copilot」の一連の重要なアップデートを発表し、パーソナライゼーションとタスク実行の強化を通じて、汎用AIツールからユーザーに寄り添う「パーソナルAIパートナー」への転換を目指す。マイクロソフトのAI責任者であるMust...
6ヶ月前
017.8K
24小时分享AI生成视频

AIが生成した動画を24時間365日共有

チューブアドレス、科学の後に見える... AInfinite.TVは、24時間365日、人工知能が生成したコンテンツを提供する初のチャンネルです。無限のオーディオビジュアルの饗宴を提供し、AIの創造性のフロンティアをナビゲートし、デジタル・エンターテインメント革命を探求します。
1年前
017.8K
Command R7B:增强检索和推理能力,多语言支持,快速高效的生成式 AI

コマンドR7B:検索と推論の強化、多言語サポート、高速で効率的な生成AI

私たちのRファミリーの中で最小のモデルは、一般的なGPUやエッジデバイス上で強力なAIアプリケーションを構築するための一流のスピード、効率、品質を提供します。 本日、エンタープライズ向けに特別に開発された大規模言語モデル(LLM)であるCommand R7Bをリリースできることを嬉しく思います。
9ヶ月前
017.7K
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型

アリババAI研究所、改良型ストリーミング音声合成モデル「CosyVoice 2」を発表

1.概要 近年、音声合成技術は大きな進歩を遂げ、特にリアルタイムで自然かつスムーズな音声生成の実現に成功した。しかし、実際のアプリケーションでは、待ち時間、発音の正確さ、話者の一貫性などの問題が、特に高い応答性が要求されるストリーミングアプリケーションにおいて、依然として業界を悩ませている。
9ヶ月前
017.7K
谷歌Bard大升级功能演示

Google Bard ビッグアップグレード機能のデモ

ChatGPTにさよならを言って、Bardにこんにちは Google Bardがメジャーアップグレードを行い、機能が10倍になりました。 ここでは、Bardでできる10の素晴らしいことを紹介します: [1] ウェブ情報を入手する 最新情報を入手する必要があります...
1年前
017.7K
DeepSeek 论战:中国在成本、真实训练成本、闭源模型利润影响方面的领导地位

DeepSeek討論会:コストにおける中国のリーダーシップ、実際のトレーニングコスト、クローズドソースモデルの利益への影響

キーワード:H100価格高騰、補助金による推測価格、輸出規制、MLA ディープシークの語りが世界を席巻 ディープシークが世界を席巻している。この1週間、ディープシークは世界中の誰もが語りたがる唯一の話題となっている。現在、D...
8ヶ月前
017.7K
Day of AI:麻省理工打造的免费人工智能自学网站

Day of AI:MITが作成した無料のAI自習サイト

Day of AI(人工知能の日)は、2021年6月にMITで誕生した。MITのRAISE(Responsible Artificial Intelligence and Education)の教授陣と研究科学者のチームが率いる「Day of AI」プロジェクトは、あらゆる背景と能力を持つ学生のために行うことを目的としている...
9ヶ月前
017.7K
微软“画图”应用也将加入“Copilot”按钮,Windows Insider 测试用户可抢先体验

マイクロソフトの "ペイント "アプリには "Copilot "ボタンも追加され、Windows Insiderテスターはその一部を覗くことができる!

Windows Insiderのユーザーは、まもなく別の新しいアプリでCopilotアイコンを目にすることになる。新しくロールアウトされたアップデートのおかげで、CanaryチャンネルとDevチャンネルのInsiderテストユーザーには、AIが動作するこの新しいボタンが表示されます...
8ヶ月前
017.6K
智谱支持128K上下文/4K输出长度大模型GLM-4-Flash全量免费开放!

Wisdom Spectrumは128Kコンテクスト/4K出力長の大型モデルGLM-4-Flashフルボリューム・フリーオープンをサポートします!

8月27日より、ウィズダムスペクトラムはGLM-4-Flash APIをフリーで公開しています。GLM-4-Flashは3日間の英語から中国語への翻訳テストを実施し、シリコンフローが提供するGLM-4-9bとOpenRouter: Integrating Multi-LLM for Unified... を比較しています。
9ヶ月前
017.6K
6个禁止!复旦出台全球最严AI新规

6つの禁止事項復旦が世界一厳しい新AIルールを導入

最近、復旦大学は「復旦大学学士論文(設計)におけるAIツールの使用に関する規定(試行実施用)」を発表し、「6つの禁止事項」を明確に打ち出し、学士論文(設計)執筆過程における人工知能(AI)ツールの使用を詳細に規定した。 それによると、...
10ヶ月前
017.6K
手机AI迎来“智能体”时代:三星S25携手智谱,开启音视频通话新纪元

携帯電話のAIが「知的ボディ」の時代を切り開く:サムスンS25がSmart Spectrumと手を組み、音声通話とビデオ通話の新時代を切り開く

今日のスマートフォンの発展は、ハードウェアの競争、アプリケーションのエコロジー構築は「古い台本」になったようだ。今、携帯電話業界の新たな成長ポイントは、誰もが同じ方向を目指している - 人工知能。 今回、最も注目されているテクノロジーは、いわゆる「エージェント(知能体)」である。
8ヶ月前
017.5K
Text2Edit:文本驱动视频广告创作的原生多模态模型(未发布)

Text2Edit:テキスト駆動型動画広告作成のためのネイティブ・マルチモーダルモデル(未発表)

概要 Text2Editは、GitHubでホストされているオープンソースプロジェクトで、効率的なテキスト編集と広告生成機能を提供することを目指しています。このプロジェクトの主な目的は、使いやすいインターフェースと強力な広告生成機能によって、ユーザーがテキストコンテンツを素早く処理し、高品質の広告を生成できるようにすることです。
9ヶ月前
017.5K
10 款免费的英文写作AI段落生成工具(2024年)

英文ライティングのための無料AIパラグラフ生成ツール10選 (2024)

ライティングのボトルネックは誰にでもあります。ライティングのレベルに関係なく、パラグラフ・ジェネレーターを使えば、仕事を早く終わらせることができます。商品説明からソーシャルメディアへの投稿まで、AIツールはライティングを克服するための素晴らしい出発点となります。
1年前
017.5K
GitHub 推出 GitHub Spark (预览版),用自然语言描述快速构建“微应用”

GitHubがGitHub Spark(プレビュー)を発表、自然言語記述による "マイクロアプリ "を迅速に構築可能に

GitHubは、GitHub Sparkという大きな新製品を発表した。自然言語による記述だけでマイクロアプリケーションを構築・共有することができ、ソフトウェア開発の障壁を劇的に下げることができる。ユーザーは深いプログラミング知識を持っている必要はなく、システムが自動的に技術的な詳細をすべて処理する。
11ヶ月前
017.4K
Grok 3 震撼发布:推理智能体性能炸裂!API 首发 “5 美元充 150 美元”

Grok 3 衝撃のリリース:推論インテリジェンス・ボディが爆発! APIが "150ドルで5ドルチャージ "を初披露

AI技術の分野では、性能は厳然たる真実である!xAIの新しくリリースされたGrok 3とGrok 3 miniモデルは、一連の爆発的な性能指標により、人々のAI能力に対する認識を再び新たにした。xAIの最新リリースのGrok 3とGrok 3 miniモデルは、一連の爆発的な性能指標によって、再び人々のAIの能力に対する認識を新たにした。
8ヶ月前
017.4K
海螺语音国内上线,可能是最好的中文语音配音产品

コンク音声国内発売、最高の中国語音声吹き替え製品かもしれない

中国でコンテンツ制作のために作られたダビング製品で、いいものは一つもない。APIしか使えないか、製品はまあまあのサウンドモデルでも、いいものはない。 たとえば、海外のイレブンラボは、英語はOKですが、中国語は本当に渡って引っ張っている、オープンソースのモデルの主な問題は、モデルの品質が比較的悪いということです...
9ヶ月前
017.4K
微软 Magma 模型:一款 AI 智能体,搞定 UI 操作和机器人控制

マイクロソフト マグマモデル:UI操作とロボット制御を担うAIインテリジェントボディ

先日、マイクロソフトリサーチが大きな研究成果を発表した。マルチモーダルAIエージェントの基本モデル「Magma」である。 このモデルは、人間のように画像を「読み」、言語を「理解」するだけでなく、ユーザーインターフェース(UI)を直接操作し、機械を制御することもできるマルチスキル...人間のように画像を「見る」ことができ、言語を「理解する」ことができるだけでなく、ユーザーインターフェース(UI)を直接操作し、機械を制御することもできる...
8ヶ月前
017.3K
欢迎使用 ComfyUI 桌面版,正式开放用户下载!

ComfyUI Desktop Editionへようこそ!

お待たせいたしました!この度、ComfyUIのデスクトップ版(旧V1)がベータ版ユーザーの皆様にご利用いただけるようになりました! ComfyUIデスクトップをダウンロード - Windows ComfyUIデスクトップをダウンロード - Mac セットアップについて...
11ヶ月前
017.3K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

GoogleがVertex AI RAGエンジンをリリース:信頼性の高い検索機能付きジェネレーティブ・アプリケーションを構築するためのワンストップ・ショップ

生成AIと大規模言語モデリング(LLM)は産業を変革しているが、2つの重要な課題が企業の採用を妨げている:幻滅(不正確または無意味な情報の生成)と学習データ以外の限られた知識。検索補強型生成(RAG)と接地...
9ヶ月前
017.3K
告别DeepSeek卡顿:独家秘笈解锁R1流畅体验,联网离线全搞定!

DeepSeekのラグにサヨナラ:限定シークレットが、オンラインでもオフラインでもスムーズなR1体験を解き放つ!

まだDeepSeekの公式R1の「後でもう一度お試しください」に悩まされ、血圧が急上昇するまでラグが続いていますか?ご心配なく、あなたは一人ではありません!昨日、私はSilicon Flow + ChatboxAIを使ってDeepSeekの公式ラグから解放される方法を紹介しました。
8ヶ月前
017.3K
可汗学院AI素养课程:帮助6-12年级学生理解和应用人工智能技术

カーン・アカデミーのAIリテラシー・プログラム:6年生から12年生の生徒がAI技術を理解し、応用できるようにする。

概論 コモンセンス・エデュケーションは、6年生から12年生を対象とした無料のAIリテラシー・コースを提供しています。これらの授業は、生徒が人工知能(AI)の基本的な概念とその社会的・倫理的な意味を理解できるように設計されています。コースでは、AI...
9ヶ月前
017.2K
DeepSeek-V3/R1 推理系统概述(DeepSeek 开源周第六天)

DeepSeek-V3/R1 推論システムの概要 (DeepSeek Open Source Week 6日目)

システム設計の原理 DeepSeek-V3/R1推論サービスの最適化の目標は、スループットの向上と待ち時間の短縮です。 この2つの目標を最適化するために、DeepSeekはノード間エキスパート並列 (EP) のソリューションを採用しています。 第一に、EPはバッチ処理時間を大幅にスケール...
7ヶ月前
017.2K
TokenVerse:谷歌开源了多图风格混合创意工具 Whisk

TokenVerse: Google、複数の画像スタイルをミックスするクリエイティブツール「Whisk」をオープンソース化

1.はじめに:画像生成の新時代 今日のデジタル時代において、画像生成技術は目覚ましい進歩を遂げている。あなたがデザイナーであれ、アーティストであれ、パーソナライズされたコンテンツを作りたい一般人であれ、画像生成ツールはあなたのアイデアに命を吹き込む手助けをしてくれる。しかし、従来の画像...
9ヶ月前
017.2K
Shopify新推出的

Shopifyの新しいAI画像エディター「Magic」が商品画像のクオリティを引き出す

Shopifyのeコマース・プラットフォームは、さらなるAIツールを導入しており、これらの新しいツールは、すでにある商品説明テキストジェネレーターやAIチャットボットと一緒に機能する。 昨年4月に稼働を開始したShopify Magic AIツールスイートは、今年新たにメディアエディタが追加された。
2年前
017.2K
现在你可以在 Claude Artifacts 中生成交互式可视化数据

クロード・アーティファクトでインタラクティブなビジュアライゼーションを作成できるようになりました!

Claude.aiは最近、データ処理と分析能力を強化するために設計された新しい分析ツールを発表した。このツールの導入により、Claudeはデータ分析アシスタントへと変貌を遂げ、複雑な処理を可能にするJavaScriptコードを記述して実行できるようになった。
11ヶ月前
017.1K