NVIDIA представила персональный суперкомпьютер для ИИ: NVIDIA Project DIGITS, способный работать с большими моделями с 200 миллиардами параметров
В двух словах: персональный суперкомпьютер с искусственным интеллектом, который может стоять на вашем рабочем столе.
Сегодня на выставке CES 2025 компания NVIDIA представила Проект NVIDIA DIGITSЭто персональный суперкомпьютер с искусственным интеллектом, который может стоять на вашем рабочем столе.
- Перенесите вычисления с искусственным интеллектом, для которых традиционно требуются крупные центры обработки данных, на рабочий стол каждого.
- Предоставляет экономически эффективные вычислительные решения, поддерживающие весь процесс разработки, от небольших экспериментов до крупномасштабного производства.

Что делает эта штука?
Проект DIGITS представляет собой превосходный инструмент для вычислений с использованием искусственного интеллекта, который может быть выполнен обычным пользователем на собственном компьютере:
Project DIGITS работает на новом суперчипе NVIDIA GB10 Grace Blackwell, который способен обрабатывать 1 PFLOP (1,5 гигафлоп) данных.Тысяча триллионов операций с плавающей запятой в секунду.) Вычислительная производительность ИИ.
Предназначенный для создания прототипов, тонкой настройки и запуска больших моделей ИИ, он позволяет пользователям разрабатывать и запускать модели вывода на локальной настольной системе, а затем беспрепятственно развертывать их в облаке или центре обработки данных.
То есть он может запускать сверхкрупные модели искусственного интеллекта прямо в вашем регионе.Большие языковые модели, способные обрабатывать до 200 миллиардов параметров(Например...) .
Кроме того, поддерживается разработка и тестирование моделей ИИ на локальных компьютерах с последующим их быстрым развертыванием в облаке или центре обработки данных. В двух словах.Это все равно что иметь карманный суперкомпьютер искусственного интеллекта для каждого разработчика!

Это такая штука. Она меньше, чем Mac mini.
В чем заключается ее основная технология?
В основе Project DIGITS лежит чип под названием GB10 Superchip:
Разработка SoC:Основанная на архитектуре NVIDIA Grace Blackwell, она объединяет графические процессоры NVIDIA Blackwell (с последним поколением ядер CUDA и ядрами Tensor 5-го поколения) с высокопроизводительными процессорами NVIDIA Grace, оптимизированными для глубокого обучения.
Эффективная работа:Доступна точность FP4 Вычислительная производительность 1 PFLOP (одна тысяча триллионов операций с плавающей запятой в секунду)Новейшее дополнение к нашему портфолио - новое поколение архитектуры Arm®. Он также оснащен 20 высокопроизводительными ядрами на базе архитектуры Arm, обеспечивающими низкое энергопотребление и высокую производительность.
Потребление и хранение энергии:
- Нужен только обычный блок питания от розетки, нет необходимости в специальном оборудовании для оснащения
- 128 ГБ объединенной памяти и 4 ТБ NVMe-хранилища
Производительность превосходна:Может выполнять очень сложные задачи искусственного интеллекта, способные 200 млрд. Параметрыбольшой языковой модели.
Масштабируемость:Через сеть NVIDIA ConnectX.Два суперкомпьютера Project DIGITS, соединенные для выполнения 405 миллиардов параметрических моделей..
Производительность соединения: Высокоскоростное соединение GPU и CPU через NVLink-C2C.

В чем смысл и для кого?
В чем смысл?
Локальная разработка и тестирование: позволяет разработчикам быстро создавать прототипы и экспериментировать с моделями ИИ в локальной среде.
Расширение облака: локально разработанные модели могут быть перенесены непосредственно в облако для ускорения развертывания.
Эффективная производительность в сравнении с затратами: обеспечивает вычислительную мощность, сравнимую с мощностью крупного центра обработки данных, но при этом имеет меньшую стоимость и энергопотребление.
Разнообразные сценарии применения: поддержка приложений ИИ в различных областях, таких как глубокое обучение, обработка естественного языка, компьютерное зрение и т. д.
Для кого это?
- Идеально подходит для исследователей ИИ, ученых, изучающих данные, студентов и стартапов.
- Проще начать работу: для ее использования требуется только конфигурация обычного компьютера.
- Гибкость: плавный переход от локальной разработки к развертыванию в облаке.
Типичные сценарии применения
Исследования и инновации в области искусственного интеллекта
Разработка и тестирование сложных моделей ИИ, таких как крупномасштабные языковые модели (LLM) или генеративные приложения ИИ.
Разработка прототипов, доработка моделей и проведение экспериментов.
наука о данных
Используйте RAPIDS и другие инструменты для быстрой обработки и анализа больших массивов данных.
Ускорьте очистку данных, разработку функций и моделирование.
Преподавание и обучение
Доступные вычислительные ресурсы ИИ для университетов и студентов для поддержки практики преподавания и обучения ИИ.
Программное обеспечение и экологическая поддержка
NVIDIA предлагает богатую экосистему программного обеспечения, которая позволяет пользователям быстро начать разработку и развертывание моделей ИИ:
(1) Инструменты для разработки
NVIDIA NGC: Предоставляет обширную библиотеку программного обеспечения, состоящую из наборов средств разработки (SDK), фреймворков и предварительно обученных моделей.
NVIDIA NeMo: фреймворк для тонкой настройки больших языковых моделей (LLM).
NVIDIA RAPIDS: для ускорения рабочих процессов науки о данных.
Совместимость с популярными фреймворками: поддерживает такие популярные инструменты, как PyTorch, Python и Jupyter Notebook.
(2) Поддержка развертывания
Пользователи могут разрабатывать модели локально и затем развертывать их непосредственно в NVIDIA DGX Cloud или других ускоренных облачных и дата-центровых архитектурах без изменений кода.
(3) Поддержка на уровне предприятия
Предоставляет программное обеспечение NVIDIA AI Enterprise для обеспечения безопасности, поддержки и выпуска производственных сред корпоративного уровня.

Почему это важно?
Вычислительные мощности ИИ, которые раньше были по карману только крупным предприятиям или лабораториям, теперь становятся доступным инструментом для рядового разработчика. Что это значит:
Небольшие команды или отдельные люди могут разрабатывать и тестировать свои собственные модели ИИ.
Барьеры для исследований и инноваций в области ИИ значительно снижены.
Вычисления с искусственным интеллектом для всех: стимулирование внедрения технологий искусственного интеллекта за счет снижения стоимости оборудования и сложности развертывания. Развитие инноваций: Предоставление отдельным людям и небольшим командам беспрецедентной вычислительной мощности для вдохновения на инновации. Интеграция экосистем: Бесшовная интеграция аппаратных и программных экосистем NVIDIA, чтобы предоставить пользователям универсальное решение.

Сколько? Когда она будет доступна?
Дата выхода:Май 2025 г.
Цена продажи:От 3 000 долларов.Новый NVIDIA Cinema можно приобрести у NVIDIA совместно с лучшими партнерами.
Подпишитесь на уведомления на сайте NVIDIA.
Тем временем
NVIDIA представила полныйНовая серия GeForce RTX 50Графические карты и ноутбуки.
Эти продукты основаны на архитектуре Blackwell RTX, которая обеспечивает революционное повышение производительности и технологию нейронного рендеринга на основе искусственного интеллекта.
Серия RTX 50 обеспечивает 8-кратное увеличение производительности (благодаря DLSS 4) и снижение задержек до 75% (благодаря Reflex 2), открывая совершенно новые возможности для геймеров и создателей контента.

Мощная архитектура Блэквелла
Состоящая из 92 миллиардов транзисторов, она использует новейшую память GDDR7 (до 30 Гбит/с), обеспечивая пропускную способность памяти до 1,8 ТБ/с.
Новое поколение тензорных ядер и ядер трассировки лучей (RT) для поддержки рендеринга в реальном времени и более эффективной обработки моделей искусственного интеллекта.
Поддержка DLSS 4 и Reflex 2 улучшает плавность и отзывчивость игры.

GeForce RTX 5090
Параметры спецификации:
Количество ядер CUDA: 21 760
Память: 32 ГБ GDDR7
Пропускная способность памяти: 1792 ГБ/сТензор
Ядро: 680 (5-е поколение)
Ядро RT: 170 (4-е поколение)
Значительные улучшения производительности:
Производительность в два раза выше, чем у RTX 4090.
Поддержка разрешения 4K, 240 кадров в секунду и игры с преследованием при полном освещении благодаря DLSS 4 и функции Multi Frame Generation. Поддержка приложений генеративного искусственного интеллекта, позволяющих в 2 раза быстрее генерировать изображения и занимать меньше места в памяти (режим FP4).
Цена: Стартовая цена $1,999
Дата внесения в список: 30 января 2025 года

GeForce RTX 5080
Параметры спецификации:
Количество ядер CUDA: 16 384
Память: 16 ГБ GDDR7
Пропускная способность памяти: 960 ГБ/с
Значительные улучшения производительности:
Производительность в два раза выше, чем у RTX 4080.
Играйте в игры с поддержкой оптического отслеживания (например, Cyberpunk 2077 и Alan Wake 2), Black Myth: Goku и другие в разрешении 4K, чтобы удовлетворить высокий спрос создателей на 3D-рендеринг и редактирование видео.
Цена: Начальная цена $999
Дата внесения в список: 30 января 2025 года

GeForce RTX 5070Ti
Параметры спецификации:
Количество ядер CUDA: 12 288
Память: 16 ГБ GDDR7
Пропускная способность памяти: 896 ГБ/с (78% по сравнению с RTX 4070 Ti)
Значительные улучшения производительности:
Производительность в два раза выше, чем у RTX 4070 Ti.
Запускайте игры Light Chase с высокой частотой кадров при разрешении 2560x1440.
Цена: Начальная цена $749
Дата запуска: февраль 2025 года

GeForce RTX 5070
Параметры спецификации:
Количество ядер CUDA: 10 240
Память: 12 ГБ GDDR7
Пропускная способность памяти: 672 ГБ/с (значительное улучшение по сравнению с RTX 4070)
Значительные улучшения производительности:
Производительность в два раза выше, чем у RTX 4070.
Запуск игр с трассировкой света с высокой частотой кадров при разрешении 2560x1440 с поддержкой технологии DLSS Multi Frame Generation.
Цена: Начальная цена $549
Дата запуска: февраль 2025 года

Инновационные технологии нового поколения
DLSS 4 Технология нейронного рендеринга
DLSS 4 - это новейшая технология нейронного рендеринга от NVIDIA на базе ядра GeForce RTX Tensor, которая обеспечивает значительное увеличение частоты кадров при сохранении четкого качества изображения.
Генерируйте до 3 дополнительных кадров на каждый традиционный кадр рендеринга
Повышение частоты кадров до 8 раз
Поддержка игр с полной трассировкой лучей в 4K 240FPS
Первый раз в игре Трансформатор Модель искусственного интеллекта
Улучшена стабильность синхронизации и детализация движений
Технология морфинга кадров Reflex 2
NVIDIA Reflex 2 снижает задержки в играх до 75% благодаря новой технологии морфинга кадров для более плавного игрового процесса.
Снижение задержки в игре на 75%
Синхронизация рабочих процессов CPU и GPU
Обновление кадров рендеринга на основе последнего ввода мыши
Обеспечение конкурентного преимущества в многопользовательских играх
Сделать однопользовательские игры более отзывчивыми
Роль искусственного интеллекта в NVIDIA ACE
NVIDIA ACE - это набор технологий для цифровых персонажей, которые вдохнут жизнь в игровые персонажи и цифровых помощников с помощью генеративного ИИ.
Поведение персонажей в играх, управляемое искусственным интеллектом
Непрерывное обучение ИИ противника
Самостоятельная система NPC
Поддерживает ряд известных игр
Реагирование на поведение игрока в режиме реального времени
Проект R2X PC Цифровой человек
Project R2X - это компьютерный аватар, основанный на зрении, который помогает пользователям выполнять повседневные задачи и предоставляет помощь искусственного интеллекта.
R2X - это аватар на основе зрения, который выступает в роли настольного помощника для пользователей.
С его помощью пользователи могут выполнять различные задачи, например, читать и обобщать документы, управлять приложениями, проводить видеоконференции и многое другое.
Поддержка видеоконференций
Чтение и обобщение вспомогательных документов
Подключение GPT4, Grok и других облачных ИИ
Поддерживает множество фреймворков для разработки
Помощь в работе с настольными приложениями в режиме реального времени
армия роботов
NVIDIA также представила платформу NVIDIA Cosmos™ - передовой набор инструментов для ускорения разработки физических систем ИИ, таких как самоуправляемые автомобили и роботы.
Космос Включает в себя генеративные модели основы мира (WFM), усовершенствованные токены для видео, механизмы обеспечения безопасности и конвейеры ускоренной обработки видео.
Платформа призвана помочь разработчикам значительно снизить стоимость разработки физических моделей ИИ за счет создания реалистичных, физически обоснованных синтетических данных.
Короткий ответ таков:Cosmos создан специально для разработки робототехники и систем автономного вождения. Он генерирует виртуальные данные и симулирует сценарии на основе моделей ИИ, позволяя разработчикам быстрее и дешевле обучать и тестировать свои системы ИИ без необходимости тратить много времени и денег на сбор реальных данных.
- Возможна генерация текста в мир и видео в мир.
- Предлагаются три модели: Nano (пограничное развертывание с низкой задержкой), Super (высокопроизводительная базовая модель) и Ultra (модель с высокой точностью).
- Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 жетоны обучение, охватывающее 20 миллионов часов реальных и синтетических данных.
- Токенизаторы в 8 раз эффективнее при сжатии и в 12 раз быстрее при обработке.

Ключевые возможности Cosmos
1. Генерация виртуальных данных
- Условия вождения в снежную погоду
- Комплексная эксплуатация роботов на складах
- Например, можно создавать сверхреалистичные виртуальные сценарии: эти данные можно использовать для обучения систем искусственного интеллекта, уменьшая зависимость от данных реального мира.
2. Быстрая обработка видеоданных
- Инструменты Cosmos позволяют быстро сопоставлять и маркировать крупномасштабные видеоданные более чем в 10 раз быстрее, чем традиционные методы, что экономит время и средства.
3. Моделирование и тестирование
- Имитация различных погодных и дорожных условий (дождь, туман, пробки).
- Проверьте способность робота перемещаться по заводу или складу.
- Например, можно тестировать роботов или автономные системы вождения в виртуальных средах:
4. помощь в разработке моделей искусственного интеллекта
- Предоставляет базовые модели с открытым исходным кодом, которые разработчики могут адаптировать под свои нужды для робототехники или технологий автономного вождения.
5. несколько сценариев применения
- Для обучения самостоятельной езде: например, Uber и Waabi используют его для создания виртуальных сценариев тестирования вождения.
- Для разработки робототехники: Agility и XPENG используют его для обучения и оптимизации работы роботов.

Робототехнические компании на выставке:
глобальный
- Apptronik: Apollo Robotics
- Agility Robotics: Digit Robotics
- NEURA Robotics: Робот 4NE-1
- рисунок: Рисунок 02 Роботы
- 1X: NEO Robot
- Подопечный: Робот MenteeBot
- Убежище ИИ: Phoenix Robotics
сино
- Unitree Robotics: H1 Robot
- WiseGen Robotics: Экспедиция A2 Робототехника
- Звездный путь (американский телесериал): Робот Star1
- Генерал Галактики: Робот G1
- Разведка Фурье (Разведка Фурье): Робот GR-2
- Автомобильная компания Xiaopeng (производитель автомобилей в КНР): Железный робот
резюме
Этот релиз NVIDIA будет способствовать более широкому применению ИИ, обучению и тонкой настройке моделей в потребительском классе, а также развитию приложений ИИ, умного оборудования и робототехники!
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...