엔비디아, 2,000억 개의 파라미터로 대규모 모델 실행 가능한 개인용 AI 슈퍼컴퓨터: 엔비디아 프로젝트 디지츠(NVIDIA Project DIGITS) 공개

AI 뉴스1년 전 업데이트 AI 공유 서클

49.1K 00

간단히 말해, 데스크톱에 놓을 수 있는 개인용 AI 슈퍼컴퓨터입니다.

엔비디아는 오늘 CES 2025에서 다음을 공개했습니다. 엔비디아 프로젝트 디지츠는 데스크톱에 설치할 수 있는 개인용 AI 슈퍼컴퓨터입니다.

전통적으로 대규모 데이터 센터가 필요했던 AI 컴퓨팅을 모든 사람의 데스크톱으로 가져옵니다.
소규모 실험부터 대규모 생산까지 전체 개발 프로세스를 지원하는 비용 효율적인 컴퓨팅 솔루션을 제공합니다.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

이게 무슨 일을 하나요?

프로젝트 디지츠는 일반 사용자가 자신의 컴퓨터에서 수행할 수 있는 뛰어난 AI 컴퓨팅 도구를 제공합니다:

프로젝트 디지츠는 1 PFLOP(초당 1.5기가비트)을 제공할 수 있는 새로운 NVIDIA GB10 그레이스 블랙웰 슈퍼칩으로 구동됩니다.초당 1,000조 개의 부동 소수점 연산.) AI 컴퓨팅 성능.

대규모 AI 모델의 프로토타이핑, 미세 조정 및 실행을 위해 설계된 이 솔루션을 사용하면 로컬 데스크톱 시스템에서 추론 모델을 개발 및 실행한 다음 클라우드 또는 데이터 센터에 원활하게 배포할 수 있습니다.

즉, 로컬 영역에서 바로 초대형 AI 모델을 실행할 수 있습니다.최대 2,000억 개의 파라미터를 실행할 수 있는 대규모 언어 모델(예를 들어...) .

또한 로컬 컴퓨터에서 AI 모델을 개발 및 테스트한 다음 클라우드 또는 데이터 센터에 신속하게 배포할 수 있도록 지원합니다. 간단히 말해서모든 개발자에게 포켓 사이즈의 AI 슈퍼컴퓨터를 제공하는 것과 같습니다!

맥 미니보다 작은 크기입니다.

핵심 기술은 무엇인가요?

프로젝트 디지츠의 중심에는 GB10 슈퍼칩이라는 칩이 있습니다:

SoC 설계:엔비디아 그레이스 블랙웰 아키텍처를 기반으로 딥 러닝에 최적화된 고성능 엔비디아 그레이스 CPU와 최신 세대 쿠다 코어 및 5세대 텐서 코어를 탑재한 엔비디아 블랙웰 GPU가 통합되어 있습니다.

효율적인 성능:FP4 정확도로 사용 가능 1 PFLOP(초당 천조 부동 소수점 연산) 컴퓨팅 성능포트폴리오에 새로 추가된 최신 제품은 차세대 Arm® 아키텍처입니다. 또한 저전력 소비와 고성능을 위한 Arm 아키텍처 기반의 20개의 고성능 코어를 갖추고 있습니다.

에너지 소비 및 저장:

전원 공급을 위해 일반 전원 콘센트만 있으면 되며, 특별한 장비는 필요하지 않습니다.
128GB의 통합 메모리 및 4TB의 NVMe 스토리지

성능이 뛰어납니다:처리할 수 있는 매우 복잡한 AI 작업 실행 가능 2,000억 개의 매개변수의 대규모 언어 모델입니다.

확장성:NVIDIA ConnectX 네트워크를 통해.프로젝트 디지츠 슈퍼컴퓨터 두 대를 연결하여 4,050억 개의 파라메트릭 모델을 실행합니다..

연결 성능NVLink-C2C를 통한 GPU와 CPU의 고속 상호 연결.

요점은 무엇이며 누구를 위한 것인가요?

요점이 뭔가요?

로컬 개발 및 테스트: 개발자가 로컬 환경에서 AI 모델을 빠르게 프로토타이핑하고 실험할 수 있습니다.

클라우드 확장: 로컬에서 개발한 모델을 클라우드로 직접 마이그레이션하여 배포를 가속화할 수 있습니다.

비용 대비 효율적인 성능: 대규모 데이터센터와 비슷한 컴퓨팅 성능을 제공하지만 비용과 에너지 소비는 훨씬 적습니다.

다양한 애플리케이션 시나리오: 딥러닝, 자연어 처리, 컴퓨터 비전 등 여러 분야의 AI 애플리케이션을 지원합니다.

누구를 위한 서비스인가요?

AI 연구원, 데이터 과학자, 학생 및 스타트업에 이상적입니다.
더 쉬운 시작: 일반 컴퓨터의 구성만 있으면 사용할 수 있습니다.
유연성: 로컬 개발부터 클라우드 배포까지 원활하게 진행됩니다.

일반적인 애플리케이션 시나리오

AI 연구 및 혁신

대규모 언어 모델(LLM) 또는 제너레이티브 AI 애플리케이션과 같은 복잡한 AI 모델을 개발하고 테스트하세요.

프로토타입 개발, 모델 미세 조정 및 실험을 수행합니다.

데이터 과학

RAPIDS 및 기타 도구를 사용하여 대규모 데이터 세트를 빠르게 처리하고 분석하세요.

데이터 정리, 기능 엔지니어링 및 모델링을 가속화하세요.

교육 및 학습

대학과 학생이 AI 교육 및 학습 실습을 지원할 수 있는 경제적인 AI 컴퓨팅 리소스입니다.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

소프트웨어 및 에코시스템 지원

NVIDIA는 사용자가 AI 모델 개발 및 배포를 빠르게 시작할 수 있는 풍부한 소프트웨어 에코시스템을 제공합니다:

(1) 개발 도구

NVIDIA NGC: 개발 키트(SDK), 프레임워크 및 사전 학습된 모델로 구성된 포괄적인 소프트웨어 라이브러리를 제공합니다.

NVIDIA NeMo: 대규모 언어 모델(LLM)을 미세 조정하기 위한 프레임워크입니다.

데이터 사이언스 워크플로우 가속화를 위한 NVIDIA RAPIDS.

인기 있는 프레임워크와 호환: PyTorch, Python, Jupyter Notebook 등 인기 있는 도구를 지원합니다.

(2) 배포 지원

사용자는 로컬에서 모델을 개발하고 나중에 코드 변경 없이 NVIDIA DGX 클라우드 또는 기타 가속화된 클라우드 및 데이터센터 아키텍처에 직접 배포할 수 있습니다.

(3) 엔터프라이즈급 지원

엔터프라이즈급 보안, 지원 및 프로덕션 환경 릴리스를 위한 NVIDIA AI 엔터프라이즈 소프트웨어를 제공합니다.

왜 중요한가요?

대기업이나 연구소에서만 사용할 수 있었던 AI 컴퓨팅 성능이 이제 일반 개발자에게도 합리적인 가격의 도구가 되고 있습니다. 이것이 의미하는 바는 다음과 같습니다:

소규모 팀이나 개인이 직접 AI 모델을 개발하고 테스트할 수 있습니다.

AI 연구와 혁신의 장벽이 크게 낮아졌습니다.

모두를 위한 AI 컴퓨팅: 하드웨어 비용과 배포 난이도를 낮춰 AI 기술 도입을 촉진합니다. 혁신 촉진: 개인과 소규모 팀에 전례 없는 컴퓨팅 성능을 제공하여 더 많은 혁신을 불러일으킵니다. 에코시스템 통합: NVIDIA의 하드웨어 및 소프트웨어 에코시스템을 원활하게 통합하여 사용자에게 원스톱 솔루션을 제공합니다.

얼마인가요? 언제부터 이용할 수 있나요?

출시일:2025년 5월

판매 가격:3,000달러부터 시작합니다.새로운 NVIDIA 게이밍 플랫폼은 NVIDIA 및 최상위 파트너사에서 구매할 수 있습니다.

NVIDIA 웹사이트에서 알림을 신청하세요.

한편

NVIDIA는 전체새로운 GeForce RTX 50 시리즈그래픽 카드 및 노트북.

이 제품들은 혁신적인 성능 향상과 AI 기반 뉴럴 렌더링 기술을 제공하는 블랙웰 RTX 아키텍처를 기반으로 합니다.

RTX 50 시리즈는 최대 8배의 성능 향상(DLSS 4를 통해), 최대 75% 지연 시간 감소(Reflex 2를 통해)를 제공하여 게이머와 콘텐츠 제작자에게 완전히 새로운 가능성을 열어줍니다.

강력한 블랙웰 아키텍처

920억 개의 트랜지스터를 포함하는 이 제품은 최신 GDDR7 메모리(최대 30Gbps)를 사용하여 최대 1.8TB/s의 메모리 대역폭을 제공합니다.

실시간 렌더링과 보다 효율적인 AI 모델 처리를 지원하는 차세대 텐서 코어와 레이 트레이싱(RT) 코어가 탑재되었습니다.

게임의 부드러움과 반응성을 개선하기 위해 DLSS 4 및 Reflex 2를 지원합니다.

GeForce RTX 5090

사양 매개변수:

CUDA 코어 수: 21,760개

메모리: 32GB GDDR7

메모리 대역폭: 1792 GB/sTensor

코어: 680(5세대)

RT 코어: 170(4세대)

주요 성능 향상:

RTX 4090의 두 배에 달하는 성능.

DLSS 4 및 멀티 프레임 생성으로 4K 해상도, 240 FPS 및 풀 라이트 추구 게임을 지원합니다. 최대 2배 빠른 이미지 생성 및 메모리 사용량 감소(FP4 모드)로 제너레이티브 AI 애플리케이션을 지원합니다.

가격: 시작가 $1,999원

상장일: 2025년 1월 30일

GeForce RTX 5080

사양 매개변수:

CUDA 코어 수: 16,384개

메모리: 16GB GDDR7

메모리 대역폭: 960GB/s

주요 성능 향상:

RTX 4080의 두 배에 달하는 성능.

사이버펑크 2077, 앨런 웨이크 2 등 광학 트래킹을 지원하는 게임을 4K로 플레이하고, 블랙 신화: 오공과 같은 타이틀은 3D 렌더링과 동영상 편집에 대한 크리에이터의 높은 수요를 충족합니다.

가격: 시작가 $999

상장일: 2025년 1월 30일

GeForce RTX 5070Ti

사양 매개변수:

CUDA 코어 수: 12,288개

메모리: 16GB GDDR7

메모리 대역폭: 896GB/s(RTX 4070 Ti 이상 78%)

주요 성능 향상:

RTX 4070 Ti의 두 배에 달하는 성능.

2560x1440 해상도에서 높은 프레임 속도로 라이트 체이스 게임을 실행합니다.
가격: 시작가 $749

출시일: 2025년 2월

GeForce RTX 5070

사양 매개변수:

CUDA 코어 수: 10,240개

메모리: 12GB GDDR7

메모리 대역폭: 672GB/s(RTX 4070 대비 대폭 개선)

주요 성능 향상:

RTX 4070의 두 배에 달하는 성능.

DLSS 멀티 프레임 생성을 지원하여 2560x1440 해상도에서 높은 프레임 속도로 라이트 트레이싱 게임을 실행합니다.
가격: 시작가 $549

출시일: 2025년 2월

차세대 혁신 기술

DLSS 4 뉴럴 렌더링 기술

DLSS 4는 선명한 화질을 유지하면서 프레임 속도를 획기적으로 개선하는 GeForce RTX 텐서 코어 기반의 NVIDIA의 최신 뉴럴 렌더링 기술입니다.

기존 렌더링 프레임당 최대 3개의 추가 프레임 생성

최대 8배 향상된 프레임 속도

4K 240FPS 풀 레이 트레이싱 게임 지원

게임에서 처음 트랜스포머 AI 모델

타이밍 안정성 및 모션 디테일 개선

Reflex 2 프레임 모핑 기술

NVIDIA Reflex 2는 새로운 프레임 모핑 기술로 게임 지연 시간을 최대 75%까지 줄여 더욱 부드러운 게임 환경을 제공합니다.

게임 지연 시간 75% 감소

CPU 및 GPU 워크플로 동기화

최신 마우스 입력에 따라 렌더링 프레임 업데이트

멀티플레이어 게임에 경쟁력 제공

싱글 플레이어 게임의 반응성 향상

NVIDIA ACE AI 역할

NVIDIA ACE는 제너레이티브 AI를 통해 게임 캐릭터와 디지털 비서에 생명을 불어넣는 디지털 캐릭터 기술 제품군입니다.

게임 내 AI 기반 캐릭터 동작

지속적인 학습 적 AI

스스로 행동하는 NPC 시스템

잘 알려진 여러 게임 지원

플레이어 행동에 대한 실시간 대응

프로젝트 R2X PC 디지털 맨

Project R2X는 비전 기반 PC 아바타로, 사용자의 일상적인 작업을 돕고 AI 지원을 제공합니다.

R2X는 사용자를 위한 데스크톱 도우미 역할을 하는 비전 기반 아바타를 제공합니다.

문서 읽기 및 요약, 애플리케이션 관리, 화상 회의 등 다양한 작업을 지원합니다.

화상 회의 지원

문서 읽기 및 요약 지원

GPT4, Grok 및 기타 클라우드 기반 AI 연결하기

여러 개발 프레임워크 지원

실시간 데스크톱 애플리케이션 지원

로봇 군대

엔비디아는 또한 자율주행차 및 로봇과 같은 물리적 AI 시스템의 개발을 가속화하기 위해 설계된 고급 도구 모음인 엔비디아 코스모스(NVIDIA Cosmos™) 플랫폼을 발표했습니다.

코스모스 생성형 WFM(월드 파운데이션 모델), 고급 동영상 토큰라이저, 보안 보증 메커니즘, 가속화된 동영상 처리 파이프라인이 포함되어 있습니다.

이 플랫폼은 개발자가 사실적인 물리 기반 합성 데이터를 생성하여 물리적 AI 모델 개발 비용을 획기적으로 절감할 수 있도록 지원하는 것을 목표로 합니다.

짧은 대답은 다음과 같습니다:Cosmos는 로봇 공학 및 자율 주행 시스템 개발을 돕기 위해 특별히 설계되었습니다. AI 모델에서 가상 데이터와 시뮬레이션 시나리오를 생성하여 개발자가 실제 데이터를 수집하는 데 많은 시간과 비용을 들이지 않고도 더 빠르고 저렴하게 AI 시스템을 훈련하고 테스트할 수 있도록 지원합니다.

텍스트 대 월드 및 비디오 대 월드 생성이 가능합니다.
Nano(지연 시간이 짧은 에지 배포), Super(고성능 기본 모델), Ultra(고충실도 모델)의 세 가지 모델이 제공됩니다.
Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 토큰 의 실제 및 합성 데이터를 포함하는 2,000만 시간의 트레이닝을 수행했습니다.
토큰라이저는 압축 효율은 8배, 처리 속도는 12배 더 빠릅니다.

코스모스 주요 기능

1. 가상 데이터 생성

눈이 내리는 날씨의 주행 조건
물류창고 내 로봇의 복잡한 조작
예를 들어, 매우 사실적인 가상 시나리오를 생성할 수 있으며, 이 데이터를 사용하여 AI 시스템을 학습시켜 실제 데이터에 대한 의존도를 줄일 수 있습니다.

2. 동영상 데이터의 빠른 처리

코스모스의 도구는 기존 방식보다 10배 이상 빠르게 대규모 동영상 데이터를 수집하고 태그를 지정할 수 있어 시간과 비용을 절약할 수 있습니다.

3. 시뮬레이션 및 테스트

다양한 날씨와 도로 상황(비, 안개, 교통 체증)을 시뮬레이션합니다.
공장이나 창고에서 로봇의 이동 능력을 테스트합니다.
예를 들어 가상 환경에서 로봇이나 자율 주행 시스템을 테스트할 수 있습니다:

4. AI 모델 개발 지원

개발자가 로봇 공학 또는 자율 주행 기술에 대한 요구 사항에 맞게 커스터마이징할 수 있는 오픈 소스 기본 모델을 제공합니다.

5. 여러 애플리케이션 시나리오

자율 주행 교육: 예를 들어 Uber와 Waabi는 가상 운전 테스트 시나리오를 만드는 데 사용합니다.
로봇 개발: Agility와 XPENG는 로봇 작동을 훈련하고 최적화하는 데 사용합니다.

로봇 공학 회사 전시:

글로벌

앱트로닉: 아폴로 로보틱스
민첩성 로보틱스: 디지트 로보틱스
뉴라 로보틱스: 4NE-1 로봇
그림: 그림 02 로봇
1X: 네오 로봇
멘티: 멘티봇 로봇
생츄어리 AI: 피닉스 로보틱스

sino

유니트리 로보틱스: H1 로봇
와이즈젠 로보틱스: 원정대 A2 로보틱스
스타트렉(미국 TV 시리즈): 스타1 로봇
갤럭시 일반: G1 로봇
푸리에 정보(푸리에 인텔리전스): GR-2 로봇
샤오펑 자동차 회사(중국 자동차 제조업체): 아이언 로봇

요약

엔비디아의 이번 출시는 AI의 적용 범위를 넓혀 모델 트레이닝 및 미세 조정이 소비자급 분야에 진입하고, AI 애플리케이션, 스마트 하드웨어 및 로봇 공학이 폭발적으로 성장할 수 있도록 촉진할 것입니다!

AI 뉴스

위즈덤 스펙트럼 "플래시 시리즈" 텍스트, 이미지 이해, 이미지 생성, 동영상 생성 4가지 모델 모두 무료입니다!

AI 뉴스

1 년 전

056.7K

Command R7B: 향상된 검색 및 추론, 다국어 지원, 빠르고 효율적인 제너레이티브 AI

AI 뉴스

1 년 전

044.5K

슈퍼 $150 AI 도구에 대한 $1800 구독료? 레니의 뉴스레터 연간 번들이 여기 있습니다!

AI 뉴스

12개월 전

075.3K

허깅페이스는 o1의 기술적 세부 사항을 공개하고 이를 오픈소스화합니다!

AI 뉴스

1 년 전

039.7K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...

엔비디아, 2,000억 개의 파라미터로 대규모 모델 실행 가능한 개인용 AI 슈퍼컴퓨터: 엔비디아 프로젝트 디지츠(NVIDIA Project DIGITS) 공개

이게 무슨 일을 하나요?

핵심 기술은 무엇인가요?