엔비디아, 대규모 언어 모델 AI 플랫폼 네모 메가트론 프레임워크 업데이트 Page 1:: 보드나라

뉴스

단신뉴스

오늘의 주요뉴스

메인

전송 2022-07-29 10:23

[뉴스/보도자료]
엔비디아, 대규모 언어 모델 AI 플랫폼 네모 메가트론 프레임워크 업데이트

엔비디아(CEO 젠슨 황)가 대규모 언어 모델(LLM)의 크기와 복잡성이 지속적으로 급증함에 따라 최대 30%의 훈련 속도 향상을 제공하는 네모 메가트론(NeMo Megatron) 프레임워크의 업데이트를 발표했다.

이번 업데이트는 두 가지 선구적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 하이퍼 파라미터(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.

1,760억 개의 파라미터(parameter)를 가진 세계 최대 오픈 사이언스, 오픈 액세스 다국어 언어 모델인 블룸(BLOOM)은 최근 엔비디아 AI 플랫폼에서 훈련돼 46개 언어와 13개 프로그래밍 언어로 텍스트 생성을 가능하게 했다. 또한 엔비디아 AI 플랫폼은 5,300억 개의 파라미터를 포함하는 가장 강력한 변환기 언어 모델인 메가트론-튜링 NLG 모델(MT-NLG)을 지원한다.

LLM은 텍스트에서 학습하는 최대 수조 개의 파라미터를 포함하는 오늘날 가장 중요한 첨단 기술 중 하나다. 하지만 이를 개발하려면 심층적인 기술 전문 지식, 분산된 인프라, 전체 스택 접근 방식이 필요해 비용과 시간이 많이 든다.

그러나 실시간 콘텐츠 생성, 텍스트 요약, 고객 서비스 챗봇, 대화형 AI 인터페이스를 위한 질문과 답변을 발전시키는 데 있어 큰 이점을 갖는다.

AI 커뮤니티는 LLM을 발전시키기 위해 메가트론(Megatron)-LM, 에이펙스(Apex), 그리고 기타 GPU 가속 라이브러리를 포함하는 엔비디아 AI 플랫폼을 기반으로 하는 마이크로소프트 딥스피드(Microsoft DeepSpeed), Colossal-AI, 허깅 페이스 빅사이언스(Hugging Face BigScience), 페어스케일(Fairscale) 같은 도구의 혁신을 이어가고 있다.

엔비디아는 오늘날 엔비디아 AI 플랫폼에 대한 새로운 최적화를 통해 스택 전체에서 기존의 많은 문제점을 해결하며, AI 커뮤니티와 협력해 모든 사람이 LLM의 기능에 액세스할 수 있기를 기대하고 있다.

네모 메가트론의 최신 업데이트는 220억에서 1조 파라미터에 이르는 크기의 GPT-3 모델 훈련 속도를 30% 향상시킨다. 이는 1,024개의 엔비디아 A100 GPU를 사용해 1,750억 개의 파라미터 모델에 대한 훈련을 24일 만에 수행하도록 한다. 즉, 결과 도출 시간을 10일 또는 GPU 컴퓨팅 시간으로 약 250,000 시간 단축할 수 있다.

네모 메가트론은 빠르고 효율적이며 사용하기 쉬운 엔드 투 엔드 컨테이너형 프레임워크이다. 데이터 수집, 대규모 모델 훈련, 업계 표준 벤치마크에 대한 모델 평가, 지연 시간(레이턴시)과 처리량 성능에 대한 최첨단 추론이 가능하다.

이를 통해 LLM 훈련과 추론을 다양한 GPU 클러스터 구성에서 쉽게 재현할 수 있다. 현재 얼리 액세스 고객에게 엔비디아 DGX 슈퍼POD(SuperPOD), 엔비디아 DGX 파운드리(Foundry), 마이크로소프트 애저(Microsoft Azure) 클라우드 플랫폼을 제공한다. 또한 다른 클라우드 플랫폼에 대한 지원도 제공될 예정이다.

더불어 사용자에게 엔비디아 가속 인프라의 실습 랩 카탈로그에 대한 단기 액세스를 제공하는 무료 프로그램인 엔비디아 런치패드(LaunchPad)에서 기능을 체험할 수 있다.

LLM 훈련을 최적화하고 확장하는 업데이트에 포함된 두 가지 새로운 기술은 시퀀스 병렬화(SP)와 선택적 활성화 재계산(SAR)이다.

시퀀스 병렬화(SP)는 이전에 병렬화 되지 않은 변환기 레이어의 영역이 시퀀스 차원을 따라 독립적이라는 점을 인식해 텐서 수준 모델 병렬화를 확장한다.

시퀀스 차원을 따라 이러한 레이어를 분할함으로써 텐서 병렬 장치 전반에 걸쳐 컴퓨팅 및 가장 중요한 활성화 메모리를 분산할 수 있다. 활성화가 분산되므로 재계산 대신 역방향 패스에 대해 더 많은 활성화를 저장할 수 있다.

LLM을 위한 엔비디아 AI 플랫폼의 최신 업데이트는 여기에서 확인할 수 있다. 또한 기업은 엔비디아 런치패드에서 네모 메가트론을 무료로 사용해 볼 수 있다.

태그(Tag) : 엔비디아, AI

관련 기사 보기

[영상] NVIDIA RTX SPARK는 인텔과 AMD의 X86 노트북 시장을, AI를 무기로 정복할 수 있을까?
[영상] 하나도 새롭지 않은 엔비디아의 개인용 AI 노트북, RTX SPARK와 젠슨 황 Q&A까지
[영상] 정말 쉬운 엔비디아 젠슨황 키노트 해설과 중요 QnA 설명, 그리고 컴퓨텍스의 위기
[영상] 석 달째 횡보하는 PC시장 메모리 가격, 하반기 메모리 모듈 가격의 향방은?
[영상] 비싼 메모리 시대에 램버스 실패로 알아보는, AI 시대 메모리 확보 전쟁의 끝은? [PC흥망사 17-2]
[영상] 엔비디아 지싱크 펄사(Pulsar)는 어떻게 잔상을 근본적으로 없애는가?, 펄사 지원 모니터 ASUS ROG Strix Pulsar XG27AQNG
태그(Tags) : 엔비디아, AI 관련기사 더보기

		편집부 / 필명 편집부 / press@bodnara.co.kr

		기자가 쓴 다른 기사 보기

이기사와 사진은 업체에서 제공받은 보도자료와 사진으로, 보드나라의 논조와는 다르다는 점을 알려드립니다.

보드나라 많이본 기사

커스텀 스팀머신의 시대? 밸브 스팀OS에 AMD 외장 그래픽 지원 시작

Let’s 클로! MSI 클로 8 EX AI+ 얼리버드 예판 진행

제이씨현, 선 없는 데스크테리어의 완성 기가바이트 B850M AORUS STEALTH 출시

코잇, ASUS GeForce RTX 그래픽카드 국내 공식 유통 확대 RTX 50 시리즈 공급

최고급 성능 게이밍 CPU 라이젠 7 9800X3D, 싱글 vs 듀얼 채널 메모리 게임 성능 차이는?

작지만 탄탄한 AM5 게이밍 메인보드, 기가바이트 B850M GAMING X WIFI6E 제이씨현

USB-C 포트 하나로 확장성과 충전까지, ipTIME UC305HDMI2 / UC306HDMI2-1G

레전드에서 부활한 007 퍼스트 라이트, 게인워드 지포스 RTX 5060 Ti Ghost 8GB로 즐기기

이 기사의 의견 보기

닉네임

웹봇방지

2026년 07월

주간 히트 랭킹

최고급 성능 게이밍 CPU 라이젠 7 9800X3D, 싱글 vs 듀얼

작지만 탄탄한 AM5 게이밍 메인보드, 기가바이트 B850M G

USB-C 포트 하나로 확장성과 충전까지, ipTIME UC305HDMI

레전드에서 부활한 007 퍼스트 라이트, 게인워드 지포스

AI 에이전트의 핵심 서버 CPU 흥망사, 메인프레임과 워크

NVIDIA RTX SPARK는 인텔과 AMD의 X86 노트북 시장을, A

AI PC 시대 프리미엄 비즈니스 노트북, MSI 프레스티지 1

게임 '아트'에 최적화된 게이밍 모니터, 벤큐 모비우스 E

90년대 인터넷 붐과 닷컴 버블이 불러온 썬마이크로시스

돋보이는 고성능 어항형 PC를 위한 선택,MSI MAG X870E

TCL A400M	커세어 3200D	젠하이저 모멘텀 5 와이어



다크플래쉬, 실속 더한 18,	델 네트워킹 Z9500 이더넷	BL2423PT



삼성전자 NX3000	엡손 워크포스 DS-40 모바	플렉스터 M6e M.2 SSD