리뷰
 





 
 
 




전송 2020-05-15 11:17
[취재]

인공지능 성능 최대 20배 강화
엔비디아 차세대 GPU 아키텍처 앙페르 발표

엔비디아에서 GTC 디지털을 여는 젠슨 황 CEO의 기조 연설과 함께, 차세대 GPU 아키텍처인 앙페르(Ampere)를 공식 발표했다.

 

이번에 발표된 앙페르 아키텍처는 컴퓨팅 성능에 집중한 기존 볼타 아키텍처의 연장선 버전으로, 게임 환경에서 실시간 레이 트레이싱 구현을 강조해온 엔비디아의 게이밍용 앙페르 아키텍처는 공개되지 않았다.

 


앙페르 아키텍처에 적용된 텐서 코어는 볼타 - 튜링을 잇는 3세대 텐서 코어로, 기존 FP32 보다 최대 20배 빠른 AI 연산 성능을 발휘하며 FP16 수준의 정밀도를 구현한 TF32(Tensor Float32)를 지원한다. TF32는 기존 어플리케이션의 코드 변환 없이 그대로 사용할 수 있는 것이 특징이며, 이러한 튜닝을 통해 FP32 정밀도 AI 성능을 최대 20배까지 끌어 올렸다. 앙페르의 텐서 코어는 전세대 HPC 어플레케이션에서 최대 2.5배 연산 성능을 발휘할 수 있도록 FP64 연산도 지원한다.

 


앙페르의 또 다른 특징은 MIG(Multi-instance GPU)를 통해 작업 부하에 따라 단일 A100 GPU를 7개의 별도 GPU로 구획을 나눠 작업 정도에 따라 최적의 효율을 제공할 수 있도록 설계되었고, 멀티 GPU를 위한 NVLink도 업그레이드되어 기존 300GB/s에서 600GB/s로 두 배의 속도를 지원한다.

 



여기에 AI 수학(math) 특성을 활용하는 새로운 효율성 기술인 Structural sparsity를 통해 텐서 코어의 TF32/ FP16/ BFLOAT16/ INT8/ INT4 성능을 두 배로 향상 시켜준다. 이처럼 앙페르의 텐서 코어 효율이 높아지면서 볼타 및 튜링과 비교해 SM당 텐서 코어는 8개에서 4개로 줄어들었다.

 


한편, 이처럼 강화된 텐서 코어덕에 앙페르 아키텍처의 A100 코어는 볼타의 V100 코어 대비 FP16 연산 성능은 최대 3배, FP32 성능은 6배 강화되었고, 실제 HPC 작업에서도 최대 2.1배 성능을 제공하는 것으로 소개되었다. 단지, 이번에 발표된 앙페르 아케틱처는 HPC 시장 대응 모델인 영향인 듯 게이밍 성능을 추정할 수 있는 기타 아키텍처 관련 내용은 매우 제한적이어서 아쉬움을 남겼다.

 

 

하드웨어면에서 앙페르 아키텍처의 A100 코어는 TSMC 7nm 공정으로 생산되며, 볼타 V100 코어의 6.7배에 달하는 L2 캐시와 2.3배의 대역폭을 제공하며, 여기에 PCIe 4.0과 40GB의 HBM2를 지원해 VRAM 대역폭은 V100의 900GB/s서 1.6TB/s로 약 70% 확대되었다.

성능 향상을 꾀하면서 TSMC 7nm 공정 도입에도 A100 코어의 TDP는 400W에 달하며, 이는 V100의 300W에 비해 100W(약 33%) 높아진 수치다. SM은 V100의 80에서 A100은 108로 35% 많아졌다.

  태그(Tag)  : 엔비디아, 암페어, 그래픽카드(칩셋)
관련 기사 보기
[벤치] 인텔 코멧레이크와 보는 퍼포먼스 VGA 대결, RX5600XT vs RTX2060 가성비 승자는?
[테크닉] 그래픽카드를 구매하니 노이즈 캔슬링이 공짜?, 엔비디아 RTX Voice
[테크닉] 최고의 게임성능외에 다른 용도 있을까?, 지포스 RTX 2080 Ti 다시 보기
[테크닉] AI로 게임 품질과 성능을 제대로 높였다, 엔비디아 DLSS 2.0 분석
[스페셜] 엔비디아가 RTX 2060 가격 내린 이유는?, AMD 라데온 RX 5600 XT
[벤치] 겨울 방학엔 최신 DX12기반 AAA급 게임을, 라데온 RX 5700와 RTX 2060 Super
태그(Tags) : 엔비디아, 암페어, 그래픽카드(칩셋)     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
수디오, 무선충전 가능 Ett 액티브 노이즈 캔슬링 완전 무선 이어폰 출시
애플, 아이폰 및 아이패드 탈옥 차단 iOS/iPadOS 13.5.1 업데이트
마이크로소프트, 크로미움 기반 새로운 엣지 브라우저 윈도우 업데이트로 교체?
인텍앤컴퍼니, ASUS 게이밍 모니터 ROG Strix XG279Q 예약판매 진행
5GHz 돌파 세계 최고 게이밍 CPU, 인텔 10세대 코어 i9-10900K
특별한 흰색과 은색 조합 메인보드, ASUS ROG STRIX Z490-A Gaming STCOM
인공지능 성능 최대 20배 강화, 엔비디아 차세대 GPU 아키텍처 앙페르 발표
3년전 하이엔드CPU 저리가라, AMD R3 3300X vs Intel i7 7700K
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
게스트 / 20-05-16 19:57/ 자국/ 신고/ 이댓글에댓글달기
성능이 향상된 만큼 가격도 향상되겠군요. AMD 라뎅의 대응이 궁금합니다.
즐거운하루 rbear님의 미디어로그 가기  / 20-06-01 11:13/ 자국/ 신고/ 이댓글에댓글달기
레이트레이싱도 아직 보편화가 되지 않았는데 성능향상에 기능개선 등 꾸준히 가격상승요인만 넘쳐나네요..
닉네임 웹봇방지

홈으로 탑으로
 
 
2020년 06월
주간 히트 랭킹

보드나라 2019 정규직 채용 공고 5
[결과발표] 2020년 1분기 포인트 소진 로또 20
2020년 1분기 로또이벤트 선정관련 안내
[결과발표] 'PC방 점주의 고민, 어떤 플랫 3
[결과발표] 2019년 4분기 포인트 소진 로또 23

실시간 댓글
소셜 네트워크