리뷰
 





 
 
 




전송 2020-05-15 11:17
[취재]

인공지능 성능 최대 20배 강화
엔비디아 차세대 GPU 아키텍처 앙페르 발표

엔비디아에서 GTC 디지털을 여는 젠슨 황 CEO의 기조 연설과 함께, 차세대 GPU 아키텍처인 앙페르(Ampere)를 공식 발표했다.

 

이번에 발표된 앙페르 아키텍처는 컴퓨팅 성능에 집중한 기존 볼타 아키텍처의 연장선 버전으로, 게임 환경에서 실시간 레이 트레이싱 구현을 강조해온 엔비디아의 게이밍용 앙페르 아키텍처는 공개되지 않았다.

 


앙페르 아키텍처에 적용된 텐서 코어는 볼타 - 튜링을 잇는 3세대 텐서 코어로, 기존 FP32 보다 최대 20배 빠른 AI 연산 성능을 발휘하며 FP16 수준의 정밀도를 구현한 TF32(Tensor Float32)를 지원한다. TF32는 기존 어플리케이션의 코드 변환 없이 그대로 사용할 수 있는 것이 특징이며, 이러한 튜닝을 통해 FP32 정밀도 AI 성능을 최대 20배까지 끌어 올렸다. 앙페르의 텐서 코어는 전세대 HPC 어플레케이션에서 최대 2.5배 연산 성능을 발휘할 수 있도록 FP64 연산도 지원한다.

 


앙페르의 또 다른 특징은 MIG(Multi-instance GPU)를 통해 작업 부하에 따라 단일 A100 GPU를 7개의 별도 GPU로 구획을 나눠 작업 정도에 따라 최적의 효율을 제공할 수 있도록 설계되었고, 멀티 GPU를 위한 NVLink도 업그레이드되어 기존 300GB/s에서 600GB/s로 두 배의 속도를 지원한다.

 



여기에 AI 수학(math) 특성을 활용하는 새로운 효율성 기술인 Structural sparsity를 통해 텐서 코어의 TF32/ FP16/ BFLOAT16/ INT8/ INT4 성능을 두 배로 향상 시켜준다. 이처럼 앙페르의 텐서 코어 효율이 높아지면서 볼타 및 튜링과 비교해 SM당 텐서 코어는 8개에서 4개로 줄어들었다.

 


한편, 이처럼 강화된 텐서 코어덕에 앙페르 아키텍처의 A100 코어는 볼타의 V100 코어 대비 FP16 연산 성능은 최대 3배, FP32 성능은 6배 강화되었고, 실제 HPC 작업에서도 최대 2.1배 성능을 제공하는 것으로 소개되었다. 단지, 이번에 발표된 앙페르 아케틱처는 HPC 시장 대응 모델인 영향인 듯 게이밍 성능을 추정할 수 있는 기타 아키텍처 관련 내용은 매우 제한적이어서 아쉬움을 남겼다.

 

 

하드웨어면에서 앙페르 아키텍처의 A100 코어는 TSMC 7nm 공정으로 생산되며, 볼타 V100 코어의 6.7배에 달하는 L2 캐시와 2.3배의 대역폭을 제공하며, 여기에 PCIe 4.0과 40GB의 HBM2를 지원해 VRAM 대역폭은 V100의 900GB/s서 1.6TB/s로 약 70% 확대되었다.

성능 향상을 꾀하면서 TSMC 7nm 공정 도입에도 A100 코어의 TDP는 400W에 달하며, 이는 V100의 300W에 비해 100W(약 33%) 높아진 수치다. SM은 V100의 80에서 A100은 108로 35% 많아졌다.

  태그(Tag)  : 엔비디아, 암페어, 그래픽카드(칩셋)
관련 기사 보기
[스페셜] 8K 정복을 위한 첫 걸음, 기가바이트 지포스 RTX 3090 게이밍 OC
[스페셜] 성능업 가격 동결 RTX 30 시리즈 보기, 기가바이트 RTX 3080 이글 OC
[칼럼] 엔비디아 RTX 30 GPU를 만들다, 재미로 보는 삼성 8nm 공정 이야기
[테크닉] 차세대 RTX 3000 암페어를 준비하자, 이젠 현실로 다가온 PCIe 4.0시대
[스페셜] 스팀에서 잘 나가는 게임을 즐겨보자, 코어 i9-10900K와 RTX 2080 Ti 성능은?
[벤치] 게이밍 모니터 시대 144FPS 도전, INNO3D 지포스 RTX 2080 Ti iChill Black
태그(Tags) : 엔비디아, 암페어, 그래픽카드(칩셋)     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
AMD 라데온 RX 6900 XT 가격은 499달러?
시놀로지, 두 배 이상의 성능을 제공하는 DS1621 플러스 발표
콕스, 게이밍 키보드와 마우스 특별 기획전 진행
RTX 3060은 RTX 2080, RTX 3070은 RTX 2080 Super급 성능?
2배 성능에 가격 동결, 엔비디아 지포스 RTX 30 시리즈 공식 발표
엔비디아 RTX 30 GPU를 만들다, 재미로 보는 삼성 8nm 공정 이야기
비문증과 눈이 침침하고 피곤한 사람에게, 시력보호 모니터 효과 있을까?
마이크로소프트 차세대 콘솔 게임기, Xbox Series S 및 X 출시일 가격 공개
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
게스트 / 20-05-16 19:57/ 자국/ 신고/ 이댓글에댓글달기
성능이 향상된 만큼 가격도 향상되겠군요. AMD 라뎅의 대응이 궁금합니다.
즐거운하루 rbear님의 미디어로그 가기  / 20-06-01 11:13/ 자국/ 신고/ 이댓글에댓글달기
레이트레이싱도 아직 보편화가 되지 않았는데 성능향상에 기능개선 등 꾸준히 가격상승요인만 넘쳐나네요..
닉네임 웹봇방지

홈으로 탑으로
 
 
2020년 09월
주간 히트 랭킹

보드나라 2019 정규직 채용 공고 5
[결과발표] 2020년 2분기 포인트 소진 로또 24
[결과발표] 2020년 1분기 포인트 소진 로또 20
2020년 1분기 로또이벤트 선정관련 안내
[결과발표] 'PC방 점주의 고민, 어떤 플랫 3

실시간 댓글
소셜 네트워크