기획
 





 
 
 




전송 2019-06-25 10:00
[테크닉]

이제는 하이엔드 경쟁 가능할까?
AMD Navi GPU의 RDNA 아키텍처 보기

지난 2011년 라데온 HD 7000 시리즈를 시작으로 사용된 AMD GPU의 대표 아키텍처인 GCN(Graphic Core Next)는 3D 연산과 GPGPU를 모두 잡겠다는 설계 이념을 도입, 당시에는 나름 혁신적인 아키텍처였지만 GPU가 모든 일을 처리하는 방식을 고집하면서 GPU의 부담이 크고, 이는 발열과 소비전력 상승으로 이어졌다.

GCN은 라데온 RX 400 시리즈까지 4세대의 변화를 거쳤지만, 근본적인 아키텍처의 한계상 게이밍 성능에 집중하고 CPU 의존도를 높인 엔비디아의 지포스 그래픽 카드에 비해 하이엔드 경쟁에서 맥을 추지 못했고, 결국 게이밍은 지포스라는 인식이 깊게 뿌리박히는데 한 몫했다.

 

그러던 AMD가 마침내 GCN 아키텍처를 버리고 RDNA라는 새로운 아키텍처를 도입한 Navi GPU를 7월 7일 출시한다는 내용을 E3에서 밝혔다. 당시 내용에 따르면 RDNA 아키텍처는 Vega 아키텍처 대비 IPC는 25%, 소비전력대 성능은 50% 향상되었다.

Navi GPU가 전세대 라데온 RX 500 시리즈와 같이 메인스트림 게이밍 그래픽 카드에 대응하는 제품이고, 라데온 RX 500 시리즈는 당시 지포스 GTX 1060 6GB급의 성능이 한계였다는 것을 감안할 때, 결과적으로 엔비디아의 최신 준하이엔드급 그래픽 카드인 지포스 RTX 2070에 비교할 수 있는 성능을 끌어낸 RDNA 아키텍처의 잠재력을 짐작할 수 있다.

 

특히, 이번에 공개된 제품이 라데온 RX 5700 시리즈로, 보다 고성능의 라데온 RX 5800 시리즈도 예상되는 만큼, 이제 하이엔드 게이밍 그래픽 시장에서의 본격적인 경쟁을 기대할 수 있을 것이다. 

이번 기사에서는, CPU 시장에서 인텔의 독주에 제동을 건 라이젠에 이어 하이엔드 게이밍 그래픽 카드 시장에서 엔비디아의 독주에 제동을 걸어줄 것으로 기대를 모으고 있는 AMD Navi GPU의 핵심인 RDNA 아키텍처에 대해 조금 심도 있는 내용을 정리했다.

 

 

명령 처리 방식 변경으로 CU 효율 증가

AMD가 RDNA를 발표하며 강조한 것은 8년간 사용되면서 구식이 되어버린 GCN 아키텍처의 효율 개선 작업이었다. 이를 위해 CU 디자인의 변경과 다층 캐시 구조, 그래픽 파이프라인의 간소화를 강종했으며, RDNA 아키텍처에 대해 알아보는 이번 기사 역시 이들 세 가지를 위주로 진행한다.

 

AMD가 RDNA 아키텍처의 주요 변경 사항으로 내세운 CU(compite Unit) 디자인을 보면, 스칼라 유닛과 스케쥴러를 조절해 확대해 명령어 처리 능력을 두 배로 높였고, SIMD 유닛을 16way에서 32way로 확대한 대신 4개의 SIMD 유닛으로 구성되던 GCN과 달리 2개의 SIMD 유닛으로 구성된다.

 

공유 스칼라 유닛과 벡터 유닛도 1개에서 2개로 늘렸고, 이를 통해 AMD GPU에서 한 번에 처리하는 스레드 처리 단위인 Wavefront를 64개에서 32개로 줄이면서 CU 2개를 묶은 '듀얼 CU' 구조를 택해 효율을 높였다.

이러한 구조를 통해 최대 2배의 ALU, 2배의 레지스터와 4배의 캐시 대역폭 접근이 가능해졌다.

 

예를 들어, GCN 아키텍처는 1개의 Wavefront 64 처리를 위해 GCN 아키텍처에서는 16way SIMD이 1개의 스칼라 유닛을 사용해 3개의 SIMD가 유휴 상태에 빠진 상태로 작업 처리에 4사이클이 소요되는 반면, RDNA 아키텍처는 스칼라 유닛을 확대해 32개 단위로 Wavefront를 사용하고 32way SIMD 두 개가 동시에 작업을 처리할 수 있어 1 사이클에 작업을 처리하게 된다.

RDNA는 GCN에서와 같이 64개 스레드 단위 처리 지원을 위해 CU 2개를 바인딩한 '듀얼 CU' 구조를 택했는데, 이 경우 SIMD 유닛이 서로 다른 레지스터를 사용하기에 처리 사이클이 한 번 더 늘어나지만 여전히 GCN에 비해 높은 효율을 기대할 수 있다.

 

또한, GCN 아키텍처에서는 일반적인 비동기 컴퓨트 작업 중 비동기 엔진이 그래픽 파이프라인을 완전히 정지 시킬 수 없던 것과 달리, RDNA 아키텍처는 완전 정지가 가능하도록 개선되어 비동기 엔진이 진행 중인 컴퓨트 작업을 완료하는 동안 또 다른 작업 스케쥴링이 이뤄지는 것을 방지해, 우선 순위가 높은 작업에 대한 처리 효율을 높였다.

여기에 중앙화된 지오메트리 프로세서를 통한 균등 작업 배분, GCN의 32보다 두 배 늘어난 Vega 56// 64급의 64 ROP를 지원해 렌더링 성능을 끌어 올렸다. 직접적인 비교는 어렵지만, 이번 라데온 RX 5700 시리즈의 성능 개선에는 그동안 엔비디아 지포스 시리즈에 비해 부족했던 ROP 확보도 큰 영향을 미친 것으로 판단된다.

 

CU와 메모리 사이 캐쉬 추가, GPU 내부에도 압축 기술 적용

AMD가 RDNA에서 강조한 부분 중 하나가 바로  다층 캐시 구성을 통한 레이턴시 개선과 대역폭 증가, 소비전력 개선이다.

이를 위해 AMD의 RDNA 아키텍처에는 CU에 종속된 L1 캐시, 메모리와 직접 연결된 L2 캐시 사이에 새로운 캐시를 적용했다. RDNA 아키텍처에서는 캐시 계층을 추가하면서 GCN에서의 L1 캐시는 L0 캐시로, 새롭게 추가된 중간 캐시를 L1 캐시로 명명했다.

모든 CU가 L2 캐시로 연결된 GCN과 달리, RDNA는 다섯 개의 CU를 한 단위로 데이터를 공유하는 L1 캐시 구조로 적중율을 높여 레이턴시가 23% 개선되었고, L0 캐시와 ALU 사이의 대역폭을 2배로 늘려 21%의 레이턴시 개선 효과를 이루어냈다.

 

RDNA의 또 다른 변화는 GPU 내부 데이터 전송에도 활용하도록 수정된 DCC(Delta Color Compression) 정책이다.

지금까지 DCC는 메모리 컨트롤러와 메모리 버퍼 사이에만 적용했던 압축 기술이지만, RDNA에서는 GPU 내부의 DCC 처리를 위해 메모리 컨트롤러에 연결 됐던 랜더 백 앤드를 CU 구조에 통합해 쉐이더가 압축된 컬러 데이터를 처리할 수 있게 되었다.

덕분에 DCC 데이터를 랜더링 파이프 라인 전반에 사용할 수 있게 되면서, 그만큼 GPU 내부 데이터 전송 효율 개선 효과를 기대할 수 있다.

 

미디어 엔진, 아직은 부족한 8K 미디어 가속 지원

그래픽 성능과는 별도로, AMD는 GCN 아키텍처의 플루이드 모션 덕에 엔비디아와 비교해 멀티미디어 PC로 높은 평가를 받고 있다. 하지만 영상 컨텐츠가 단순 4K를 넘어 더욱 고품질 추구를 위해 HDR과 8K 대응이 요구되는 상황에서, GCN (폴라리스) 아키텍처로는 한계가 있다.

라데온 RX 400 시리즈에 지원된 미디어 엔진의 인코딩 성능은 H.264에서 최대 4K30, HEVC에서 4K60을 지원하며, 디코딩 면에서는 H.264 4K120과 HEVC 4K60(Main-10)을 지원했는데, RDNA의 미디어 엔진은 이를 더욱 강화했다.

 H.264은 최대 4K150 디코딩과 4K90 인코딩을, HEVC 영상은 최대 8K24 디코딩 및 4K60 인코딩, VP9에 대해서는 4K90 및 8K24 디코딩이 가능해졌다. 추가 확인된 바에 따르면 H.264에서는 8K30 디코드가 가능하지만, 관련 업계에서 준비 중인 8K 시대 대응에는 아쉬운 면이 있다.

한편, RDNA 미디어 엔진은 HDMI 2.0 및 DP 1.4 HDR 규격과 Dispaly Stream Compression 1.2a, MPO(multi-plane overlay protocol)를 통한 저전력 모드로 아이들 상태와 비디오 재생시 소비전력을 줄여준다.

 

RDNA의 실시간 레이트레이싱 대응, 쉐이더로 처리

사전에 알려진 바와 같이 AMD의 RDNA 아키텍처는 실시간 레이트레이싱을 위한 별도 하드웨어 지원은 없는 것으로 확인되었다.

아직 AMD의 레이트레이싱 지원은 GCN과 RDNA 모두 쉐이더 기반으로 지원하지만 프로렌더와 라데온 레이로 구현하는 방식이라서 현재로써는 DXR 기반의 레이트레이싱은 사용이 불가능하다.

차세대 RDNA 아키텍처에서는 전담 프로세서를 통한 하드웨어 가속 지원을 약속하였는데, 이후 AMD의 레이트레이싱 비전에는 클라우드 컴퓨팅을 통한 풀 스크린 레이트레이싱 지원이 포함된 것이 눈길을 끈다.

구체적인 내용은 알려지지 않았지만 엔비디아의 DLSS와 같이 딥러닝을 통해 사용자 시스템의 자원 소모를 최소화하는 기법이 쓰일 것으로 예상해볼 수 있다. 특히, 2020년 출시 예정인 MS와 소니의 차세대 콘솔은 AMD의 Zen2 CPU와 Navi 기반 GPU가 통합된 커스텀 SoC가 쓰인다.

이들 콘솔에는 별도의 레이트레이싱 가속 하드웨어가 추가될 것으로 예상되고 있는데, PC에 비해 성능 제약이 심한 콘솔을 포함한 메인스트림급 PC에서의 원활한 레이트레이싱 지원을 위한 전략으로 예상된다.

 

더욱 나은 게이밍 경험을 위해, 라데온 안티 랙(Radeon Anti-Lag)

AMD가 RDNA 아키텍처와 라데온 RX 5700 시리즈를 발표하며 언급한 내용 중 게이머들의 관심이 높은 내용을 꼽자면, 게이머의 입력이 화면에 실제 반영되기까지의 레이턴시(Latency), 다른 말로 지연 시간이나 인풋 랙(Input Lag)이라고도 불리는 시간 차이를 줄여주는 안티 랙 기능을 들 수 있다.

 

기존에는 CPU와 GPU가 각자의 사이클로 작업하기에 게이머가 화면을 보고 입력하는 사이 프레임이 추가되어 사용자의 입력 반응이 밀려 랙이 발생하며, GPU 부하가 늘어나 게임 FPS 낮아지면 랙이 커지는 경향이 있다.

AMD 라데온 안티 랙은 GPU 프레임 비율에 맞춰 CPU의 게임 처리 사이클을 동적으로 조정, 게이머의 조작이 다음 렌더링에 반영되는 시간을 줄여 랙을 감소 시킨다는 컨셉의 기술이다.

드라이버에서 API를 호출할 때 안티 랙이 적용되므로 API에서 직접 그래픽 파이프라인을 제어하는 DX12나 벌칸에서는 안티 랙 지원이 어렵고, RDNA 아키텍처 GPU에서는 DX9 및 DX11, Vega 이전 세대 아키텍처에서는 DX11 게임을 지원하는 것으로 알려졌다.

기술 특성상 프레임과 게이머의 반응 속도가 중요한 이스포츠 타이틀에서 특히 유용할 것으로 기대된다.

 

화면 품질 Up, AMD FidelityFX & Radeon Image Sharpening

AMD는 RDNA와 라데온 RX 5700 시리즈를 발표하며 GPU 부하를 최소화하며 이미지 품질 향상을 가능케하는 AMD FidelityFX와 이미지 샤프닝 기술도 발표했다.

 

오픈 소스 이미지 퀄리티 툴깃으로 개발된 AMD FidelityFX는 AMD의 RDNA와 Vega, GCN 및 NVIDIA GPU에서도 사용 가능하기 때문에 RDNA 한정 기술은 아니지만, 양사의 경쟁 관계를 감안할 때 엔비디아에서 지원할 가능성은 높지 않을 것으로 판단되므로, 현 시점에서는 AMD 전용 기술로 정착될 가능성이 높다.

AMD FidelityFX는 CAS(Contrast Adaptive Sharpening) 필터를 포함한 포스트 이펙트 쉐이더 라이브러리의 명칭으로 GPUOpen을 통해 공개될 예정이며, 범용 라이브러리이기는 하지만 AMD Navi와 Vega 아키텍처의 Rapid Packed Match에서 최상의 결과물을 제공하도록 개발되었다.

 

AMD Radon Image Sharpening은 AMD FidelityFX의 CAS 필터를 라데온 그래픽 카드의 드라이버인 라데온 소프트웨어의 설정에서 바로 적용할 수 있도록 만든 것으로 볼 수 있는데, 픽셀 주변의 휘도 변화를 파악하고 실제 렌더링 해상도보다 높게 렌더링했을 때 주변 픽셀 밝기 변화를 추측해 주변 픽셀에 적용한다.

AMD의 발표에 따르면 Radeon Image Sharpening 적용시 그래픽 성능에 미치는 영향은 1% 내외이며, 성능을 위해 그래픽 옵션을 하향 조정하는 게이머들에게 좀 더 나은 게이밍 경험을 제공해줄 수 있을 것으로 기대된다.

  태그(Tag)  : AMD, AMD RDNA, 그래픽카드(칩셋), AMD Navi, 라데온 RX 5000
관련 기사 보기
[스페셜] TU104 풀칩으로 강해진 RTX 2080의 등장, 기가바이트 어로스 지포스 RTX 2080 Super
[테크닉] 오랫만의 행복한 VGA 선택 고민 시대, 브랜드를 알면 내게 맞는 제품이 보인다?
[스페셜] 게이머를 위한 깜짝 선물, AMD 라데온 RX 5700 시리즈
[스페셜] AMD 50주년 중심에서 외친 완전 경쟁, 라이젠 7 3700X와 라이젠 9 3900X
[테크닉] 게이밍 CPU 16코어 시대 대비, AMD 3세대 라이젠 아키텍처 프리뷰
[칼럼] 단순히 성능만 중요한게 아니라지만, 결국 성능으로 귀결되는 게이밍 PC 가이드
태그(Tags) : AMD, AMD RDNA, 그래픽카드(칩셋), AMD Navi, 라데온 RX 5000     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
MSI, 메인보드 바이오스의 AMD 라이젠 지원 용량 공개
5% 예금에 낚였다, 카카오뱅크 천만위크 이벤트에 고객 불만 쏟아져
큐냅 NAS 노린 eCh0raix 랜섬웨어 경고 발령
소니, 풀프레임 미러리스 카메라 a7R IV 발표
3세대 라이젠을 위한 균형잡힌 X570 보드, ASUS PRIME X570-PRO CSM STCOM
AMD 50주년 중심에서 외친 완전 경쟁, 라이젠 7 3700X와 라이젠 9 3900X
이제는 하이엔드 경쟁 가능할까?, AMD Navi GPU의 RDNA 아키텍처 보기
게이머를 위한 깜짝 선물, AMD 라데온 RX 5700 시리즈
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
즐거운하루 rbear님의 미디어로그 가기  / 19-06-28 16:21/ 자국/ 신고/ 이댓글에댓글달기
이번에는 어느 정도 경쟁을 할 수 있는 제품이 출시되길 기대합니다.
보드나라 / 19-06-30 8:04/ 자국/ 신고/ 이댓글에댓글달기
꼼꼼하고 분석적 기사, 좋습니다^^

전투기 f15cc님의 미디어로그 가기  / 19-07-04 17:26/ 자국/ 신고/ 이댓글에댓글달기
AMD 가 나날이 발전하는 모습을 보여주는것 같네요..
한동안안수렁에서 허우적 댔는데..
보드나라 / 19-07-07 13:30/ 자국/ 신고/ 이댓글에댓글달기
AMD와 인텔의 기술력 차이가 좁혀지고, 종이 한 장 차이???
압도적인 강자를 추월하기는 매우 어렵겠지만
모든 성능에서 인텔을 능가하길 기대합니다
닉네임 웹봇방지

홈으로 탑으로
 
 
2019년 07월
주간 히트 랭킹

보드나라 2019 정규직 채용 공고 2
[결과발표] 2019년 2분기 포인트 소진 로또 13
[결과발표] 2019년 1분기 포인트 소진 로또 17
[결과발표] 2019년 새해맞이 덕담 남기기 9
[결과발표] 2018년 4분기 포인트 소진 로또 26

실시간 댓글
소셜 네트워크