리뷰
 





 
 
 




전송 2018-09-19 22:00
[스페셜]

실시간 레이트레이싱 시대를 열다
기가바이트 지포스 RTX 2080 게이밍 OC

1. 처음 2. 기가바이트 지포스 RTX 2080 게이밍 OC
3. 지포스 RTX 2080, GTX 1080 대비 최대 40% 성능 업 4. 만족스런 게임 성능, 레이트레이싱은?

2년만에 지포스 10 시리즈의 후속작이 등장했다.

엔비디아가 그렇게 강조했던 레이트레이싱의 실시간 구현이 가능해졌고, 다수의 게임 엔진과 타이틀이 엔비디아 레이트레이싱 지원을 표방하고 있지만, 아쉽게도 공식 출시 시점인 9월 20일 기준으로 아직 RTX 기술이 지원되는 게임은 없다.

게다가 게임스컴에서 공개된 RTX 적용 게임의 성능이 처참한 것으로 드러난데다, 지포스 10 시리즈와 비교해 훌쩍 뛰어버린 가격이 결합되면서 그래픽의 재발명이 아니라 가격의 재발견이라는 비아냥까지 들었다.

대부분의 1세대 제품이 피해갈 수 없는 숙명이지만 2년 가까이 기다려온 게이머 입장에서는 좋은 시선으로 보기 어려운 상황이었고, RTX를 제외한 실제 게임 성능은 꽁꼼 숨겨져 왔다.

그리고 오랜 기다림 끝에, 마침내 지포스 RTX 20 시리즈 성능이 공개될 시간이 다가왔다.

 

소비전력과 발열, 어떻게 변했나? 기가바이트 지포스 RTX 2080 게이밍 OC

이번 지포스 20 시리즈의 특이한 점을 꼽자면 바로 레퍼런스로 여겨지는 파운더스 에디션이 AIB 파트너사들의 커스텀 제품처럼 오버클럭된 제품이란 점을 들 수 있다. 그리고 출시전 유출된 제품들도 다들 듀얼/ 트리플 쿨랭팬에 2.5슬롯 ~ 3슬롯 두께의 어마어마한 크기로, 발열과 소비전력에 대한 우려를 높였다.

시장에 출시된 AIB 제조사들의 제품도 레퍼런스 보다 파운더스 에디션과 같이 오버클럭된 제품들부터 등장하고 있으며, 이번 기사에서는 기가바이트의 지포스 RTX 2080 게이밍 OC와 전세대 동급 모델인 지포스 GTX 1080 G1 게이밍 그래픽 카드를 위주로 성능을 알아 보겠다.

일단, 본격적인 기사에 앞서 파운더스 에디션의 듀얼 쿨랭팬 탑재로 우려의 목소리가 높았던 발열과 소비전력을 먼저 확인해 보았다. 비교 제품은 제이씨현에서 국내 유통하는 기가바이트 지포스 GTX 1080 G1 게이밍 그래픽 카드, 아이노비아에서 국내 유통중인 INNO3D iChiLL 지포스 GTX 1080 Ti 를 이용했다.

 

풀 로드 상황은 3DMark Time Spy의 첫 번째 그래픽 테스트를 반복하며 온도와 전체 시스템 소비전력을 측정하였으며, 아이들 상태는 부팅 후 5분이 지난 시점에서 안정화된 결과다.

소비전력 면에서 지포스 RTX 2080은 전작보다 약 20W 높아졌고, 온도는 더 커진 방열판의 덩치에 힘입어 3도 낮아졌다. 전세대 상위 모델인 지포스 GTX 1080 Ti와 비교했을 때는 소비전력과 발열 모두 양호한 특성을 보인다.

 

덩치는 커졌지만 우려했던 것처럼 3슬롯을 차지하지 않아 SLI 구성도 문제없다. 아이들 상태에서도 소비전력과 발열 모두 전작과 특기할 차이는 없어, 출시전 높아진 TDP로 인해 우려했던 소비전력과 발열, 크기 문제는 비교적 자유롭다.

단지, 그를 위해 더 큰 방열판과 새로운 팬 운용 정책같은 쿨링 솔루션 개선이 필요했고, 이번 측정치는 레이트레이싱이 빠진 일반적인 그래픽 연산 환경에서 이뤄졌으므로, 레이트레이싱 작업이 병행될 경우 GPU 자체의 발열과 소비전력은 이보다 높아질 것으로 예상된다.

 

실시간 레이트레이싱을 위한 엔비다아 튜링 아키텍처

지포스 GTX 1080 이후 2년하고도 4개월 만에 예약판매까지 거쳐 출시된 지포스 20 시리즈의 대표 모델 지포스 RTX 2080과 지포스 RTX 2080 Ti.

게이머 입장에서는 성능 정보가 가장 궁금하겠지만, 얼마나 공들여 깎았기에 이렇게 출시가 늦었는지 알아보는 것도 제품 평가에 중요한 일이다. 엔비디아는 튜링(Turing) GPU의 핵심으로 새로운 코어 아키텍처와 RT 코어, 텐서 코어, 향상된 셰이딩 등 네 가지를 들고 있다.

 

이미 알려져있다시피 튜링 아키텍처는 실시간 레이트레이싱 처리를 위해 RT 코어와 텐서 코어가 추가되었다.

 여기에 병렬 실행 단위를 추가하여 부동소수점과 데이터 주소 지정 및 가져오기를 위한 정수 추가, 결과 처리를 위한 부동소수점 비교 또는 최소/최대값 등 비FP 작업, 정수연산 동시 실행을 위한 별도의 경로가 추가되었고, 공유 메모리 통합 아키텍처를 도입해 L1 캐시의 용량과 대역폭을 최대 2.7배 및 2배 향상시키고 L2 캐시 용량을 두 배 높였으며, 이러한 SM 개선을 통해 CUDA 코어 당 성능을 50% 높였다.

 

새로운 병렬 실행 구성과 레이트레이싱을 위한 RT 코어가 튜링 아키텍처에 추가됨에 따라, 파스칼까지의 GPU는 CUDA 코어의 부하가 급격히 불어나서 실시간 레이트레이싱이 불가능한 수준이지만, 레이트레이싱 작업은 RT 코어에 맡겨 버리고 그동안 CUDA 코어는 다른 그래픽이나 연산 작업을 수행할 수 있게 되었다.

엔비디아 레이트레이싱 역시 현실적인 한계로 제한적인 광선 추적과 실시간 레이트레이싱 노이즈 제거 모듈을 통해 구현되지만, 지금까지 불가능했던 실시간 레이트레이싱을 현실적인 수준으로 구현한 것에 의미를 둘 수 있다.

 

이에 따라 지금까지 단순히 쉐이더 처리를 위한 것과는 다른 렌더링 파이프라인 구성이 요구되었는데, FP32의 단정밀도 연산 세이딩 처리 작업 시간과 그 절반 수준의 레이트레이싱 연산 시간, 최신 게임에서 FP32 파이프라인 명령어 100 개당 약 35개의 정수 파이프라인 명령어 처리, DNN 프로세싱으로 명시된 보라색 영역은 딥러닝 슈퍼샘플링(DLSS)과 같은 심층 신경망(DNN) 작업으로 구성된 하이브리드 렌더링 모델을 도입했다.

또한, 지금까지의 단일 파이프라인과 달리 여러 작업이 병행 처리됨에 따라 전체 작업량을 기준으로 RTX-OPS라는 새로운 성능 지표를 사용한다.

 

이렇게 구성된 하이브리드 렌더링은 레이트레이싱과 래스터화 기술을 렌더링 파이프라인에 결합하여 각 장면을 렌더링하는 데 최적화된 방식을 취하는 렌더링 기술로, 하이브리드 렌더링 파이프라인은 객체의 가시성 결정에 유리하며, 2차 광선에 대한 레이트레이싱으로 보다 정확한 반사와 굴절, 그림자 구현이 가능하다.

 

레이트레이싱을 위해 탄생한 RT 코어

엔비디아는 튜링 아키텍처에 실시간 레이트레이싱을 위해 RT 코어라는 새로운 구조를 추가했다.

각 SM에 포함된 RT 코어는 BVH(Bounding Volume Hierarchy)와 레이캐스팅(ray casting, ray/triangle 교차 테스트) 기능을 가속화하며, SM에서 실행중인 스레드를 대신하여 가시성 테스트, 노이즈제거 필터링(denosing filtering) 기술을 통해 실시간 레이트레이싱을 구현한다.

 

 레이 캐스팅은 이미지를 보는 사람의 눈 또는 카메라 뷰에서 하나 이상의 광선을 쏘고 해당 광선이 모든 트라이앵글(triangle)과 교차하는지 확인하는 알고리즘 과정이며, 픽셀을 통과한 광선이 트라이앵글에 닿으면 다시 원점에서 트라이앵글까지 광선의 거리를 결정하고, 트라이앵글의 색상 데이터나 중간에 닿은 다른 물체의 색상과 조명 정보도 가져올 수 있다.

 BVH(Bounding Volume Hierarchy)는 트리 구조의 레이 트레이싱 가속 방식으로, 지오메트리를 둘러싼 상자(bounding box)를 점점 줄여가며 광선을 추적해 들어가게 된다. 만일 다음 프레임이 이전 프레임에 비해 상당한 변경점이 발생하면 새로운 BVH 빌드 작업이 필요할 수 있지만, 대부분 특정 장면만 변경해 작업 처리가 가능하다.

 

레이 트레이싱 작업을 위해 튜링 아키텍처 GPU에 RT 코어가 추가되긴 했지만 추적할 광선이 늘어날수록 작업량이 급격히 증가하므로, 작업 부하를 줄이기 위해 노이즈 제거 기술이 병행된다.

이를 통해 단순히 광선 추적을 통한 반사 뿐 아니라 광원으로부터 멀어질수록 그림자가 흐려지거나 퍼지는 콘택트 하드닝의 사실적인 그림자 구현도 가능하며, AO(Ambient Occlusion) 기술에서 객체의 사실성도 더욱 향상시켜줄 수 있다.

 

개선된 세이딩 기술로 화면 복잡도 높이며 성능 향상

게임 화면 내에 렌더링 객체가 증가는 필연적으로 CPU 의존도를 높이고, 이는 그래픽 성능 하락을 불러온다. 특히, 경쟁사인 AMD 라데온 시리즈에 비해 CPU 의존도가 높은 엔비디아 지포스 시리즈에서는 타이틀에 따라 치명적일 수 있는데, 이러한 문제를 해결하기 위해 튜링 아키텍처에 도입된 것이 바로 메시 세이딩 기술이다.

 

지금까지는 버텍스 셰이더를 사용하여 래스터화를 위한 트라이앵글을 직접 생성하거나, 테셀레이션 셰이더를 사용하여 래스터화를 위한 최종 트라이앵글을 생성하는 등, 오브젝트마드 드로우 콜이 발생했다.

튜링 아키텍처에 도입된 메시 메시 세이더 역시 기능적으로는 동일하지만 유연성을 높이기 위해 공동 스레드 모델을 사용하는 태스크 세이더(Task Shader)와 메시 셰이더(Mesh Shader)를 도입했다.

이를 통해 보다 객체마다 발생하던 드로우 콜을 리스트 단위로 발생시켜 개발자는 더 많은 객체 목록을 GPU에 직접 보낼 수 있게 개선되었으며, 결과적으로 화면에 표시되는 객체를 증가시키거나 품질 또는 프레임 개선 등에 활용할 수 있다. 

 

튜링은 성능 개선을 위해 화면 내 16x16 픽셀 영역에 대해 서로 다른 세이딩 처리 비율로 동작하는 VRS(Variable Rate Shading) 기능도 추가되었으며, 움직임이 빨라 디테일 구분이 쉽지 않은 영역과 정적인 부분의 세이딩 처리 비율에 차이를 두어 GPU 자원을 보다 효율적으로 쓸 수 있다.

 이를 기반으로 컨텐츠 적응형 세이딩, 움직이는 물체에 대한 모션 적응형 세이딩, VR이나 아이 트래킹 시스템 처럼 사용자의 시야 파악이 가능할 경우 중심부와 주변부의 세이딩 해상도를 달리하는 피베에이티드 렌더링(Foveated Rendering) 구현이 가능해진다.

 

인공지능 텐서 코어의 역할은?

튜링 아키텍처의 RT 코어는 레이트레이싱이라는 명확한 목적이 잘 알려져있지만, 볼타 아키텍처에서 도입된 텐서 코어가 게이밍용 튜링 아키텍처에 추가된 이유에 대해서는 알려진 내용이 많지 않았다.

 

NDA가 풀리면서 드러난 내용에 따르면 텐서 코어의 역할은 게임에 대한 실시간 딥러닝을 적용해 그래픽, 렌더링, 다양한 유형의 애플리케이션 성능을 향상시키는 엔비디아 NGX 신경 서비스(Neural Graphics Acceleration Neural Service)의 AI 기능을 가속하며, 튜링 아키텍처에는 SM당 8개의 텐서 코어가 제공된다.

 

NGX AI 기능으로는 그래픽 품질을 높여주면서 성능을 개선하는 딥러닝 슈퍼샘플링(DLSS)을 들 수 있는데, 이는 TAA와 유사한 이미지 품질을 제공하면서 성능을 대폭 향상시켜준다.

TAA가 최종 목표 해상도에서 렌더링한 다음 프레임을 결합하는 반면, DLSS는 더 낮은 입력 샘플 수에서 더 빠른 렌더링이 가능하고, 타깃 해상도와 품질 면에서 TAA 결과와 비슷하지만 연산 부담은 반으로 줄어든다.

엔비디아에 따르면 지포스 GTX 1080 Ti에 TAA를 사용할 때와 비교해 RTX 2080 Ti에 DLSS를 사용하면 두 배의 성능 개선을 기대할 수 있고, TAA보다 선명한 화면을 만들어 준다.

 

이 외에 보간 기능을 더한 슬로우 모션(AI Slow-Mo) 기능이나, 지워진 사진의 보간이나 특정 영역을 자연스럽게 제거하는 등의 작업을 개선하는 인페인팅(Inpainting) 기능등을 쓸 수 있는데, NGX 기능은 지포스 익스피리언스의 기술 프리뷰 버전으로 제공된다.

 

이미지를 해석해 지능적으로 품질(해상도)를 최대 8배까지 높여주는 AI Super Rez 기능도 가능해지는데, 엔비디아는 지포스 익스피리언스 업데이트를 통해 AI UP-RES라는 이름으로 지원을 표방하였다.

현재 알려진 텐서 코어의 역할 중 게이머에게 유용한 기능은 DLSS와 AI Super Rez를 들 수 있지만, 앞으로 어떤 식으로 텐서 코어의 활용 영역을 늘려갈지 귀추가 주목된다.

  태그(Tag)  : GIGABYTE 핫컨텐츠, 제이씨현, 그래픽카드(칩셋), 지포스 20 계열
다음페이지.기가바이트 지포스 RTX 2080 게이밍 OC
관련 기사 보기
[테크닉] 레이트레이싱으로 사라진 프레임 회복기?, 엔비디아 어댑티브 셰이딩 효과 보기
[테크닉] 드디어 구동되는 실시간 레이트레이싱 시대,배틀필드5로 보는 DXR(RTX) 특징은?
[스페셜] 실시간 레이트레이싱을 위한 VGA 마지노선?, 기가바이트 지포스 RTX 2070 게이밍 OC
[벤치] 조텍 VGA로 도전하는 지구 탈환작전, 데스티니 가디언즈(Destiny Guardians)
[테크닉] GPU 깎는 장인 엔비디아?, 차세대 튜링 관련 루머 정리
[테크닉] 게임으로 하나되기,엔비디아 지포스 익스프리언스 5년의 변화
태그(Tags) : GIGABYTE 핫컨텐츠, 제이씨현, 그래픽카드(칩셋), 지포스 20 계열     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
AMD 3세대 라이젠 CPU 추가 유출 정보는 가짜?
소니 PlayStation Classic, 출시 일주일만에 해킹 성공
AMD 7nm 메인스트림 VGA 아키텍처 Navi, 2019년 중순 실제품 등장?
AMD 레이븐 릿지 후속 피카소 APU 긱벤치 정보 확인
갤럭시 노트9에 찾아온 안드로이드 파이, One UI 베타 프로그램 특징은?
성능 한계 달한 Wi-Fi의 사용자 경험 개선,쉽게 보는 이지메시 네트워크
M.2 SSD를 USB 3.1 외장 SSD로, JEYI M.2 to USB 3.1 케이스 3종
라데온 사용자의 필수 언더볼팅 자동화,AMD RS 아드레날린 2019 에디션 발표
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.

신의 myloveu00님의 미디어로그 가기  / 18-09-24 22:04/ 자국/ 신고/ 이댓글에댓글달기
잘 보았습니다. FHD에서는 성능차가 확 나지 않는 군요.

프리스트 rubychan님의 미디어로그 가기  / 18-09-26 12:56/ 자국/ 신고/ 이댓글에댓글달기
성능은 올랐지만 가격 개념은..
즐거운하루 rbear님의 미디어로그 가기  / 18-10-24 13:41/ 자국/ 신고/ 이댓글에댓글달기
성능 향상은 반갑지만, 가격이 너무 올라 부담 되네요..
닉네임 웹봇방지

홈으로 탑으로
 
 
2018년 12월
주간 히트 랭킹

[결과발표]EaseUS 데이터 복구 솔루션 댓글 1
[결과발표] 2018년 3분기 포인트 소진 로또 26
[당첨자발표] 보드나라와 씨게이트가 함께 8
씨게이트 2018 월드컵 이벤트 2차 당첨자 3
[당첨자발표] 보드나라와 씨게이트가 함께 7

실시간 댓글
소셜 네트워크