리뷰
 





 
 
 




전송 2022-10-12 22:00
[스페셜]

압도적 성능으로 개운한 새출발
기가바이트 지포스 RTX 4090 윈드포스 제이씨현

1. 처음 2. 기가바이트 지포스 RTX 4090 윈드포스 제이씨현
3. 안숨겨도 좋았을 RTX 4090 깡성능 4. 두 배 이상 빨라진 레이 트레이싱 성능
5. RTX 4090 성능 향상 쉽게 보기 6. 게임 성능 이상의 작업 성능 개선
7. 지포스 RTX 4090, 최고 성능 갈증 해결

지포스 RTX 30 시리즈는 출시 직후부터 터진 가상화폐 대란에 휩싸여 그 어느때보다 혼돈에 휩싸였던 제품이다. 전문 채굴업자들이 저인망식으로 제품을 채가면서 게이머들은 치솟는 가격과 물건 품귀 현상에 고통 받았고, 엔비디아에서는 대표적인 VGA 채굴 가상화폐인 이더리움 채굴 성능을 낮춘 LHR 버전의 칩을 내놓았지만 완벽한 대안은 되지 못했다.

결국 가상화폐를 둘러싼 난장판을 우려한 여러 국가의 규제 당국이 나서고, GPU 채굴 방식을 쓰던 대표 가상화폐 이더리움이 수차례 연기했던 지분 증명 방식으로의 전환을 다시 한 번 예고하면서 올해 초부터 안정세로 돌아섰다.

 

가상화폐를 둘러싼 난리의 후폭풍은 한동안 계속되겠지만, 아무튼 2020년 9월 출시와 거의 동시에 가상화폐 대란에 휩싸였던 지포스 RTX 30 시리즈는 이제 지포스 RTX 40 시리즈에 자리를 내주고 역사의 뒤안길로 사라져야할 운명과 마주했다.

간신히 안정세로 돌아선 그래픽 카드 시장에 주역으로 새롭게 주목받는 지포스 RTX 40 시리즈. 이번 기사에서는 그중 가장 먼저 출시된 플래그십 모델인 지포스 RTX 4090에 대해 알아보고자 한다.

 

에이다 러브레이스, RT 성능 향상 위한 대형 업데이트

GTC 행사서 발표된 내용을 보면, 지포스 RTX 40 시리즈의 근간을 이루는 에이다 러브레이스(Ada Lovelace, 이하 러브레이스) 아키텍처는 레이 트레이싱 성능과 텐서 코어 성능 향상에 집중하였고, 결과적으로 전 세대와 비교했을 때 레이 트레이싱 성능은 두 배, AI 성능(DLSS)을 결합하면 네 배까지 성능을 끌어 올릴 수 있음을 선언했다.

지포스 RTX 20 시리즈부터 폭발적인 연산 성능이 요구된다고 소개한 레이 트레이싱과 인공 지능 성능 개선에 집중한 아키텍처 에이다 러브레이스는, 영국의 수학자이자 세계 최초의 프로그래머로 평가받는 인물이라는점에서 상징성과 어울리는 설계다.

 

레이 트레이싱과 AI 성능 향상에 집중된 러브레이스 아키텍처의 기본이 SM 유닛 설계와 TPC, GPC 구성은 RTX 30 시리즈와 거의 동일하다. 차이가 있다면 더 많은 GPC와 캐시 용량 정도를 차이로 들 수 있다.

 

러브레이스 아키텍처가 빛을 발하는 부분은 엔비디아가 여러번 강조한 것 처럼 레이 트레이싱과 AI 부분이다. 러브레이스에 더해잔 3세대 RT 코어는 크게 세 가지 부분이 업그레이드 되었다.

첫째는 1세대 대비 네 배, 2세대 대비 두 배 강화된 교차 테스트 성능으로, 교차 테스트는 빛을 추적할 때 트라이앵글 충돌 여부를 테스트하는 것이다. 이에 따라 더 복잡하고 디테일한 객체에 대한 레이 트레이싱도 원활하게 처리할 수 있다. 어플리케이션 패치 없이도 바로 활용 가능하다.

 

두 번째는 셰이더 코어에 대한 의존도를 낮추고 BVH 작업을 개선할 Opacity Micromap Engine과 Displaced Micro-Mesh Engine의 도입이다.

Opacity Micromap Engine은 작은 크기의 나뭇잎이나 화염처럼 알파 채널에 텍스쳐를 입혀 표현되는 객체들을 보다 빠르게 처리하기 위한 것이다. 기존에는 Shader를 호출해 히트와 미스를 판단해야 했지만, 러브레이스에서는 Opacity Micromap Engine으로 가상의 마이크로 맵을 생성해 히트와 미스를 판단, 엣지 부분만 Shader로 불투명도를 판단해 작업량을 크게 줄일 수 있다.

단지, 교차 테스트 성능 향상과 달리 개발자가 Opacity Micromap Engine에 맞춰 패치를 제공해야 한다.

 

Displaced Micro-Mesh Engine은 텍스쳐에 담은 볼륨 정보를 기반으로 객체의 디테일을 향상시키는 기능이다. 객체의 디테일 향상은 그만큼 복잡한 BVH 생성이 필요하지만, 러브레이스는 단순한 BVH와 베이스 트라이앵글로 평가하고, 여기에 볼륨 정보 맵을 결합해 디테일한 객체의 레이트레이싱 작업을 간단하게 처리할 수 있다.

이 기술도 Opacity Micromap Engine 처럼 패치나 업데이트가 필요한 만큼, 향상된 3세대 RT 코어의 레이 트레이싱 성능을 경험하기까지는 조금 더 시간이 걸릴 것이다.

 

3세대 RT 코어의 마지막 핵심 기술은 SER(Shader Execution Reordering)이다.

SER 기술은 지금까지 레이 트레이싱이 작업 종류나 데이터를 구분하지 않고 무조건적으로 처리 했지만, 이를 같은 종류의 작업과 데이터 지역성에 기반하여 재정렬하는 것이다. 엔비디아에서는 이를 CPU의 비순차 실행 방식에 비유하며, 레이 트레이싱 작업에 혁명을 불러올 야심찬 기술이라고 소개했다.

SER은 레이 트레이싱 복잡도가 증가할 수록 효과가 증가해 최대 2배까지 성능 향상을 끌어낼 수 있다고 설명했는데, SER 역시 Opacity Micromap Engine과 Displaced Micro-Mesh Engine 역시 지원 패치가 필요하다.

 

4배 성능 향상의 핵심 DLSS3

엔비디아가 소개한 지포스 RTX 4090 성능 향상의 핵심은 3세대로 업그레이드된 DLSS다.

기본 동작 원리는 DLSS 2와 동일하지만, 여기에 프레임 보간을 통한 프레임을 삽입하는 방식으로 동작하는 것이 DLSS 3의 결정적인 차이점이다. 쉽게말해 TV나 AMD 플루이드 모션과 같은 프레임 보간 기법이 더해진 것.

더 많은 프레임을 넣을 수 있지만, 게이머들에게 민감한 레이턴시 증가나 스터터링 발생 등의 부작용을 감안해 업스케일링 사이에 딱 한 장의 보간 프레임을 생성하는 것으로 타협하며, 레이턴시 감소 기술인 리플렉스(Reflex) 활성화를 강제한다.

 

엔비디아는 DLSS3의 프레임 보간 과정에서 픽셀의 움직임 방향과 크기 정보를 통해 부정확한 프레임 생성을 방지하도록 처리 성능을 두 배 높이고 모션 벡터 분석 알고리즘을 더한 OFA(Optical Flow Engine) 유닛을 추가했다.

OFA는 게임 엔진 모션 벡터 계산에 포함되지 않은 입자, 반사, 그림자, 조명과 같은 픽셀 수준의 정보를 캡처해 보다 자연스러운 이미지를 생성하도록 지원하며, 때문에 DLSS 3는 지포스 RTX 40 시리즈에서만 가능하다. 

DLSS3를 통한 프레임은 GPU 랜더링이 아닌 '생성'인 만큼 프레임 생성 과정에서 시스템 의존도를 크게 낮추고, 결과적으로 프레임 생성 기술을 포함해 최대 4배까지 성능을 증가 시킬 수 있다는 것이 엔비디아의 입장이다.

한편, 게이머 입장는 프레임 생성과 리플렉스를 결합한 DLSS3를 이용하거나, 프레임 생성을 끄고 DLSS2 처럼 사용할 수도 있다.

  태그(Tag)  : GIGABYTE 핫컨텐츠, 제이씨현, 지포스 RTX 40 계열, 그래픽카드(칩셋), 엔비디아
다음페이지.기가바이트 지포스 RTX 4090 윈드포스 제이씨현
관련 기사 보기
[영상] 1월부터 AMD는 왜 그럴까...2023년 1월 PC 최신 뉴스, 해석해드립니다.
[영상] 리퍼비시(리퍼) PC 제품...사도 될까?
[영상] 국내 PC 부품 제조사가 실패한 이유가 뭘까?,[PC흥망사 4-4]
[영상] ARM 인수 불발부터 2023년 전망까지,보드나라 2022년 PC 시장 결산(유튜브)
[영상] 환율은 1300원대 진입했는데 올랐던 PC 가격은 왜 그대로일까?
[영상] RTX 40/인텔아크/AMD RDNA, 2022년 하반기부터 2023년 경쟁과 변수는?
태그(Tags) : GIGABYTE 핫컨텐츠, 제이씨현, 지포스 RTX 40 계열, 그래픽카드(칩셋), 엔비디아     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
콕스, 현장감 넘치는 가상 7.1 채널 게이밍 헤드셋 ‘CH300’ 출시
앱코, 블루투스 이어폰 ‘ATF1000’ 노브랜드 할인 행사
샤오미, 레드미 스마트 밴드2 및 샤오미 헤어 클리퍼 전문가용 이발기 출시
인텔, 아크 VGA 성능 향상 드라이버 추가 개발 중?
Zen4 효율 극대화로 만지는 재미 챙겼다, AMD 라이젠 9 7900
출시 직전 100달러 가격인하 단행, 엔비디아 지포스 RTX 4070 Ti 속내는?
파나소닉 카메라도 위상차 AF 탑재, LUMIX S5II 및 S5IIX 발표
6년만 대규모 업그레이드로 NAS 시장 공략 강화, ipTIME NAS200
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.

newstar newstar님의 미디어로그 가기  / 22-10-13 23:05/ 자국/ 신고/ 이댓글에댓글달기
성능이 압도적이네요. 근데 성능 외의 모든것들도 압도적이라서 뭐라 할말이 없네요, 가격, 발열,소비전력..
닉네임 웹봇방지

홈으로 탑으로
 
 
2023년 02월
주간 히트 랭킹

[결과발표] 2022년 4분기 포인트 소진 로또 26
[결과발표] 2022년 3분기 포인트 소진 로또 24
[결과발표] 2022년 2분기 포인트 소진 로또 25
[결과발표] 2022년 1분기 포인트 소진 로또 33
보드나라 컨텐츠 제작자/기자 채용 공고

실시간 댓글
소셜 네트워크