기획
 





 
 
 




전송 2016-07-29 14:00
[벤치]

윈도우10 시대 새로운 DX12 성능 확인법
3DMark Time Spy

윈도우 10의 등장과 함께 PC 게임 시장에 본격적인 로우레벨 API인 DX12 시대가 도래했지만, 자신의 그래픽 카드가 DX12 환경에서 어느 정도의 성능을 보여주는지에 대한 의문은 쉽게 풀리지 않고 있다.

물론 DX12 지원 게임들이 출시되고 있지만, 최근 게임들은 보통 특정 GPU 개발사와 협력 관계를 맺고 기술지원을 받기 때문에 특정 그래픽 카드에 유리하다는 편향성 논란에서 자유롭기 어렵다.

때문에 게이머나 보드나라같은 미디어들은 특정 GPU에 편향되지 않은 공정한 성능 비교가 가능한 벤치마크의 등장을 기다려왔는데, 대표적인 3D 벤치마크 개발사인 퓨처마크(Futuremark)社에서 타임 스파이(Time Spy)라 명명된 DX12 성능 테스트를 발표했다.

 

공정한 DX 12 성능 테스트, 3DMark 타임 스파이 분석

타임 스파이는 퓨처마크의 자체 DX12 엔진에 기반한 테스트로, DX12를 제공하는 윈도우 10의 개발사인 마이크로소프트와 그래픽 카드의 핵심인 GPU 및 PC의 두뇌에 해당하는 CPU 개발사인 AMD와 인텔, NVIDIA의 피드백을 반영해 개발되었다.

타임스파이는 현재 출시 중인 그래픽 카드의 Direct3D feature level 지원에 차이가 있는 점을 감안해 특정 하드웨어 편향성 시비를 차단할 수 있도록 DirectX 12의 D3D feature level 11_0을 기반으로 설계되었으며, DX11 테스트인 파이어 스트라이크/ 스카이 다이버와 달리 컴바인드 테스트가 제외된 그래픽 테스트 2종과 CPU 테스트 1종의 성능을 종합해 성능을 측정한다.

 

타임 스파이가 D3D feature level 11_0 기반으로 설계되었기 때문에 사실상 DX11 테스트로 여겨질 수 있지만, 싱글 스레드에 작업이 몰려 시스템 자원 활용폭이 낮은 DX11과 달리, DX12는 각 쓰레드 작업을 효율적으로 분산해 시스템 자원 활용도를 높여 동일 시스템에서도 DX11보다 고성능 활용이 가능하다.

실제로 동일 시스템에서 같은 DX11 게임을 윈도우 7에서 실행했을 때와 DX12를 지원하는 윈도우 10에서 실행했을 때를 비교하면 DX12 기반의 윈도우 10에서 실행했을 때 더 높은 성능이 발휘되는 것은 이미 널리 알려진 사실이고, 실제 테스트로도 검증된 내용이다.(참고 : 윈도우 7 vs 윈도우 10 게임 성능 비교 벤치. 승자는?)

 

한편, 타임 스파이는 DX12의 중요 기능 중 하나인 비동기 컴퓨트(Asynchronous Compute)를 지원하는데, 해당 기능을 간단히 설명하자면 유휴(Idle) 쉐이더 유닛의 활용도를 높여 연산 작업과 렌더링 작업을 동시에 스케줄링하여 다중 소스에서 오는 명령어 큐 처리 작업 효율을 높여주는 기술이다.

 

GCN 아키텍처 기반의 AMD GPU에는 그래픽 커맨드 프로세서가 그래픽 세이더를 처리할 동안 컴퓨트 세이더 처리를 위한 ACE(Asynchronous Compute Engines)가 탑재되어 비동기 컴퓨트 처리 효율을 높이는데, ACE는 컴퓨트 세이더 처리를 포함해 전체 컴퓨트 세이더 스케쥴링과 리소스 분배를 담당하며, 최근 선보인 폴라리스 아키텍처는 여기에 하드웨어 스케쥴러를 더해 비동기 컴퓨트 효율을 끌어올렸다.

 

별도 하드웨어를 통해 비동기 컴퓨트 작업을 처리하는 AMD와 달리 NVIDIA의 최신 파스칼 아키텍처는 GPU 단에서 처리하는 프리엠션(Pre-Emption)을 지원하며, 그래픽 면에서는 픽셀 단위로, 컴퓨트 작업에서는 명령어 단위로 세밀한 조정이 가능하다.

우선 순위 재지정 과정에서 필연적으로 레이턴시가 발생하는데, NVIDIA의 발표에 따르면 이때 걸리는 레이턴시는 100μs에 불과하지만 별도 하드웨어와 스케줄러를 활용해 비동기 컴퓨트를 처리하는 AMD GCN 아키텍처에 비해 효율이 낮은 것으로 평가받고 있다.

 

타임 스파이의 비동기 컴퓨트 비중은 프레임당 10% ~ 20% 수준으로, 기본 테스트는 비동기 컴퓨트를 활용하지만, 옵션에서 비동기 컴퓨트 활용을 끌 수 있어 해당 그래픽 카드의 비동기 컴퓨트에 따른 성능 변화폭도 체크할 수 있다.

참고로, 타임 스파이는 비동기 컴퓨트를 포함한 Explicit multi-adapter, 멀티 스레드 GPU 작업 기록과 재출(Multi-threaded GPU work recording and submission), 향상된 자원 배분, 자원 종속(Resource binding), CPU와 GPU, 멀티 GPU( Queues) 동기화등 DX12의 특징들을 지원한다.

타임 스파이 테스트는 3DMark 무료 버전인 Basic Edition 에서도 이용할 수 있지만, 비동기 컴퓨트 옵션 조절과 테스트에 앞서 플레이되는 데모 스킵, 기본 해상도인 QHD 등의 커스텀 설정을 위해서는 추가 비용을 지불하고 구매한 Advanced Edition이나 Professional Editon, 타임 스파이 유료버전이 필요하다.

 

비동기 컴퓨트에 따른 VGA 5종 타임 스파이 테스트, 결과는?

타임 스파이를 최근 출시된 라데온 RX 480과 지포스 GTX 1060 FE, 그에 대응하는 전세대 모델과 지포스 GTX 1070 FE 다섯 종으로 테스트해보았다.(지포스 게임 레디 368.95 핫 픽스 드라이버 / 크림슨 드라이버 16.7.2 베타)

비동기 컴퓨트 유무에 따른 각 그래픽 카드의 성능 변화폭을 살펴보면 파스칼 아키텍처 기반 지포스 모델 2종은 5% 수준인 반면 폴라리스 아키텍처 기반 모델 RX 480은 10%, GCN 1.2 기반 R9 390은 15% 가량 높게 나왔다. 어쨌든 성능 변화가 있는 4종과 달리 맥스웰 아키텍처가 쓰인 지포스 GTX 980은 비동기 컴퓨트 유무와 상관없이 거의 동일한 결과가 나왔다.

 

이를 바탕으로 타임 스파이가 NVIDIA에 유리하도록 설계되었다는 주장이 나와 한동안 논란이 되었는데, 퓨처마크의 공식 입장은 비동기 컴퓨트의 동작 방식과 사용 유무는 '드라이버'와 '하드웨어'에 따라 결정되는 것으로, DX12를 활용한 게임이나 프로그램은 비동기 컴퓨트 수행 방식에 영향을 미칠 수 없다는 것이다.

즉, 타임 스파이에서 비동기 컴퓨트를 활용해 생성한 큐를 전송하더라도 드라이버에서 하나의 큐를 이용해 비동기 작업을 수행하는, 비동기 컴퓨트를 Off한 것과 같은 방식으로 동작하기에 맥스웰 기반 그래픽 카드에서는 성능 차이가 발생하지 않는다고 전했다.

이와 관련된 퓨처마크의 입장은 공식 홈페이지 스팀 포럼을 참고하기 바란다.

 

한편, 그래픽 성능을 우선한 타임 스파이 그래픽 스코어를 확인해보면 이 역시 토탈 스코어와 같은 양상, 즉 파스칼 아키텍처에서는 약 5%, 맥스웰 아키텍처에서는 차이가 없고, 폴라리스 아키텍처 약 10%, GCN 1.2 아키텍처에서는 약 15% 성능 향상이 관측된다.

반면, 그래픽 연산을 최소화한 CPU 테스트 스코어를 보면 GCN 1.2 기반 라데온 R9 390외 다른 그래픽 카드에서는 거의 차이가 없는 것으로 확인된다.

 

DX12 성능 확인, 확실한 것을 원한다면 3DMark Time Spy

1998년부터 선보인 퓨처마크의 3DMark 시리즈는 거의 한 세대가 변하는 세월 동안 계속 업그레이드 되어오며 쌓아온 신뢰로 그래픽 카드 성능 테스트에 표준으로 여겨지며, 마침내 로우레벨 API인 DirectX 12 지원 테스트 타임 스파이를 내기에 이르렀다.

초기에 특정 GPU 제조사 편향 논란이 있었지만 빠르게 가라앉았고, 모든 벤치마크가 그렇듯 실제 게임에서의 성능과 차이가 발생하겠지만, 어쩔 수 없이 특정 GPU 친화적일 수밖에 없는 게임보다 객관적으로 그래픽 카드 성능을 비교할 수 있는 또 다른 기준이 등장한 것은 분명 환영할 일이다.

하지만 테스트 항목이 늘어난 기자에게는 또 다른 고생문이 열렸다

  태그(Tag)  : 윈도우10, 퓨처마크(3dMark), 다이렉트X 12
관련 기사 보기
[테크닉] 멀티태스킹 때문에 게임이 느리고 랙걸린다면,윈도우 10 게임 모드 출동
[벤치] 로우레벨 API 활용 뛰어난 쪽은?,GTX 1060 6GB vs RX 480 8GB
[칼럼] 모바일 기기에 들어간 펜, 고급 모델의 상징인가
[테크닉] 블루스크린의 공포를 빠르게 벗어나기,클릭 몇 번에 끝내는 윈도우 복구
[스페셜] GTX 1070 게이밍 PC를 노트북으로, ASUS ROG GL502VS
[테크닉] 몸 불편한 사람을 위한 윈도우의 배려, 윈도우 보조기술 어떠한것들이 있나?
태그(Tags) : 윈도우10, 퓨처마크(3dMark), 다이렉트X 12     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
인텔 8세대 코어 후속 아이스레이크 확인
인텔 8세대 코어 CPU 싱글 최대 29%, 멀티 최대 65% 성능 개선?
LG V30 UX 공개, OLED 활용한 올웨이즈온 및 플로팅바 지원
인텔 코어 i7 8700K 3DMark 11 성능, 라이젠 7 1700X보다 높다?
메인스트림 CPU의 혁명? 반란?,AMD 라이젠 3 1300X vs 코어 i5 7400
안드로이드 담은 스마트 프로젝터, 소니 엑스페리아 터치
프리미엄 기능 몸값 낮추기?, LG전자 Q6 이어 LG Q8 내달 출시
전후면 듀얼 AMOLED 스마트폰, 메이주 프로7 및 프로7 플러스 발표
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.

프리스트 rubychan님의 미디어로그 가기  / 16-08-05 12:14/ 자국/ 신고/ 이댓글에댓글달기
3DMark 도 초창기엔 용량이 적당했는데 지금은 비대해져서리..

시골 남자 kyta123님의 미디어로그 가기  / 16-08-07 21:41/ 자국/ 신고/ 이댓글에댓글달기
예전 3DMar도 대단했는데
글픽 성능이 그렇게 발전해도
3DMark 손바닥에서 노는 느낌이네요.
닉네임 웹봇방지

홈으로 탑으로
 
 
2017년 08월
주간 히트 랭킹


관련 제품이 없거나, 스펙보드나라 취급 카테고리가 아닙니다.

스펙보드나라 DB는 주요 PC컴포넌트에 한하여 제공됩니다.
보드나라 AM4 메인보드 포럼 관련 최종공지 5
[결과 발표] 2017년 2분기 포인트 소진 로 31
[결과발표] 신개념 와이파이 시스템, 넷기 3
5월 4일, 5월 9일 휴무 안내 2
[이벤트 종료] 2017년 1분기 포인트 소진 21

실시간 댓글
소셜 네트워크