기획
 





 
 
 




전송 2017-04-07 15:00
[벤치]

로우레벨 API 활용 뛰어난 쪽은?
GTX 1060 6GB vs RX 480 8GB

이미 많은 분들이 소식을 접하셨겠지만, 대표적인 그래픽 카드 벤치마크 프로그램인 3DMark의 API 테스트가 업데이트되면서 AMD 맨틀의 자리를 크로노스그룹의 벌칸(Vulkan) 테스트가 대신하게 되었다.

오픈소스화가 계획되었던 AMD 맨틀은 라데온과 지포스 체제가 굳혀진 이후 PC 그래픽 분야 로우레벨 API의 시초격임에도 여러 사정으로 시장에 주력으로 떠오르지는 못하고 크로노스그룹의 OpenGL을 대체할 로우레벨 API인 벌칸(Vulkan)으로 이어졌다.

 

로우레벨 API 특성상 하드웨어 자원 활용에 유리하지만 그만큼 프로그래밍 난이도가 높기에 아직 DX12나 벌칸의 도입은 걸음마 수준이지만, 라이즈 오브 더 툼 레이더, 기어즈 오브 워 4, 디비전, 히트맨, 문명 6, 배틀필드 1 등 일명 AAA급 타이틀을 중심으로 DX12가 도입되고 있으며, DX12보다 부족하지만 벌칸 역시 둠(2016), 탈로스 법칙, 스타 시티즌 등 최신 타이틀에서 지원이 이뤄지고 있다.

하지만 아직 난이도 때문인지 DX12와 벌칸을 동시 지원하는 타이틀은 아직 없기 때문에 그동안 이 둘의 효율을 직접적으로 비교할 여건이 되지 않았는데, 이번에 3DMark API Overhead Feature Teset가 업데이트되면서 이 둘을 직접 비교해볼 수 있게 되었다.

 

3DMark API Overhead Feature Test, DX12와 벌칸 API의 효율 비교

2015년 3DMark API Overhead Feature Test가 공개되었을 때는 DX11을 기준으로 MS DX12와 AMD 맨틀의 오버헤드를 비교할 수 있었는데, 2017년 3월 업데이트에서는 AMD 맨틀의 사실상 후속 로우레벨 API인 벌칸을 비교할 수 있도록 업데이트 되었다.

테스트  방식은 당시와 동일하게 CPU에서 GPU로의 드로우 콜 (Draw Calls) 명령 전달 처리를 급격히 늘려 초당 FPS가 30에 달할 때까지의 초당 드로우콜을 측정하는데, API의 효율이 높을수록 화면에 그려지는 오브젝트 수가 증가하며, 결과적으로 효율이 높은 API 기반 타이틀은 동일 하드웨어에서 더 높은 그래픽 품질 또는 성능 향상을 꾀할 수 있으며, DX12와 벌칸이 주목받는 것도 이때문이다.

 

위 차트는 지포스 GTX 1070과 라이젠 7 1800X 환경에서의 3DMark API Overhead Feature test 결과로, 위에서 부터 차례대로 FPS/ GPU 로드율/ CPU 클럭이며, 좌에서 우로 각각 DX11 싱글 스레드(ST)/ DX11 멀티 스레드(MT)/ DX12/ 벌칸(Vulkan) 순이다.

보면 알겠지만 하이레벨 API인 DX11에서는 GPU 로드율이 30% 수준을 넘지 못하고 있는데, 이말은 곧 GPU가 낼 수 있는 힘의 70%가 봉인되어 있다는 의미와 상통한다. 반면 로우레벨 API인 DX12와 벌칸에서는 드로우 콜이 증가함에 따라 GPU 로드율이 증가하며 100% 가까이 활용 가능해진다.

한편, DX12와 벌칸의 GPU 로드율 그래프를 비교해보면, DX12는 GPU 로드율이 일정한 수준을 유지하다 어느 순간 급격히 GPU 로드율이 증가하지만 벌칸은 테스트 초기부터 GPU 로드율이 빠르게 상승해 서로 다른 특성을 보여준다.

 둘 중 어느 API의 효율이 더 높을까?

그래픽 카드 시장의 양대 라이벌인 AMD 라데온 RX 480 8GB Ref.와 NVIDIA 지포스 GTX 1060 6GB FE를 통해 비교해 보자.

참고로, 양사의 드라이버는 출시 시기가 비슷한 라데온 소프트웨어 크림슨 릴리브 에디션 17.2.1과 지포스 게임 레디 드라이버 378.66 버전을 이용했다.

 

지포스 GTX 1060 vs 라데온 RX 480, DX12와 벌칸 효율은?

우선, 하이레벨 API인 DX11에서의 드로우콜을 비교하면 지포스 GTX 1060 6GB가 라데온 RX 480 8GB보다 대략 35% 이상 더 높은 것을 알 수 있는데, 양 그래픽 카드 모두 싱글 스레드일 때와 멀티 스레드일 때 드로우콜의 차이가 크지 않다.

DX11에서는 멀티 코어 활용이 극히 제한적인 것으로 해석되는데, 반면 DX12와 벌칸에서는 대략 10배 이상의 드로우콜이 발생하며, DX11에서와 달리 DX12에서는 AMD 라데온 RX 480 8GB의 드로우콜이 더 많이 발생, 결과적으로 더 높은 성능을 기대할 수 있다.

한편, DX12에서와 달리 벌칸에서는 지포스 GTX 1060 6GB FE의 성능이 대략 14% 가량 더 높은 것으로 측정되었는데, 이는 라데온 RX 480의 DX12에서 드로우콜보다 비교해서 약 6.5% 가량 높은 수치다.

각 API별 드로우콜 차이를 이용해 각 그래픽 카드 별 API 효율을 비교해 보면 어떨까?

 

DX11 싱글 스레드를 기준으로 DX12에서 지포스 GTX 1060 6GB FE는 951.37%, 라데온 RX 480 8GB는 1447.16%라는 무시무시한 효율을 보여주며, 벌칸에서는 지포스 GTX 1060 6GB가 1136.87%, 라데온 RX 480 8GB 1353.7% 효율을 발휘한다.

효율만 놓고 봤을 때는 라데온 RX 480 8GB가 DX12와 벌칸 모두에서 지포스 GTX 1060 6GB를 능가하지만, 기준이 되는 DX11 싱글스레드 드로우콜 성능에서 지포스 GTX 1060 6GB가 약 36% 가량 높은 것을 감안하면 효율만으로 양 그래픽 카드의 우열을 결정할 수 없다.

단지, 로우레벨 API를 만났을 때 지포스 GTX 1060 6GB보다 라데온 RX 480 8GB에서 더 많은 성능 향상을 기대할 수 있다는 정도로 해석할 수 있다.

 

GTX 1060 6GB vs RX 480 8GB. CPU 코어와 클럭의 로우레벨 API 영향은?

위에서 지포스 GTX 1060 6GB와 라데온 RX 480 8GB의 로우레벨 API 효율은 라이젠 7 1800X라는, 테스트 시점에서 일반 소비자를 대상으로 나온 단일 CPU 최대 코어/스레드 CPU에서 확인해 보았는데, 아직 메인스트림 시장에서는 쿼드 코어 CPU가 주력인 점을 고려해 라이젠 7 1800X를 쿼드 코어(2+2)로 변형 시켜 다시 테스트했다.

이번 테스트는 8코어 16스레드에서 코어는 반절, 스레드는 1/4인 4코어 4스레드로 줄어든 환경이다. 그래픽 카드에 드로우콜을 내려줄 CPU가 줄어든 만큼 라데온 RX 480 8GB와 지포스 GTX 1060 6GB 모두 전반적인 드로우 콜 측장치는 줄었지만 전반적인 경향은 위와 동일하다.

 그렇다면 라이젠 7 1800X보다 클럭이 낮은 라이젠 7 1700 환경에서는 두 그래픽 카드의 로우레벨 API 성능이 어떻게 변할까? 각 경우의 DX12와 벌칸 성능을 하나의 차트에 모아봤다.

 

우선 DX12와 벌칸 모두 지포스 GTX 1060 6GB와 라데온 RX 480 8GB 동일하게 드로우콜 기준 클럭 영향은 크지 않은 것으로 나타났지만, 코어수 감소에 대해서는 확실한 차이를 보여준다.

DX 12에서 라이젠 7 1800X의 코어와 스레드를 8C/16T에서 4C/4T로 감소시킨 경우 라데온 RX 480 8GB은 약 70%, 지포스 GTX 1060 6GB는 약 84%, 벌칸에서는 같은 조건일 때 라데온 RX 480 8GB는 약 66%, 지포스 GTX 1060 6GB는 약 71% 수준으로 드로우콜이 감소했다.

결과적으로, 로우레벨 API인 DX12와 벌칸에서 라데온 RX 480 8GB가 지포스 GTX 1060 6GB보다 CPU 코어 수에 영향을 더 크게 받는 것으로 나타나, 상대적으로 CPU 선택에 신중해야 한다.

 

로우레벨 API 시대 메인스트림 VGA 선택은?

드로우콜은 CPU가 그래픽 카드로 보내는 실제 작업 명령이라고 이해할 수 있다. 결과적으로 더 많은 드로우콜을 보낼 수 있다는 것은 그만큼 그래픽 카드의 자원을 효율적으로 쓸 수 있다는 의미지 하드웨어적 한계를 극복할 수 있다는 뜻은 아니다.

 

현 시점에서 CPU가 충분히 좋을 경우 DX12 위주인 게이머라면 라데온 RX 480 8GB를, 벌칸 위주인 게이머리면 지포스 GTX 1060 6GB를 선택하면 좋다. 반면 CPU 파워가 조금 부족한 경우라면 DX12와 벌칸 모두 지포스 GTX 1060 6GB를 선택하는 것이 그래픽 카드의 잠재력을 활용하는데 유리할 것이다.

 

한편, 현재 DX12와 벌칸의 로우레벨 API 대결은 윈도우의 절대적인 점유율을 바탕으로 DX12가 우세한 형국이다. 당장 기사 초반에 언급한 DX12 지원 타이틀이 더 많은데, 한가지 주목할 점은 DX12가 윈도우 10 이상에서만 지원하는 반면 벌칸은 윈도우 7 SP1 이상은 물론이고 안드로이드와 리눅스를 포함한 산업 전반에서 지원된다.

 

이에 따라 프로그래밍 난이도가 하이레벨 API인 DX11보다 어렵다고 평가되는 로우레벨 API인 DX12와 벌칸 중 한쪽을 선택해야 한다면 자연히 벌칸을 고르게 될 것이며, 스타시티즌 개발사는 이같은 이유를 들어 DX12과 DX11 지원을 포기하고 벌칸 전용으로 설계할 것이라는 입장을 밝힌 바 있다.

유명 게임 엔진들도 DX12와 함께 벌칸 지원에 나서고 있지만 이미 MS의 DX가 선점한 PC 게임 시장, 엑스박스 원까지 확대된 DX12 지원을 고려하면 게임 시장에서 벌칸의 영향력이 DX12와 대등한 수준에 달하거나 역전하기 쉽지 않을 것이다.

하지만, 기자 개인적으로는 PC 게임 시장에서 버려지다 시피했던 OpenGL의 후속 API가 거대 공룡 MS의 DX12와 경쟁하기 시작했다는 것 만으로도 응원하고 싶어진다.

  태그(Tag)  : 다이렉트X 12, Vulkan, 지포스 GTX 1000 계열, 라데온 RX 400
관련 기사 보기
[스페셜] 고사양 PC 게임을 위한 선택, HP OMEN 데스크탑 880
[스페셜] 4K 게이밍 정복 이번에는 성공할까?,NVIDIA 지포스 GTX 1080 Ti FE
[테크닉] 지뢰찾기 오버워치는 물론 스팀 AAA급 게임까지,게이밍 PC의 빅 픽처 그리기
[테크닉] 7세대 코어 vs 6세대 코어 프로세서?, 어떤 노트북을 사야 하나
[테크닉] 보조전원 있는게 좋을까 없는게 좋을까?,지포스 GTX 1050 Ti 오버클럭 비교
[스페셜] 메인스트림 게이머에 참을 수 없는 유혹,이엠텍 HV 지포스 GTX 1050 Ti OC
태그(Tags) : 다이렉트X 12, Vulkan, 지포스 GTX 1000 계열, 라데온 RX 400     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
인텔 커피레이크 가격 유출, 9월 16일 출시?
인텔 8세대 코어 CPU 싱글 최대 29%, 멀티 최대 65% 성능 개선?
인텔 8세대 코어 후속 아이스레이크 확인
삼성전자, 더 작고 빨라진 포터블 SSD 'T5' 전세계 출시
메인스트림 CPU의 혁명? 반란?,AMD 라이젠 3 1300X vs 코어 i5 7400
안드로이드 담은 스마트 프로젝터, 소니 엑스페리아 터치
프리미엄 기능 몸값 낮추기?, LG전자 Q6 이어 LG Q8 내달 출시
전후면 듀얼 AMOLED 스마트폰, 메이주 프로7 및 프로7 플러스 발표
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.

쿠로링 lswrome님의 미디어로그 가기  / 17-04-07 15:47/ 자국/ 신고/ 이댓글에댓글달기
valkon amd가 처음 참여해서 만든API인데 엔비디아에 밀라디니 ㅋㅋㅋ

모든 개발을 DX12로 했구만 ㅋㅋㅋ

블루워터 / 17-04-08 7:13/ 자국/ 신고/ 이댓글에댓글달기
ati시절부터 쓰던 감성이 있어서, 그 후로
계속 radeon 만 쓰게 됩니다. 지금은 rx480 쓰고 있고요..
heaye / 17-04-08 20:57/ 자국/ 신고/ 이댓글에댓글달기
AMD가 몇년쓰다 버린 API들이 꽤 많음.
하복도 쓰다 버렸고, 꼴랑 2~3년 썼음?
openGL 도 쓰다 버렸고,
멘틀도 쓰다 버렸고,
불칸도 쓰다 버렸고,
DX12...
Zzzzz

nVIDIA가 피직스 하니까, 배알꼴린 AMD가 스스로 만들진 않고, 인텔 하복가따쓰다가,
하복이 인텔꺼라서 배알꼴린 AMD가 하복버리고 멘틀 개발에 참가했다가,
멘틀 성능 안나오니까, 스마트폰쪽에서 뜨는 불칸 써보겠다고 멘틀 버리고,
불칸 써보겠다고 하니까, DX12가 MS사에서 나왔네?

앞으로 AMD의 행보도 뻔함
MS사에서 DX12하는거, PC쪽에선 거부할 수 가 없으니 따라가긴 하겠지만(더구나 AMD가 더 성능도 잘나오니), 결국은 또 머시기 하겠다고 버리고 나올꺼임.

AMD가 애플하고 비슷한게,
경쟁사의 기술을 무척이나 싫어함.

그린데이 / 2017-04-11 11:25/ 자국/ 신고/
이분 댓글 무의미...자국꺼도 아닌데 이렇다 저렇다 뭔 말이 많을까요? 차단 플리즈

꾸냥 / 17-04-16 11:18/ 자국/ 신고/ 이댓글에댓글달기
-On Mobile Mode -
엔당이 로우레벨 효율이 좋다는건 그만큼 cpu의존적이라는 뜻이겠죠
어느쪽이 좋다고 결론내리긴 이르다고 보네요
닉네임 웹봇방지

홈으로 탑으로
 
 
2017년 08월
주간 히트 랭킹


관련 제품이 없거나, 스펙보드나라 취급 카테고리가 아닙니다.

스펙보드나라 DB는 주요 PC컴포넌트에 한하여 제공됩니다.
보드나라 AM4 메인보드 포럼 관련 최종공지 5
[결과 발표] 2017년 2분기 포인트 소진 로 31
[결과발표] 신개념 와이파이 시스템, 넷기 3
5월 4일, 5월 9일 휴무 안내 2
[이벤트 종료] 2017년 1분기 포인트 소진 21

실시간 댓글
소셜 네트워크