기획
 





 
 
 




전송 2013-01-23 13:00
[테크닉]

트리니티 APU로 살펴본 내장 GPU 성능 향상 방법은?

새로운 CPU 등장과 함께 꾸준하게 증가하는 메모리 클럭


인텔과 AMD 양사는 프로세서 성능 경쟁을 위해 다양한 기술을 소개해 왔으며 현재는 와트당 성능비 개선에 보다 주안점을 두고 프로세서를 개발하고 있다.

프로세서에 적용되어 성능 향상을 이끌고 있는 주요한 기술은 현재 네이티브 코어 구성, 시스템 성능 향상을 위한 메모리 컨트롤러와 시스템 버스로 사용되는 인텔의 QPI (QuickPath Interconnect), AMD의 하이퍼트랜스포트 (Hyper-Transport) 등이 대표적이다.

프로세서의 이같은 성능 향상을 위한 기술은 최근에 등장하는 인텔과 AMD 프로세서에 대부분 공통적으로 적용하고 있는 기술로 이들이 공개된 초기에는 시장에 반향을 불러일으키기도 했지만 현재는 널리 사용되면서 기본적인 기술로 받아들여지고 있다.

 

CPU에 메모리 및 PCIe 컨트롤러에서 내장 GPU까지 통합


최근에는 이들 프로세서의 성능 향상을 위해 적용되는 기술 외에 인텔 및 AMD가 지향하고 있는 프로세서 개발 방향은 CPU와 GPU가 하나의 다이에 내장된 통합 프로세서다.

CPU와 GPU가 하나의 다이에 통합되는 과정에 앞서 CPU는 메모리 컨트롤러와 PCI-Express 레인 (Lane) 등의 노스브릿지 기능이 통합되었으며 현재는 여기에 내장 GPU까지 모두 통합했다. 미세공정의 도움으로 전력 관리 향상, 그리고 궁극적으로는 사우스브릿지 기능 역시 하나의 다이에 통합될 것으로 알려졌다.

 

메모리 컨트롤러를 먼저 적용한 AMD 애슬론64 프로세서

데스크탑 프로세서에 메모리 컨트롤러를 먼저 탑재한 CPU 제조사는 AMD다. AMD는 x86 호환 프로세서를 만들어왔지만 애슬론 브랜드 프로세서를 만들면서 인텔과 본격적으로 경쟁을 시작했으며 아키텍처의 큰 전환은 애슬론64 프로세서에서 진행되었다.

특히 그동안 CPU와 노스브릿지 (MCH 또는 내장 그래픽 포함 GMCH)와 사우스브릿지로 구분되어 있던 플랫폼에서 노스브릿지의 주요한 기능 중의 하나인 메모리 컨트롤러를 CPU 내부에 탑재한 것이다.

메모리 컨트롤러의 CPU 탑재로 그동안 메모리 컨트롤러와 노스브릿지, CPU를 거치면서 발생하는 메모리 대역폭 손실과 지연시간 (레이턴시, Latency)를 크게 줄여 전반적인 시스템 효율 향상이 가능해졌다.

 

과도기를 거친 CPU+GPU 통합 클락데일 프로세서

이러한 메모리 컨트롤러의 통합은 인텔 프로세서에도 적용되는데 인텔은 메모리 컨트롤러를 하이엔드 블룸필드 (Bloomfield) 프로세서에 적용된 네할렘 (Nehalem) 마이크로아키텍처를 도입하면서 본격적으로 CPU에 통합하기 시작했다.

그러나 메인스트림은 클락데일 (Clarkdale)은 메모리 컨트롤러와 내장 그래픽 (iGPU)이 포함된 GMCH가 CPU와 하나의 다이에 MCM (Multi Chip Module) 방식으로 서로 분리되는 과도기를 거친다. 클락데일은 이러한 이유로 메모리 컨트롤러가 위치한 GMCH와 CPU를 QPI버스로 연결해 지금보다 복잡한 과정을 거치므로 CPU에 직접 메모리 컨트롤러가 통합된 현세대와 달리 메모리 대역폭에 손실이 발생할 수 밖에 없는 구조를 가졌었다.

린필드 (Lynnfield)에서는 클락데일과 달리 노스브릿지의 기능인 PCI-Express 컨트롤러와 메모리 컨트롤러가 CPU에 통합되면서 시스템의 효율을 향상했다. 이때까지 인텔은 CPU와 GPU 통합 프로세서, 노스브릿지 기능을 통합한 CPU로 프로세서를 나누었고 이후 샌디브릿지를 발표하면서 이와 같은 구분은 더 이상 사용하지 않게 되었다.

 

CPU와 GPU 통합한 샌디브릿지와 트리니티 APU

인텔은 샌디브릿지 (Sandy Bridge), AMD는 트리니티 (Trinity) APU가 CPU와 GPU를 통합하는 방향으로 설계되고 있는데 이들 두 프로세서는 공통적으로 CPU와 GPU를 통합하면서 메모리 컨트롤로와 PCI-Express 컨트롤러를 비롯한 노스브릿지 기능을 통합하고 있다.

인텔은 내부적으로 링버스 아키텍처를 통해 CPU와 캐쉬, 그래픽코어와의 유기적 연결을 통해 처리 효율을 개선한다. APU는 CPU와 GPU의 유기적인 통합에 더욱 박차를 가하고 있으며 보급형 외장 그래픽급의 높은 성능을 가진 내장 GPU를 통합한 것이 특징이다.

 

CPU와 GPU 통합은 새로운 가능성과 문제를 동시에 제시


AMD와 인텔의 이와같은 CPU와 GPU 통합은 편의를 위해 내장 GPU의 성능과 기능 향상 요구와 불필요한 저가형 외장 그래픽 구입을 위한 비용 부담, 그리고 미세공정 도입 등의 기술력이 합해지면서 가능해졌다.

 

하나의 다이에 CPU와 GPU가 내장된 통합 프로세서

CPU와 GPU가 통합되면서 CPU와 GPU의 보다 유기적인 구성과 활용, 그리고 별도의 외장 그래픽 없이도 메인보드의 출력을 통해 시스템을 구성할 수 있게 되었으며 외장 그래픽을 구입하는 비용을 최소화할 수 있게 된 것도 과거와 달라진 부분이다.

그런데 이와 같은 CPU와 GPU 통합은 또다른 문제를 야기했다. 그 중에서도 CPU와 GPU 성능 향상과 직결되는 메모리 대역폭 문제가 최근 대두되기 시작했다.

이는 CPU의 성능 향상 외에도 인터넷이나 가벼운 작업에 그쳤던 과거와 달리 HD 영상 재생이나 3D 스테레오, 옵션과 해상도 타협으로 게임을 즐길 수 있는 수준까지 내장 GPU의 성능이 향상되면서 상황은 달라진 것이다.

 

CPU와 GPU 대역폭 공유, 성능위해 메모리 클럭 지속적 향상


CPU와 GPU의 통합 이전에는 CPU가 요구하는 메모리 대역폭 또는 그 이상을 제공하면 시스템 성능 향상이 가능했다. 그런데 통합 프로세서는 CPU와 GPU 각자가 필요로 하는 대역폭이 서로 다르다. 그럼에도 불구하고 메모리 컨트롤러는 CPU와 GPU를 모두 고려하지 않고 공통적으로 사용되기 때문에 어느 한쪽에서 필요로 하는 대역폭이 부족하면 병목현상이 발생할 수밖에 없는 구조다.

특히 최신 CPU에 내장되는 GPU는 비약적인 향상을 통해 CPU가 필요로 하는 이상의 대역폭을 요구한다. 이에따라 시스템 메모리 대역폭을 공유하는 현재의 방식은 CPU가 요구하는 대역폭 지원은 유리한 구조지만 내장 GPU는 그 이상을 요구하기 때문에 불리하다.

 

CPU 및 DDR3 메모리 듀얼 채널 구성 대역폭

현재 주력으로 사용되고 있는 메모리는 DDR3 SDRAM이며 인텔 및 AMD 프로세서가 지원하는 시스템 버스와 메모리 클럭에 적용되는 대역폭이다.

최신 데스크탑 프로세서에 적용된 시스템 버스 대역폭은 최대 25.6GB/s로 알려졌으며 주력으로 사용하는 DDR3-1600MHz를 듀얼 채널 메모리 구성한 대역폭과 동일해 CPU가 필요로 하는 대역폭을 충족한다. 그러나 최신 내장 GPU 특히 AMD는 CPU보다 더 높은 대역폭을 요구하고 있는 추세다.

프로세서 제조사는 이를 반영해 새로운 CPU 출시때마다 메모리 클럭을 꾸준하게 증가하고 있으며 이를 바탕으로 CPU와 내장 GPU가 요구하는 대역폭에 접근하고 있다.

 

AMD 리치랜드 APU, DDR3-2133MHz 지원 (출처 expreview)

현재 프로세서가 지원하는 DDR3 주력인 DDR3-1333MHz (PC3-10600)은 인텔 아이비브릿지 (Ivy Bridge)가 지원하는 DDR3-1600MHz (PC3-12800)로 넘어가는 추세이며 차세대 CPU 하스웰 (Haswell)에서는 기존보다 더 높은 클럭의 메모리를 지원할 것으로 예상된다.

AMD 역시 2세대 APU 트리니티 (Trinity)는 인텔보다 높은 클럭의 DDR3-1866MHz (PC3-15000)를 지원한다. AMD 트리니티 APU 후속 차세대 APU 리치랜드 (Richland)는 DDR3-2133MHz (PC3-17066)를 지원해 더 높은 메모리 클럭을 바탕으로 대역폭을 확보해 향상되는 내장 GPU 성능을 뒷받침할 것으로 알려졌다.

 

메모리 대역폭, 인텔보다 AMD 내장 GPU에 영향이 커


CPU와 GPU의 성능 향상과 직결되는 메모리 대역폭 요구는 CPU보다는 내장 GPU에서 보다 뚜렷하게 나타나고 있다.

인텔은 CPU의 성능이 높은 대신 내장 GPU의 성능이 부족하며 AMD는 CPU 성능이 부족한 대신 내장 GPU의 성능이 높다. 이러한 구조적 차이는 CPU뿐만 아니라 내장 GPU가 필요로 하는 메모리 대역폭 요구가 달라지는 결정적인 요인이다.

 

AMD 내장 GPU, 대역폭 증가에 따라 성능 향상도 높아져

실제로 AMD와 인텔의 내장 GPU는 각자가 필요로 하는 메모리 대역폭이 다르며 구조와 성능상 AMD 내장 GPU가 더 많은 메모리 대역폭을 요구한다.

이러한 이유로 AMD는 인텔보다 평균적으로 높은 메모리 대역폭을 구현할 수 있도록 높은 클럭을 지원하고 있으며 AMD 내장 GPU는 메모리 대역폭 증가에 따른 성능 향상폭도 그만큼 높다.

 

내장 GPU 성능 향상을 위한 방안은?


CPU와 GPU가 통합되면서 요구되는 메모리 대역폭은 증가하는 추세이며 특히 내장 GPU는 메모리 대역폭 증가가 성능에 보다 큰 영향을 미치고 있다. 그러나 주력으로 사용하고 있는 DDR3 SDRAM의 클럭은 한계에 다다르고 있다.

이는 내장 GPU의 성능 즉 메모리 대역폭 요구를 시스템 메모리 클럭이 따라잡지 못할 것이라는 것을 의미한다.

DDR3 SDRAM의 클럭 적용 한계는 보다 높은 클럭 적용이 가능한 DDR4 SDRAM 등장은 대안이 될 수 있으며 내장 GPU 전용 메모리를 메인보드에 탑재하는 것도 한 방법이다.

내장 GPU 전용 메모리 탑재한 AMD 785G 메인보드

AMD는 라데온 HD 4200 내장 그래픽을 통합한 785G 칩셋 기반 메인보드를 출시할 당시 현재와 같이 CPU와 메모리 대역폭을 공유했으나 추가 성능 향상을 위해 사이드포트 (SidePort) 메모리를 지원한 바 있다. 사이드포트 메모리는 내장 GPU만을 위한 전용 메모리로 DDR3-1333MHz 128MB 용량을 탑재했고 이를 적용할 경우 시스템 메모리만을 이용할 때보다 내장 GPU 성능을 향상할 수 있었다.

하지만 현재 시점에서 DDR4 SDRAM을 지원하는 데스크탑 플랫폼은 존재하지 않고 내장 GPU 전용 메모리 탑재는 메인보드 제조사의 가격 경쟁으로 더 이상 찾아보기 어려워졌기 때문에 두가지 대안은 의미가 없다.

 

따라서 현시점에서 가장 쉽게 내장 GPU 성능 향상을 위한 방법으로 메모리 동작 클럭을 향상하는 오버클럭을 들 수 있다.

특히 AMD 2세대 APU인 트리니티는 파일드라이버 (Piledriver) 코어와 라데온 HD 7000 시리즈 내장 GPU를 통합하면서 기본 지원 메모리 클럭도 향상되었지만 아키텍처 및 제조 공정 최적화로 오버클럭도 잘되는 편이다.

 

AMD 2세대 APU 트리니티 (Trinity) (FM2, A10-5800K, HD 7660D)

FM2 지원 기가바이트 GA-F2A75M-HD2 (AMD A75 FCH)

오버클럭을 이용한 내장 GPU 성능 향상을 확인하기 위해 기가바이트 (GIGABYTE) GA-F2A75M-HD2 (AMD A75 FCH) 메인보드와 트리니티 APU 중 가장 높은 성능의 A10-5800K (Radeon HD 7660D), 삼성전자 DDR3-1600MHz (PC3-12800) 4GB x 2를 선택했다.

 

트리니티 지원 메인보드, DDR3-800MHz에서 2400MHz 지원

기가바이트 GA-F2A75M-HD2 메인보드는 보급형 시스템에 적합한 메인보드지만 DDR3-800/ 1333/ 1600/ 2133/ 2400MHz를 지원하고 있다. 사용하는 DDR3 메모리가 기본 스펙 이상을 지원하면 얼마든지 오버클럭이 가능하다.

 

구분 메모리 클럭 (MHz) 메모리 타이밍 (CL) 전압 (V)
1 DDR3-1333 (667)MHz CL9-9-9-24-33-1T 1.50V
2

DDR3-1600 (800)MHz

CL9-9-9-24-33-1T 1.50V
3 DDR3-1866 (933)MHz CL9-10-10-24-33-1T 1.50V
4

DDR3-2133 (1066)MHz

CL10-11-11-27-39-1T 1.60V

테스트에 사용한 삼성전자 DDR3-1600MHz (PC3-12800)는 A10-5800K APU와 조합시 듀얼 채널 메모리 구성으로 DDR3-2400MHz를 제외한 모든 메모리 클럭 적용이 가능했다.

 

A10-5800K APU에 탑재된 라데온 HD 7660D는 메모리 적용 클럭에 따라 적용된 메모리 대역폭이 달라진다. DDR3-1333MHz는 21.3GB/s, DDR3-1600MHz는 25.6GB/s, DDR3-1866MHz는 29.9GB/s, DDR3-2133MHz는 34.1GB/s로 향상된다.

 

테스트 시스템을 바탕으로 시스템 메모리 대역폭과 레이턴시, 그리고 각 적용 클럭에 따른 내장 GPU 성능 향상은 아래와 같다.

 

산드라 (Sandra) 메모리 대역폭 및 캐쉬 & 메모리 레이턴시 테스트를 통해 메모리 클럭 향상은 메모리 대역폭 향상과 직결되며 레이턴시는 메모리 타이밍과 클럭에 관련이 있는데 클럭 향상에 따라 레이턴시 역시 개선이 이루어졌다.

 

시스템 전반의 성능을 측정한 PCMark 7은 메모리 대역폭 향상에 따른 시스템 성능 향상을 파악할 수 있다. 메모리 클럭 향상에 따라 추가 대역폭을 확보해 CPU 성능과 내장 GPU 성능 향상으로 그래픽 처리 성능 향상, 그리고 전체 PCMark 스코어의 향상으로 이어졌다.

 

DirectX 10 지원 그래픽카드의 성능을 확인할 수 있는 3DMark Vantage 테스트 결과는 메모리 클럭 향상에 따라 보급형 외장 그래픽카드를 넘어서는 성능을 내주며 상위 제품들에 보다 근접한 성능을 내줬다.

 

게임 벤치마크는 내장 GPU 성능 테스트로 사용하는 스트리트 파이터 4 (Street Fighter IV)와 Resident Evil 5를 이용했다. 3DMark 결과와 마찬가지로 내장 GPU는 메모리 클럭이 향상됨에 따라 트리니티 APU (A10-5800K 내장 라데온 HD 7660D)의 프레임은 꾸준하게 상승해 Resident Evil 5에서는 저해상도에서 라데온 HD 6670에도 근접한 프레임을 내주는 것으로 확인된다.

 

메모리 대역폭 향상 = 내장 GPU 성능 향상


메모리 대역폭 향상은 내장 GPU 성능 향상으로 이어져

CPU와 GPU가 통합되면서 메모리 클럭 향상은 CPU보다 비약적으로 성능이 향상되고 있는 내장 GPU에 큰 영향을 미치고 있으며 고클럭 메모리를 이용할수록 내장 GPU의 성능 향상으로 이어졌다.

AMD와 인텔 내장 GPU 중 메모리 클럭 향상에 따른 내장 GPU 성능 향상은 인텔 내장 GPU보다 구조적으로 높은 성능을 내주며 내장 GPU 성능이 부족하면 메모리 오버클럭으로 손쉽게 내장 GPU 성능을 끌어올릴 수 있다.

물론 메모리 클럭 향상에 의한 대역폭의 증가는 내장 GPU의 성능 향상에만 그치지 않는다. 전반적인 시스템의 성능 향상으로도 이어지기 때문에 메모리 클럭 향상은 손쉬운 CPU와 내장 GPU 성능 향상 방법이기도 하다.

  태그(Tag)  : AMD 퓨전(트리니티), A75/ A55, 기가바이트
관련 기사 보기
태그가 등록되지 않아 관련 기사를 출력할 수 없습니다

  권경욱 前 기자 / 필명 바이퍼투 / 바이퍼투님에게 문의하기 press@bodnara.co.kr
남들은 스마트폰이나 타블렛 PC에 관심을 갖고 있지만, 여전히 PC가 좋다. 새로운 것, 독특한 것을 좋아하지만, 남앞에 나서거나 사진찍히는 것을 싫어해 기자에는 제일 어울리지 않는 성격. 누구보다 빠르게 PC 하드웨어 정보를 전달하기 위해 노력하고 있으며, PC 하드웨어에 대한 열정은 현재진행형이다.
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
애플, 아이폰 및 아이패드 탈옥 차단 iOS/iPadOS 13.5.1 업데이트
AMD 4세대 라이젠, 2021년 초로 출시 연기?
무드조명과 무선충전을 동시에, 콕스 AWC05 출시
제닉스, 손목터널증후군 방지 VM2 무소음 무선 버티컬마우스 출시
5GHz 돌파 세계 최고 게이밍 CPU, 인텔 10세대 코어 i9-10900K
특별한 흰색과 은색 조합 메인보드, ASUS ROG STRIX Z490-A Gaming STCOM
인공지능 성능 최대 20배 강화, 엔비디아 차세대 GPU 아키텍처 앙페르 발표
3년전 하이엔드CPU 저리가라, AMD R3 3300X vs Intel i7 7700K
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.

종건 whdrjs0731님의 미디어로그 가기  / 13-01-23 14:58/ 자국/ 신고/ 이댓글에댓글달기
gpu의 성능개선에 메모리의 역할이 부각된 내용인데요?
흥미롭게 잘읽고갑니다.
공감맨 / 13-01-23 17:47/ 자국/ 신고/ 이댓글에댓글달기
와우. 메모리 클럭 향상이 내장GPU 성능향상에 많은 도움이 되는군요. 흥미로운 기사입니다...

DJ Desperado / 13-01-23 18:36/ 자국/ 신고/ 이댓글에댓글달기
-On Mobile Mode -
차세대 메모리가 등장하는 시점에서 apu가 ipc 향상이 있다면 일반시스템에서 진정한 갑이 되지않을까요?

마프티 psywind님의 미디어로그 가기  / 13-01-23 20:20/ 자국/ 신고/ 이댓글에댓글달기
암드는 지금 시퓨가 발목잡는듯 보이는 벤치도 많더군요

Exynos / 13-01-23 20:52/ 자국/ 신고/ 이댓글에댓글달기
APU처음에 나올때부터 고질적인 문제였죠 램클럭이 높으면 성능이 증가되는 대역폭 문제 ㄷㄷ 좀있으면 DDR4와 혹은 암드가 새로운 기술 젼략을 들고올것같네요 ㅎ

공부하자 milkblue님의 미디어로그 가기  / 13-01-24 10:25/ 자국/ 신고/ 이댓글에댓글달기
AMD APU 사용자들은 메모리 오버클럭을 필수적으로 하라는 기사....
내장된 GPU 성능에 비해 부족한 대역폭....
다음 세대를 위해서는 대역폭이 늘어난 HT 가 필수적으로 필요할듯...

BULE / 13-01-24 17:46/ 자국/ 신고/ 이댓글에댓글달기
CPU - 컴퓨터 정보 처리 집중 , GPU - 영상 정보 처리 집중
APU - 컴퓨터와 영상의 보안성 정보 처리 집중 (?)
메모리 대역폭이 중요하기는 한데, 특히 APU 의 경우에서는 단순하게 메모리 대역폭이 유효 적용되었다고 하더라도 보안에서 부족하면 프로세서의 성능이 하락하는 부분으로 보이게 되겠죠. 그러면 메모리에서의 보안을 강화하기 위해서 IT 산업의 전체적인 흐름을 혁신하고, 전력 효율에 있어서도 각고의 국가적인 노력을 집중해야 한다고 생각합니다.

꾸냥 / 13-01-24 21:16/ 자국/ 신고/ 이댓글에댓글달기
-On Mobile Mode -
예전 사이드포트 메모리처럼 그래픽 전용 메모리 쓰면 성능면에선 더 좋을거 같은데 왜 안쓸까요?
gddr5 512mb 정도 탑재하고 있으면 성능을 봤을 때 가격도 그렇게 부담되지 않으면서 적당한 그래픽 성능을 내줄 수 있을거 같은데 안 그러는 이유가 궁금하네요.

프리스트 rubychan님의 미디어로그 가기  / 13-01-30 10:06/ 자국/ 신고/ 이댓글에댓글달기
GPU 전용 메모리 탑재는 메인보드 가격 상승을 이유로 안하는 문제가..
닉네임 웹봇방지

홈으로 탑으로
 
 
2020년 06월
주간 히트 랭킹

보드나라 2019 정규직 채용 공고 5
[결과발표] 2020년 1분기 포인트 소진 로또 20
2020년 1분기 로또이벤트 선정관련 안내
[결과발표] 'PC방 점주의 고민, 어떤 플랫 3
[결과발표] 2019년 4분기 포인트 소진 로또 23

실시간 댓글
소셜 네트워크