기획
 





 
 
 




전송 2018-09-05 12:00
[테크닉]

단순 코어와 클럭으로 끝이 아니다
CPU에 숨은 성능 요소는?

10여년간 쿼드 코어에 머물러 있던 인텔의 메인스트림 데스크탑 CPU가 8세대 커피레이크의 6코어에 이어 9000 시리즈에서는 8코어로, 하이엔드 데스크탑은 코어 X 시리즈의 18코어에 이어 최대 28코어의 코어 A 시리즈가 예고되어 있다.

바야흐로 다코어 시대가 열리고 있다.

요즘 같은 멀티 스레드 시대에 다코어는 가장 직접적인 CPU 성능 향상을 위한 지름길이다. 인텔이 데스크탑용 6코어 커피레이크를 발표하며 그동안 하이엔드 데스크탑 CPU에서 이야기하던 메가 태스킹을 언급한 것도, 그만큼 최신 프로그램들의 멀티 스레드 활용이 활발해진 것은 반영한 것으로 보인다.

 

코어를 늘리는 것 외에도 아키텍처를 개선하거나 클럭을 높이는 것도 CPU 성능을 높이는 방법이 되겠지만 각종 보안 이슈와 최적화 및 비용, 발열과 소비 전력, 제조 공정 등 여러가지 문제가 엮여 있는 만큼 코어를 늘리는 것처럼 쉬운 일은 아니다.

그런데 여기서 의문이 하나 생긴다. CPU의 성능 개선은 클럭과 코어 개선외에 다른 방법은 없을까? 물론 아니다.

 

혼자서 힘들 때 발휘되는 품앗이의 미덕, 코프로세서에 주목

잠시 시선을 돌려 8월 게임스컴에서 발표된 엔비디아의 지포스 RTX 시리즈에 쓰인 튜링 GPU를 살펴보자.

 

해당 GPU는 CUDA 코어만으로는 게임 내에서 실시간 처리하기 어려웠던 실시간 레이트레이싱을 위해 그를 전담하는 RT 코어, 볼타 이키텍처에 딥 러닝과 머신 러닝을 위해 도입된 텐서 코어를 도입했다.

즉, 쿠다 코어는 지금처럼 게임 그래픽을 그려내면 거기에 RT 코어와 텐서 코어가 레이트레이싱을 덧칠하는 방식으로 실시간 레이트레이싱을 구현한 것이다. 물론 별도의 연산을 필요로하는 만큼 완전히 끄는 것보다 성능이 낮아지기는 하지만, 거의 불가능한 수준이었던 예전과 비교하면 하늘과 땅 차이다.

 

모르는 사람도 있겠지만 그래픽 카드의 역할은 당초 CPU 였다. 지금은 거의 완전히 별개의 카테고리로 인식되지만 CPU의 역할을 분담한다는 면에서 따지자면 코프로세서로 분류할 수 있으며, 초기 CPU는 그래픽 카드 외에도 여러 종류의 코프로세서가 있어왔다.

일단, FPU라고 불리는 부동소수점 연산 유닛(FPU) 초기 IBM PC에서는 별도의 칩으로 제공되었고, 인텔 386 시절에는 80387 부동소수점 연산을 위한 코프로세서가 사용되었고, 486 이후에는 CPU에 통합되기에 이른다.

코프로세서는 CPU에만 있는 것이 아니라 사운드 카드에도 다중 채널 혼성과 실시간 DSP 효과를 위한 코프로세서가 사용되었고, 엔비디아의 GPU 물리연산 기술인 PhysX는 당초 에이지아에서 개발한 코프로세서 성격의 확장 카드로 시작되었다.

 

인텔이 서버와 슈퍼컴퓨터, 하이엔드 워크스테이션 등에 연산 가속용으로 x86 명령어 셋을 이용할 수 있도록 개발한 제온 파이도 코프로세서의 일종으로, 아직까지 코프로세서는 그 명맥을 이어오고 있다.

코프로세서는 엄밀한 의미에서 CPU의 성능 향상으로 보기 어렵지만, CPU의 부족한 성능을 보완해줄 수 있다는 점에서 한가지 방안으로 볼 수 있다.

 

CPU의 성능 진화, 코프로세서 통합과 새로운 명령어의 도입

코프로세서는 현재의 CPU로는 실행이 어렵거나 오래 걸리는 작업 시간을 단축 시켜줄 수 있지만, 별도의 컨트롤러 형태인 만큼 공간과 비용이 높아질 수 밖에 없다. 다행히 기술 발전에 힘입어 FPU나 피직스 카드처럼 자연스럽게 CPU 같은 주 프로세서에 흡수되는 경우도 있지만, 처음부터 특정 작업을 위해 개발된 기능도 있기 마련이다.

 

대표적으로 1990년대 후반 출시된 펜티엄에 포함된 MMX(MultiMedia eXtension) 명령어를 들 수 있는데, 하나의 명령어로 동시에 다수의 데이터를 처리하는 SIMD(Single Instruction Multiple Data) 기법이 사용되는 이들 명령어 셋은 병렬 처리 방식의 코프로세서와는 다르지만 처리 과정을 대폭 단축시킬 수 있으므로, CPU에서 지원하고 안하고는 상당한 성능 차이로 이어진다.

인텔 펜티엄 MMX에서 본격적으로 이야기되기 시작한 SIMD 명령어셋은 하나의 명령어로 다수의 데이터를 동시 처리한다는 점에서 메크로와 유사한 면이 있다. 마침 당시 떠오르기 시작한 3D 가속 카드와 맞물려 주로 멀티미디어 처리 관련으로 주목을 받았다. 손노리의 화이트데이, SEGA의 버추어캅과 버추얼 온 등의 타이틀이 이들 명령어를 지원해 미지원 CPU 대비 높은 성능을 끌어냈고, 버추얼 온의 경우 MMX 지원 CPU 탑재 시스템에 번들 프로모션이 계획되기도 했다.

 

CPU-Z 같은 외부 유틸리티로 쉽게 확인 가능한 CPU의 SIMD 명령어 셋은 처음 멀티미디어 처리에 집중되어 있었으나 암호화(AES), 가상화(VT-x), 메모리 관리(EM64T), 미디어 및 부동 소수점 연산 가속(FMA), 병렬 운영 개선(TSX) 등 다양한 용도의 명령어 셋이 추가되고 있다.

물론 같은 CPU로 분류되도 사용자층에 따라 가격과 코어, 클럭 등 여러가지가 다른 것처럼, CPU의 명령어셋도 차이가 있는 것은 당연하다면 당연한 일로, 인텔의 하이엔드 데스크탑 CPU 제품군인 코어 X 시리즈에는 메인스트림 제품군에는 볼 수 없는 AVX512 명령어셋이 추가 지원된다.

 

하이엔드 데스크탑 전용 명령어, AVX512는 무엇?

AVX(Advanced Vector Extensions)는 2011년 인텔 2세대 샌디브릿지 부터 지원이 시작된 명령어로, 기존에 쓰이던 SSE의 128bit보다 빠른 256bit 동작과 메모리 클러스터 구성 변경 등의 개선이 이뤄졌다.

간략히 비교하자면 AVX는 한 번에 128개의 데이터 처리가 가능했던 SSE와 비교해 최대 256개까지 처리 할 수 있게 되었고, 이를 통해 작업에 따라 최대 2.5배까지 처리 성능을 높일 수 있다.

 

하스웰에서는 AVX 명령어를 개선한 AVX2가, 이후 하이엔드 데스크탑 CPU인 코어 X 시리즈에서는 512bit 부동소수점 처리가 가능한 AVX512 지원이 이뤄졌다. 이에 따라 SSE를 지원하던 네할렘과 비교해 사이클당 부동소수점 처리 능력이 여덟배 향상되었으며, AVX2와 비교해서는 두 배 개선되었다.

이를 통해 부동소수점 집약적인 과학 시뮬레이션, 금융 분석, 인공 지능(AI) 딥 러닝, 3D 모델링 및 분석, 이미지 및 오디오/비디오 프로세싱, 암호화, 데이터 압축 등의 워크로드 성능을 가속화한다.

 

오버클럭 부하 테스트 용도로 익숙한 린팩(Linpack)을 예로 들자면, AVX512를 활용할 경우 소비전력은 거의 그대로 유지하면서 AVX2 대비 약 60% 성능이 높아지고, 결과적으로 소비전력과 클럭당 부동소수점 연산 성능이 두 배 가까이 개선되었다.

린팩은 컴퓨터에서 수치 선형 대수를 처리하기 위한 소프트웨어 라이브러리로, 기본적인 벡터와 행렬 연산을 BLAS(Basic Linear Algebra Subprograms) 라이브러리를 이용하여 계산하며, 부동소수점 처리에 집중되어 있다.

 

인텔이 데스크탑 CPU 중 코어 X 시리즈에만 AVX512를 지원한 것은 제품군별 차별화 전략으로 볼 수 있는데, 아직 컨텐츠 '소비자'에 가까운 메인스트림 사용자용으로 AVX 명령어를 지원하는 프로그램은 매우 제한적이다.

그에 비해 하이엔드 데스크탑 CPU나 서버용 제온 프로세서처럼 컨텐츠 크리에이터를 위한 프로그램 중에는 무료 렌더링/ 에니메이션 프로그램인 블랜데, MS 비주얼 스튜디오 2017 C++ 컴파일러, JAVA9 등 다수의 컴파일러, 중력파 시뮬레이션을 위한 Einstein@Home 프로그램 등, 일반인 사용자와는 거의 연관이 없는 전문 분야에서 쓰이고 있다.

 

인텔의 발표에 따르면 코어 X와 제온 스케일러블 프로세서, 제온 파이 시리즈에 적용된 AVX512를 지원하는 경우 인공지능과 딥 러닝 성능은 최대 2.2배, 암호화 해싱 성능 3.1배, 데이터 보호 및 HPC 작업에서 최대 1.63배의 성능 개선 효과를 기대할 수 있다.

AVX512를 사용할 경우 그만큼 동시 처리 가능한 데이터가 급격히 늘어나 CPU의 부하, 즉 발열로 이어지기 때문에 쿨링에 더욱 신경 쓸 필요가 있다. 이는 전버전인 AVX2에서도 마찬가지라, 메인스트림 CPU 오버클러커들 사이에서는 AVX2 관련 설정을 별도로 조정하기도 한다.

 

시대를 반영한 CPU 명령어 셋, 효과적 작업 효율 개선

 

컨텐츠 소비층인 일반 메인스트림 사용자가 눈 높이를 낮춘다면 특별히 고사양 PC가 필요없을 정도로 PC 성능은 대폭 개선되었다. 하지만 컨텐츠-서비스 생산자 입장에서 보면 아무리 고성능 제품이 나온다해도 만족하기 어렵다.

남들 보다 빨리, 더 나은 서비스로 차별화하고, 기존 기술들을 결합해 새로운 영역을 개척하기 위해서는 그만큼 빠른 분석-창작 도구가 필요하며, 현재 그 중심에는 CPU와 GPU가 있다.

GPU는 일반 게이머에게도 게임 성능과 레이트레이싱 같은 화려함으로 눈길을 끄는 반면, CPU는 코어 확대와 클럭 개선이 주로 주목받고 있지만, MMX와 AVX, 코어 X 시리즈의 AVX512처럼 시대 흐름에 맞춘 명령어 지원이 병행되지 않는다면 하드웨어 개선 이상의 성능 향상을 바라긴 어렵다. 그러다 보면 어느 순간 10nm 공정 양산 연기와 같은 정체기에 빠지기 쉽다.

 

인텔은 다음 세대 서버용 제온 프로세서인 Cascade Lake-SP에는 AVX512를 기반으로 현 시대 IT 시장의 화두인 딥러닝과 AI 추론 가속을 위한 VNNI 명령어를 추가할 예정이며, 인텔 제온에 근간을 둔 인텔 하이엔드 데스크탑 프로세서 역시 차세대 코어 X, 혹은 코어 A 시리즈에서 VNNI를 지원할 가능성이 높다.

물론 코어 X 시리즈에 추가된 AVX512 같은 명령어 셋은 코프로세서와 같이 목표로 한 특정 작업에서 응용 프로그램이 지원할 때만 제대로된 성능을 기대할 수 있다는 한계가 있지만, 미 지원 CPU에 비해 수 배의 성능 개선을 기대할 수 있어 작업 효율을 높일 수 있다.

사용자들이 요구하는 명령어 셋이 우선 지원되기에 IT 트랜드도 반추할 수 있는 만큼, CPU가 어떤 명령어 셋을 지원하는지 주목해보자.

  태그(Tag)  : 인텔, CPU, 인텔 코어 X 시리즈
관련 기사 보기
[테크닉] 인텔 메인스트림 CPU 8코어 시대 임박, 하이엔드 데스크탑 PC가 필요한 이유는?
[스페셜] 32코어 데스크탑 CPU 시대, AMD 라이젠 스레드리퍼 2세대의 의미는?
[벤치] 코어 i7-8700K로 만든 Man vs Wild, 몬스터 헌터 월드 벤치마크
[테크닉] 하반기 새로운 CPU 경쟁의 시작,AMD 라이젠 스레드리퍼 2세대 알기
[테크닉] 급등락하는 CPU가격, 격변하는 AMD와 인텔의 CPU 경쟁구도
[칼럼] 2018년 하반기 빅 이벤트 미리보기, AMD와 인텔의 HEDT CPU 2차전
태그(Tags) : 인텔, CPU, 인텔 코어 X 시리즈     관련기사 더보기

  이상호 기자 / 필명 이오니카 / 이오니카님에게 문의하기 ghostlee@bodnara.co.kr
웃기 힘든 세상, 어제와 다른 오늘도 웃을 수 있기 위해…
기자가 쓴 다른 기사 보기

Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 미디어국
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
인텔 10nm 양산 또 연기? 2019년 로드맵서 아이스레이크 사라져
AMD 라이젠용 메인보드 칩셋 5종 추가 확인, X499와 Z490포함
중국에서 16nm 공정 x86 호환 프로세서 KX-6000 공개
SIEK, 오리지널 플레이스테이션 재현한 'PlayStation Classic' 발매
32코어 데스크탑 CPU 시대, AMD 라이젠 스레드리퍼 2세대의 의미는?
노트북과 투인원 PC를 위한 최적화,인텔 8세대 위스키 레이크 프로세서 발표
성능에 민감한 게이밍 PC 스토리지, SSD와 HDD 조합 최적화를 노리자
안드로이드 끝판왕에서 S펜 왕좌만 남았다, 삼성 갤럭시 노트9 512GB 스페셜 에디션
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
heaye / 18-09-05 17:28/ 자국/ 신고/ 이댓글에댓글달기
당분한 매년 코어가 2개씩 꾸준히 늘어나면 좋겠어요. ㅎ
heaye / 18-09-05 17:41/ 자국/ 신고/ 이댓글에댓글달기
인텔은 한번 샀으면 3년 쓰는 겁니다.
heaye / 18-09-05 19:16/ 자국/ 신고/ 이댓글에댓글달기
엠빠기자가 왜 인텔기사를 자꾸 쓰는지 모르겠네.
습관적으로 중간에 엉뚱한곳에 10nm 지연 정체기 같은 문장이나 슬쩍 끼워넣고.
그러면서도 7nm포기한 GF에 대해서는 일언반구 없고.
이 글도 인텔글이니, 하루나 이틀이나 놔둘까.
주말엔 보나마나 또 라이젠배너로 갈아끼우겠지. ㅋ
허접프로그래머 valkyrie님의 미디어로그 가기  / 2018-09-06 17:26/ 자국/ 신고/
그럼 인텔 프로세서 설명하는데 뜬금없이 AMD, 그것도 지금은 자회사도 아닌 글러벌파운드리 얘기를 끼워넣어야 해요?
그랬으면 엠빠기자가 인텔 기사에 괜히 AMD 글을 끼워넣기한다고 뭐라고 할거면서요.

asdf / 18-09-05 21:13/ 자국/ 신고/ 이댓글에댓글달기
기사와 상관없는 헛소리와 악플을 다는 사람은 IP밴이라도 해주셨으면 좋겠습니다.
영 보기 안좋네요.

프리스트 rubychan님의 미디어로그 가기  / 18-09-12 11:38/ 자국/ 신고/ 이댓글에댓글달기
저 거지같은 익명 악성댓글들 좀 안보이게 해주소
닉네임 웹봇방지

홈으로 탑으로
 
 
2018년 09월
주간 히트 랭킹

[당첨자발표] 보드나라와 씨게이트가 함께 8
씨게이트 2018 월드컵 이벤트 2차 당첨자 3
[당첨자발표] 보드나라와 씨게이트가 함께 7
[결과발표] 2018년 2분기 포인트 소진 로또 25
[결과발표] 2018년 1분기 포인트 소진 로또 18

실시간 댓글
소셜 네트워크