뉴스
 








 
 
 




전송 2021-07-21 17:17
[뉴스/보도자료]

엔비디아, 최신 추론 소프트웨어 텐서RT 8 출시

엔비디아(CEO 젠슨 황)가 텐서RT(TensorRT) 8을 출시했다. 텐서RT 8은 엔비디아의 8세대 AI 소프트웨어로, 언어 쿼리에 대한 추론 시간을 절반으로 줄여 개발자들이 업계 최고 수준의 성능을 제공하는 검색 엔진, 광고 추천 플랫폼, 챗봇을 개발하도록 돕고, 이를 클라우드부터 엣지에서 제공하도록 지원한다.

 

텐서RT 8의 최적화 기능은 언어 애플리케이션을 위한 기록적인 속도를 제공하여, 전세계적으로 가장 널리 사용되는 트랜스포머 기반 모델 중 하나인 BERT-라지(BERT-Large) 모델의 추론을 1.2밀리세컨드(ms) 만에 완료한다. 과거에는 기업들이 모델 크기를 줄이게 되면 결과의 정확성이 크게 떨어졌다. 텐서RT 8을 통해 이제 기업들은 모델 크기는 두 배 또는 세 배로 늘리면서 정확도를 상당히 개선할 수 있게 됐다.

그레그 에스테스(Greg Estes) 엔비디아 개발자 프로그램 담당 부사장은 “AI 모델은 기하급수적으로 점점 더 복잡해지고 있으며, AI를 사용하는 실시간 애플리케이션에 대한 수요는 전 세계적으로 급증하고 있다. 따라서, 기업들은 최첨단 추론 솔루션을 반드시 구축해야 한다. 최신 버전의 텐서RT는 기업들이 그들 고객에게 이전에는 불가능했던 수준의 품질과 응답성을 갖춘 대화형 AI 애플리케이션을 제공하도록 돕는 새로운 기능을 지원한다”고 설명했다.

지난 5년 간 헬스케어, 자동차, 금융, 소매를 포함한 다양한 분야에 걸친 2만 7천 5백여 기업의 35만 이상의 개발자가 텐서RT를 250만 번 가까이 다운로드했다. 텐서RT 애플리케이션은 하이퍼스케일 데이터센터, 임베디드 혹은 오토모티브 제품 플랫폼에서 활용할 수 있다.

 

텐서RT 8은 트랜스포머 최적화 외에도 두 가지 주요 기능을 통해 AI 추론에 대한 혁신을 구현한다. 희소성(Sparsity)은 효율성을 높이는 엔비디아 암페어(Ampere) 아키텍처 GPU의 새로운 성능 기술로, 개발자가 컴퓨팅 작업을 줄여 신경망을 가속화할 수 있도록 지원한다. 또한, 양자화 인식(quantization aware) 훈련 기능을 통해 개발자는 훈련된 모델을 사용하여 정확도를 유지하면서 INT8 정밀도로 추론을 실행할 수 있는데, 이는 텐서 코어 상의 효율적인 추론을 위해 컴퓨팅 및 스토리지 오버헤드를 크게 줄여준다.

업계 선두업체들은 대화형 AI 및 다양한 분야의 딥러닝 추론 애플리케이션을 위해 텐서RT를 채택했다.

허깅페이스(Hugging Face)는 다양한 산업군에 걸친 세계 최대 AI 서비스 제공업체에서 사용중인 오픈소스 AI 분야의 선두업체다. 허깅페이스는 엔비디아와 긴밀하게 협력해 텍스트 분석, 신경망 탐색, 대화형 애플리케이션을 규모에 맞게 지원하는 획기적인 AI 서비스를 선보이고 있다.

GE 헬스케어(GE Healthcare)는 텐서RT를 통해 질병의 조기 발견을 위한 핵심 툴인 초음파용 컴퓨터 비전 애플리케이션을 가속화하고 있다. 이는 임상의가 지능형 헬스케어 솔루션을 통해 최고 품질의 치료를 제공할 수 있게 한다.

 

텐서RT 8은 현재 이용 가능하며, 엔비디아 개발자 프로그램(NVIDIA Developer program) 회원에게 무료로 제공된다. 최신 버전의 플러그인, 파서, 샘플도 텐서RT 깃허브(GitHub) 레파지토리(repository)에서 오픈소스로 이용할 수 있다.

  태그(Tag)  : 엔비디아, 인공지능
관련 기사 보기
[칼럼] 전문가 영역에서 다뤄지던 AI, 메인스트림 PC서 만나는 시대
[스페셜] VGA 시장 경쟁력 강화용 전략 모델, 엔비디아 지포스 RTX 3070 Ti FE
[스페셜] 가상화폐 성능 폭락 4K 게이밍 VGA, 기가바이트 RTX 3080 Ti Gaming OC 제이씨현
[칼럼] 언제까지고 기다릴 수 없는 PC 구성,게임 방송용 PC 입문자 가이드
[벤치] 최신 인기 공포게임 바이오하자드 빌리지, 4K 게이밍 그래픽카드는 어떤 걸로?
[벤치] AMD RX 6800 시리즈와 RTX 3000시리즈, 현시점 하이엔드 그래픽카드는 어떤걸로?
태그(Tags) : 엔비디아, 인공지능     관련기사 더보기
편집부 / 편집부님에게 문의하기 press@bodnara.co.kr
이기사와 사진은 업체에서 제공받은 보도자료와 사진으로, 보드나라의 논조와는 다르다는 점을 알려드립니다.
싸이월드 공감 기사링크 퍼가기 기사내용 퍼가기 이 기사를 하나의 페이지로 묶어 볼 수 있습니다. 출력도 가능합니다.
홈으로 탑으로
보드나라 많이본 기사
소니, PS5 베타 사용자에게 M.2 SSD 확장 기능 제공
삼성전자 24Gb DDR5 DRAM 개발 중
가이아모바일, 북두의 권 LEGENDS ReVIVE 국내 출시
인텔 워크스테이션용 제온 W3300 시리즈 출시
AMD 세잔과 RTX 3070 결합한 게이밍 노트북, 레노버 리전5 프로 AMD
스팀 게임을 즐기는 휴대용 게임기, 밸브 스팀 덱(Steam Deck) 발표
놓칠 수 없는 OS 무료 업글 기회, 윈도우 11서 CPU별 게임 성능은?
5만5천원에 OLED로 옆그레이드, 닌텐도 스위치 OLED 발표
   이 기사의 의견 보기
트위터 베타서비스 개시! 최신 PC/IT 소식을 트위터를 통해 확인하세요 @bodnara

기자의 시각이 항상 옳은것은 아닙니다. 나머지는 여러분들이 채워 주십시요.

2014년부터 어려운 이야기를 쉽게 하는 것으로 편집방침을 바꿉니다.
닉네임 웹봇방지

홈으로 탑으로
 
 
2021년 08월
주간 히트 랭킹

[결과발표] [20주년 기념] 유디아 인터뷰 7
[결과발표] 2021년 2분기 포인트 소진 로또 18
[결과발표] [20주년 기념] 벤큐 코리아 인 12
[결과발표] [20주년 기념] '[社說] 창간 20 19
[결과발표] 2021년 1분기 포인트 소진 로또 28

실시간 댓글
소셜 네트워크