AI ÄÄÇ»ÆÃ ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ(www.nvidia.co.kr)°¡ ÅÙ¼RT-LLM(TensorRT-LLM) ¾÷µ¥ÀÌÆ®¸¦ ÅëÇØ ÀΰøÁö´É(AI) Ãß·Ð ¼º´ÉÀ» Çâ»óÇÏ°í »õ·Î¿î ´ë±Ô¸ð ¾ð¾î ¸ðµ¨ Áö¿øÀ» Ãß°¡ÇÑ´Ù°í ¹àÇû´Ù. ´õºÒ¾î VRAM 8GB ÀÌ»ó RTX GPU°¡ žÀçµÈ µ¥½ºÅ©Åé°ú ³ëÆ®ºÏ¿¡¼ ±î´Ù·Î¿î AI ¿öÅ©·Îµå¿¡ ´ëÇÑ º¸´Ù ½¬¿î ¾×¼¼½º¸¦ Áö¿øÇÒ °èȹÀÌ´Ù.
À©µµ¿ì(Windows) 11 PCÀÇ AI´Â Å×Å© ºÐ¾ß¿¡ ÀÖ¾î ȹ±âÀûÀÎ ÀüȯÁ¡ÀÌ´Ù. ÀÌ´Â °ÔÀ̸Ó, Å©¸®¿¡ÀÌÅÍ, ½ºÆ®¸®¸Ó, Á÷ÀåÀÎ, ÇлýÀº ¹°·ÐÀ̰í ÀÏ¹Ý PC »ç¿ëÀÚ¿¡°Ôµµ Çõ½ÅÀûÀÎ °æÇèÀ» Á¦°øÇÑ´Ù.
AI žÀ縦 ÅëÇØ 1¾ï ´ë°¡ ³Ñ´Â À©µµ¿ì PC¿Í RTX GPU ±â¹Ý ¿öÅ©½ºÅ×À̼ǿ¡¼ »ç¿ëÀÚÀÇ »ý»ê¼ºÀ» Àü·Ê ¾øÀÌ Çâ»ó½Ãų ¼ö ÀÖ°Ô µÆ´Ù. ¶ÇÇÑ ¿£ºñµð¾Æ RTX ±â¼úÀº °³¹ßÀÚ°¡ ÄÄÇ»ÅÍ »ç¿ë ¹æ½ÄÀ» º¯È½Ãų AI ¾ÖÇø®ÄÉÀ̼ÇÀ» º¸´Ù ½±°Ô °³¹ßÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù.
¸¶ÀÌÅ©·Î¼ÒÇÁÆ® À̱׳ªÀÌÆ®(Microsoft Ignite)¿¡¼ ¹ßÇ¥µÈ »õ·Î¿î ÃÖÀûÈ, ¸ðµ¨, ¸®¼Ò½º´Â °³¹ßÀÚ°¡ »õ·Î¿î ÃÖÁ¾ »ç¿ëÀÚ °æÇèÀ» ´õ ºü¸£°Ô Á¦°øÇÒ ¼ö ÀÖµµ·Ï µ½´Â´Ù.
À©µµ¿ì¿ë ÅÙ¼RT-LLMÀº °ð »õ·Î¿î ·¡ÆÛ(Wrapper)¸¦ ÅëÇØ ¿ÀÇÂAI(OpenAI)ÀÇ Àαâ äÆÃ API¿Í ȣȯµÉ ¿¹Á¤ÀÌ´Ù. À̸¦ ÅëÇØ ¼ö¹é °³ÀÇ °³¹ßÀÚ ÇÁ·ÎÁ§Æ®¿Í ¾ÖÇø®ÄÉÀ̼ÇÀ» Ŭ¶ó¿ìµå°¡ ¾Æ´Ñ RTX°¡ žÀçµÈ PC¿¡¼ ·ÎÄ÷Π½ÇÇàÇÒ ¼ö ÀÖÀ¸¸ç, °³ÀÎÀ̳ª °íÀ¯ µ¥ÀÌÅ͸¦ À©µµ¿ì 11 PC¿¡ ÀúÀåÇÒ ¼ö ÀÖ´Ù.
¸ÂÃã »ý¼ºÇü AI´Â ÇÁ·ÎÁ§Æ® À¯Áö¿¡ ¸¹Àº ½Ã°£°ú ¿¡³ÊÁö¸¦ ¼Ò¸ðÇÑ´Ù. ƯÈ÷ ´Ù¾çÇÑ È¯°æ°ú Ç÷§Æû¿¡¼ Çù¾÷°ú ¹èÆ÷¸¦ ÁøÇàÇÒ °æ¿ì ÇÁ·Î¼¼½º°¡ ¸Å¿ì º¹ÀâÇÏ°í ¿À·£ ½Ã°£ÀÌ ¼Ò¿äµÉ ¼ö ÀÖ´Ù.
AI ¿öÅ©º¥Ä¡(AI Workbench)´Â °£ÆíÇÑ ÅëÇÕ ÅøÅ¶À¸·Î, °³¹ßÀÚ°¡ PC ¶Ç´Â ¿öÅ©½ºÅ×À̼ǿ¡¼ »çÀü ÈÆ·ÃµÈ »ý¼ºÇü AI ¸ðµ¨°ú LLMÀ» ºü¸£°Ô »ý¼º, Å×½ºÆ®, »ç¿ëÀÚ ÁöÁ¤ÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù. ´õºÒ¾î AI ÇÁ·ÎÁ§Æ® ±¸¼º°ú ƯÁ¤ »ç¿ë »ç·Ê¿¡ ¸Â´Â ¸ðµ¨ Á¶Á¤À» À§ÇÑ ´ÜÀÏ Ç÷§ÆûÀ» Á¦°øÇÑ´Ù.
À̸¦ ÅëÇØ ¿øÈ°ÇÑ Çù¾÷°ú ¹èÆ÷°¡ °¡´ÉÇØÁö¸ç, °³¹ßÀÚµéÀº ºñ¿ë È¿À²ÀûÀ̰í È®Àå °¡´ÉÇÑ »ý¼ºÇü AI ¸ðµ¨À» ºü¸£°Ô °³¹ßÇÒ ¼ö ÀÖ´Ù. ¾ó¸® ¾×¼¼½º¿¡ µî·ÏÇÏ¸é ºü¸£°Ô È®ÀåµÇ´Â ÀÌ´Ï¼ÅÆ¼ºê¿¡ °¡Àå ¸ÕÀú ¾×¼¼½ºÇϰí ÇâÈÄ ¾÷µ¥ÀÌÆ®¸¦ ¹ÞÀ» ¼ö ÀÖ´Ù.
¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â AI °³¹ßÀÚ¸¦ Áö¿øÇϱâ À§ÇØ »õ·Î¿î ´ÙÀÌ·ºÆ®ML(DirectML) °³¼± »çÇ×À» Ãâ½ÃÇÑ´Ù. ÀÌ·Î½á °¡Àå Àαâ ÀÖ´Â ÆÄ¿îµ¥ÀÌ¼Ç AI ¸ðµ¨ Áß ÇϳªÀÎ ¶ó¸¶ 2(Llama 2)¸¦ °¡¼ÓÇØ ¼º´É¿¡ ´ëÇÑ »õ·Î¿î Ç¥ÁØÀ» ¼³Á¤ÇÏ°í °ø±Þ¾÷ü °£ ¹èÆ÷¸¦ À§ÇÑ ´õ ¸¹Àº ¿É¼ÇÀ» Á¦°øÇÑ´Ù.
ÈÞ´ë °¡´ÉÇÑ AI
Áö³ ´Þ ¿£ºñµð¾Æ´Â LLM Ãß·Ð °¡¼ÓÀ» À§ÇÑ ¶óÀ̺귯¸®ÀÎ À©µµ¿ì¿ë ÅÙ¼RT-LLMÀ» ¹ßÇ¥Çß´Ù.
ÀÌ´Þ ¸»¿¡ Ãâ½ÃµÉ ÅÙ¼RT-LLM v0.6.0¿¡¼´Â Ãß·Ð ¼º´ÉÀÌ ÃÖ´ë 5¹è ´õ »¡¶óÁö°í, »õ·Î¿î ¹Ì½ºÆ®¶ö(Mistral) 7B¿Í ³×¸ðÆ®·Ð(Nemotron)-3 8B¸¦ ºñ·ÔÇÑ Àαâ LLMÀ» Ãß°¡·Î Áö¿øÇÒ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ LLM ¹öÀüÀº 8GB ÀÌ»óÀÇ RAMÀÌ Å¾ÀçµÈ ¸ðµç ÁöÆ÷½º(GeForce) RTX 30 ½Ã¸®Áî¿Í 40 ½Ã¸®Áî GPU¿¡¼ ½ÇÇàµÇ¸ç, È޴뼺ÀÌ °¡Àå ¶Ù¾î³ ÀϺΠÀ©µµ¿ì µð¹ÙÀ̽º¿¡¼µµ ºü¸£°í Á¤È®ÇÑ ·ÎÄà LLM ±â´ÉÀ» ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù.
»õ·Î¿î ÅÙ¼RT-LLM v0.6.0À¸·Î ¼º´ÉÀÌ ÃÖ´ë 5¹è Çâ»óµÈ´Ù.
»õ·Î¿î ÅÙ¼RT-LLM°¡ Ãâ½ÃµÇ¸é ¿©±â¿¡¼ ¼³Ä¡ÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ ¿©±â¿¡¼ ÃÖÀûÈµÈ ÃֽЏðµ¨À» È®ÀÎÇÒ ¼ö ÀÖ´Ù.
ÀÚ½ÅÀÖ´Â ´ëÈ
Àü ¼¼°èÀÇ °³¹ßÀÚ¿Í ¾ÖÈ£°¡µéÀº À¥ ÄÜÅÙÃ÷ ¿ä¾à, ¹®¼¿Í À̸ÞÀÏ ÃÊ¾È ÀÛ¼º, µ¥ÀÌÅÍ ºÐ¼®°ú ½Ã°¢È, ÇÁ·¹Á¨Å×ÀÌ¼Ç Á¦ÀÛ µî ´Ù¾çÇÑ ¾ÖÇø®ÄÉÀ̼ǿ¡¼ ¿ÀÇÂAIÀÇ Ãª(Chat)API¸¦ »ç¿ëÇϰí ÀÖ´Ù.
ÀÌ·¯ÇÑ Å¬¶ó¿ìµå ±â¹Ý AI°¡ ´ç¸éÇÑ ÇÑ °¡Áö °úÁ¦´Â »ç¿ëÀÚ°¡ ÀÔ·Â µ¥ÀÌÅ͸¦ ¾÷·ÎµåÇØ¾ß ÇϹǷΠ°³ÀÎ ¶Ç´Â °íÀ¯ µ¥ÀÌÅͳª ´ë±Ô¸ð µ¥ÀÌÅÍ ¼¼Æ® ÀÛ¾÷¿¡´Â ÀûÇÕÇÏÁö ¾Ê´Ù´Â Á¡ÀÌ´Ù.
¿£ºñµð¾Æ´Â ÀÌ·¯ÇÑ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ, »õ·Î¿î ·¡ÆÛ·Î À©µµ¿ì¿ë ÅÙ¼RT-LLM¿¡µµ ¿ÀÇÂAIÀÇ ÃªAPI¿Í À¯»çÇÑ API ÀÎÅÍÆäÀ̽º¸¦ Áö¿øÇÒ ¿¹Á¤ÀÌ´Ù. ÀÌ·Î½á ¸ðµ¨°ú ¾ÖÇø®ÄÉÀÌ¼Ç ¼³°è ½Ã RTX°¡ žÀçµÈ PC ·ÎÄà ȯ°æ°ú Ŭ¶ó¿ìµå ȯ°æ ¸ðµÎ¿¡¼ À¯»çÇÑ ¿öÅ©Ç÷ο츦 Á¦°øÇÒ ¼ö ÀÖ´Ù. ÀÌÁ¦ Äڵ带 ÇѵΠÁÙ¸¸ º¯°æÇÏ¸é ¼ö¹é °³ÀÇ AI ±â¹Ý °³¹ßÀÚ ÇÁ·ÎÁ§Æ®¿Í ¾ÖÇø®ÄÉÀ̼ǿ¡¼ ½Å¼ÓÇÑ ·ÎÄà AIÀÇ ÀÌÁ¡À» ´©¸± ¼ö ÀÖ´Ù. »ç¿ëÀÚ´Â µ¥ÀÌÅÍ ¼¼Æ®¸¦ Ŭ¶ó¿ìµå¿¡ ¾÷·ÎµåÇÒ °ÆÁ¤ ¾øÀÌ µ¥ÀÌÅ͸¦ PC¿¡ ÀúÀåÇÒ ¼ö ÀÖ´Ù.
°¡Àå ÁÁÀº Á¡Àº ÀÌ·¯ÇÑ ÇÁ·ÎÁ§Æ®¿Í ¾ÖÇø®ÄÉÀÌ¼Ç Áß »ó´ç¼ö°¡ ¿ÀÇ ¼Ò½º·Î Á¦°øµÅ °³¹ßÀÚ°¡ ½±°Ô ±â´ÉÀ» Ȱ¿ëÇϰí È®ÀåÇØ RTX ±â¹ÝÀÇ À©µµ¿ì¿¡¼ »ý¼ºÇü AI äÅÃÀ» ÃËÁøÇÒ ¼ö ÀÖ´Ù´Â °ÍÀÌ´Ù.
ÀÌ ·¡ÆÛ´Â ÅÙ¼RT-LLM¿¡ ÃÖÀûÈµÈ ¶ó¸¶2, ¹Ì½ºÆ®¶ö, NV LLM µî°ú °°Àº ¸ðµç LLM°ú ȣȯµÈ´Ù. ¶ÇÇÑ RTX¿¡¼ LLMÀ¸·Î ÀÛ¾÷Çϱâ À§ÇÑ ´Ù¸¥ °³¹ßÀÚ ¸®¼Ò½º¿Í ÇÔ²² ±êÇãºê(GitHub)¿¡ ÂüÁ¶ ÇÁ·ÎÁ§Æ®·Î °ø°³µÇ°í ÀÖ´Ù.
¸ðµ¨ °¡¼Ó
ÀÌÁ¦ °³¹ßÀÚ´Â ÃÖ÷´Ü AI ¸ðµ¨À» Ȱ¿ëÇϰí Å©·Î½ºº¥´õ(cross-vendor) API·Î ¹èÆ÷ÇÒ ¼ö ÀÖ´Ù. ¿£ºñµð¾Æ¿Í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®´Â ´ÙÀÌ·ºÆ®ML API·Î RTX¿¡¼ ¶ó¸¶¸¦ °¡¼ÓÇϱâ À§ÇØ Çù·ÂÇØ ¿Ô´Ù. ÀÌ´Â °³¹ßÀÚ ¿ª·® °È¸¦ À§ÇÑ µÎ ±â¾÷ÀÇ Áö¼ÓÀûÀÎ ³ë·ÂÀÇ ÀÏȯÀÌ´Ù.
°ø±Þ¾÷ü °£ ¹èÆ÷¸¦ À§ÇÑ ÃֽŠ¿É¼ÇÀº Áö³´Þ ¹ßÇ¥µÈ °¡Àå ºü¸¥ Ãß·Ð ¼º´É¿¡ ´ëÇÑ ¹ßÇ¥¸¦ ±â¹ÝÀ¸·Î Çϸç, ±× ¾î´À ¶§º¸´Ù ½±°Ô PC¿¡ AI ±â´ÉÀ» Á¦°øÇÒ ¼ö ÀÖµµ·Ï Áö¿øÇÑ´Ù.
ÃֽŠÃÖÀûȸ¦ °æÇèÇϱâ À§Çؼ´Â ÃֽŠONNX ·±Å¸ÀÓ(runtime)À» ´Ù¿î·ÎµåÇÏ°í ¸¶ÀÌÅ©·Î¼ÒÇÁÆ®ÀÇ ¼³Ä¡ ÁöħÀ» µû¶ó¾ß ÇÑ´Ù. ´õºÒ¾î 11¿ù 21ÀÏ¿¡ Ãâ½ÃµÉ ¿£ºñµð¾ÆÀÇ Ãֽеå¶óÀ̹ö ¼³Ä¡°¡ ÇÊ¿äÇÏ´Ù.
ÀÌ·¯ÇÑ »õ·Î¿î ÃÖÀûÈ, ¸ðµ¨, ¸®¼Ò½º¸¦ ÅëÇØ Àü ¼¼°è 1¾ï ´ëÀÇ RTX PC¿¡ AI ±â´É°ú ¾ÖÇø®ÄÉÀ̼ÇÀÇ °³¹ß°ú ¹èÆ÷¸¦ °¡¼ÓÇÒ ¼ö ÀÖ´Ù. ¾Æ¿ï·¯ ÀÌ¹Ì RTX GPU·Î °¡¼ÓµÈ AI ±â¹Ý ¾Û°ú °ÔÀÓÀ» Á¦°øÇÏ´Â 400°³ ÀÌ»óÀÇ ÆÄÆ®³Ê¿Í ÇÔ²²ÇÏ°Ô µÈ´Ù.
¸ðµ¨¿¡ ´ëÇÑ Á¢±Ù¼ºÀÌ ´õ¿í Çâ»óµÇ°í °³¹ßÀÚ°¡ RTX ±â¹Ý À©µµ¿ì PC¿¡ ´õ ¸¹Àº AI ±â¹Ý ±â´ÉÀ» Á¦°øÇϰí ÀÖ´Ù. ÀÌ·¯ÇÑ ±â¼ú Ȱ¿ëÇÒ ¼ö ÀÖµµ·Ï »ç¿ëÀÚ¿¡°Ô´Â RTX GPU°¡ ÇÙ½ÉÀûÀÎ ¿ªÇÒÀ» ÇÒ °ÍÀÌ´Ù.