³×À̹ö(´ëÇ¥ÀÌ»ç »çÀå ÇѼº¼÷)´Â ¹æ¼Û ´º½º ÄÜÅÙÃ÷¿¡ ³×À̹öÀÇ ÀΰøÁö´É(AI) ±â¼ú Ç÷§ÆûÀΠŬ·Î¹Ù(Clova) ¿£ÁøÀ» Ȱ¿ëÇÑ ÀÚµ¿ÀÚ¸·»ý¼º ¼ºñ½º¸¦ ¼±º¸ÀÎ´Ù°í ¹àÇû´Ù.

À̸¦ ÅëÇØ, PC/¸ð¹ÙÀÏ À¥ ¹× ³×À̹öTV¾Û¿¡¼ ¹æ¼Û ´º½º(Áö»óÆÄ 3»ç, Á¾Æí 4»ç, º¸µµÃ¤³Î 2»ç )¸¦ ½ÃûÇÏ´Â ÀÌ¿ëÀÚµéÀº ´º½º ¿µ»ó°ú ÀΰøÁö´É ¿£ÁøÀÌ »ý¼ºÇÑ ÀÚ¸·À» ÇÔ²² »ç¿ëÇÒ ¼ö ÀÖ´Ù.
À̸¦ ÅëÇØ, ´ëÁß±³ÅëÀ̳ª °ø°øÀå¼Ò¿Í °°ÀÌ À½¼º ÄÜÅÙÃ÷¸¦ Áñ±æ ¼ö ¾ø´Â ȯ°æ¿¡¼µµ µ¿¿µ»ó ´º½º¸¦ »ý»ýÇÏ°Ô Á¢ÇÒ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÈ´Ù. ÀÚ¸· ¼ºñ½º¸¦ ÀÌ¿ëÇÏ°í ½ÍÀº ÀÌ¿ëÀÚ´Â, ±â»ç¿¡ Æ÷ÇÔµÈ µ¿¿µ»ó Ç÷¹ÀÌ¾î ¿ìÃø ÇÏ´ÜÀÇ ÀÚ¸· ±â´ÉÀ» °£´ÜÈ÷ ¼³Á¤ÇÒ ¼ö ÀÖ´Ù.
ÇØ´ç ±â´ÉÀº ³×À̹öÀÇ AI ±â¼ú Ç÷§Æû Ŭ·Î¹ÙÀÇ STT(Speech to Text) ¿£ÁøÀÌ °íµµÈµÊ¿¡ µû¶ó ¼±º¸ÀÌ°Ô µÇ¾ú´Ù. STT´Â À½¼ºÀ» ¹®ÀÚ·Î º¯È¯ÇÏ´Â ÀΰøÁö´É ±â¼ú·Î, À½¼º°Ë»öÀ̳ª ÀΰøÁö´É ½ºÇÇÄ¿¿Í °°ÀÌ À½¼º Á¤º¸¸¦ ¸Å°³·Î Ȱ¿ëÇÏ´Â ¼ºñ½ºÀÇ ÇÙ½É ±â¼ú Áß ÇϳªÀÌ´Ù.
ƯÈ÷, ±ä ¹®ÀåÀÌ À̾îÁö´Â ¿µ»ó º¸µµ¿¡µµ ³ôÀº Á¤È®µµÀÇ ÀÚ¸·ÀÌ °¡´ÉÇß´ø ÀÌÀ¯´Â, ´Ü¹® À§ÁÖÀÇ STT ±â´É¿¡¼ ÇѰÉÀ½ ´õ ³ª¾Æ°¡, Àå¹®ÀÇ À½¼º ¹Þ¾Æ¾²±â¿¡ Æ¯ÈµÈ Å¬·Î¹ÙÀÇ end-to-end ¹æ½Ä À½¼ºÀÎ½Ä ¿£ÁøÀΠŬ·Î¹Ù NEST(Neural End-to-end Speech Transcriber, ½ÉÃþ½Å°æ¸Á ¿£µåÅõ¿£µå À½¼º ÀÚµ¿ÀÚ¸· »ý¼º±â)°¡ µµÀԵǾú±â ¶§¹®ÀÌ´Ù. ½ÇÁ¦ ³»ºÎ Å×½ºÆ® °á°ú, ÀΰøÁö´É »ý¼º ÀÚ¸·ÀÇ Á¤È®µµ°¡ 92% ÀÌ»óÀÎ °ÍÀ¸·Î ³ªÅ¸³µ´Ù.
À̹ø ±â´ÉÀº ³×À̹ö À¥(PC, ¸ð¹ÙÀÏ) ¹× ³×À̹öTV¾Û ȯ°æ¿¡¼ ¿ì¼± Àû¿ëµÇ¾úÀ¸¸ç, 1ºÐ±â ³»¿¡´Â ³×À̹ö¾ÛÀ» ÅëÇÑ µ¿¿µ»ó ´º½º ½Ãû ½Ã¿¡µµ Ȱ¿ëÇÒ ¼ö ÀÖ°Ô µÉ ¿¹Á¤ÀÌ´Ù.
|