ºñ¿µ¾î ¾ð¾î¿¡¼ ȯ°¢ Çö»ó µÎµå·¯Á®¡¦AI ½Å·Ú¼º ¹× ¼Ò¹ö¸° AI ³íÀÇ¿¡ »õ ½Ã»çÁ¡ Á¦½Ã
¡°½Å·ÚÇÒ ¼ö ÀÖ´Â AI ¸¸µé±â À§ÇÑ ¼±µµÀû ¿¬±¸ ¼º°ú Áö¼Ó âÃâÇÒ °Í¡±
[º¸¾È´º½º ¿©ÀÌ·¹ ±âÀÚ] ºòµ¥ÀÌÅÍ ºÐ¼® ÀΰøÁö´É(AI) ±â¾÷ ¿¡½ºÅõ´õºíÀ¯(S2W)´Â 10ÀÏ ´ë±Ô¸ð¾ð¾î¸ðµ¨(LLM) ÅäÅ«È ±¸Á¶ÀÇ ±Ùº»Àû Ãë¾àÁ¡À» ±Ô¸íÇÑ S2W ¹× Çѱ¹°úÇбâ¼ú¿ø(KAIST) °øµ¿¿¬±¸ÆÀ ³í¹®ÀÌ ¼¼°è ÃÖ°í ±ÇÀ§ÀÇ ÀÚ¿¬¾îó¸®(NLP) ÇÐȸ ¡®ÀÚ¿¬¾î󸮹æ¹ý·ÐÇÐȸ(EMNLP) 2025¡¯¿¡ äÅÃµÆ´Ù°í ¹àÇû´Ù.

[ÀÚ·á: S2W]
EMNLP´Â ¡®Àü»ê¾ð¾îÇÐÇÐȸ¡¯(ACL) ¹× ¡®ºÏ¹ÌÀü»ê¾ð¾îÇÐÇÐȸ¡¯(NAACL)¿Í ÇÔ²² ÀÚ¿¬¾îó¸®(NLP) ºÐ¾ß ¼¼°è 3´ë Çмú´ëȸ Áß Çϳª·Î ²ÅÈù´Ù. À̹ø äÅÃÀ» ÅëÇØ S2W´Â ±Û·Î¹ú ÃÖ°í ±ÇÀ§ AI ÇÐȸ¿¡ 4³â ¿¬¼ÓÀ¸·Î ³í¹®À» µîÀçÇß´Ù.
¾Õ¼ S2W´Â ´ÙÅ©À¥ ¾ð¾î °ü·Ã(2022³â) ¹× ÀÚü °³¹ß »çÀ̹öº¸¾È ¹®¼ Æ¯È ¾ð¾î¸ðµ¨ ¡®»çÀ̹öƪ¡¯(CyBERTuned) °ü·Ã ³í¹®(2024³â)À¸·Î NAACL¿¡¼ µÎ Â÷·Ê ³í¹®À» ¹ßÇ¥ÇÑ ¹Ù ÀÖÀ¸¸ç, 2023³â¿¡´Â µ¶ÀÚ °³¹ßÇÑ ¼¼°è ÃÖÃÊÀÇ ´ÙÅ©À¥ µµ¸ÞÀÎ Æ¯È ¾ð¾î¸ðµ¨ ¡®´ÙÅ©¹öÆ®¡¯ °ü·Ã ³í¹®À» ÅëÇØ ACL¿¡ äÅÃµÈ ¹Ù ÀÖ´Ù.
S2W ¿¬±¸ÁøÀÌ ¹ßÇ¥ÇÑ ¡®¹ÙÀÌÆ® ·¹º§ ÅäÅ©³ªÀÌÀú ³» ºÒ¿ÏÀü ÅäÅ«ÀÇ Ãë¾àÁ¡À» µå·¯³½ ºñÁ¤»óÀû ¹ÙÀ̱׷¥¡¯(Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers) ³í¹®Àº LLM ³»ºÎÀÇ Ã³¸® ±â´É Áß Çϳª·Î ¹®Àå ºÐ¼® °úÁ¤¿¡¼ ¹®ÀÚ¸¦ ºÐÀýÇØ ó¸®ÇÏ´Â µµ±¸ÀÎ ¡®ÅäÅ©³ªÀÌÀú¡¯°¡ ȯ°¢À» À¯¹ßÇÒ ¼ö ÀÖ´Ù´Â ³»¿ëÀ» ´ã¾Ò´Ù. ƯÈ÷, LLMÀÌ ºñ¿µ¾î±Ç ¾ð¾î·Î Ȱ¿ëµÇ´Â °æ¿ì ÅäÅ©³ªÀÌÀú°¡ ÀϺΠ¹®ÀÚ¸¦ ¿ÏÀüÈ÷ Âɰ³Áö ¸øÇØ ÇØ¼®µÇÁö ¸øÇÑ Ã¤ ¡®ºÒ¿ÏÀü ÅäÅ«¡¯À¸·Î ³²´Â Çö»ó¿¡ ÁÖ¸ñÇß´Ù.
S2W´Â ÅäÅ©³ªÀÌÀú ¼³°è·Î ¹ß»ýÇÑ È¯°¢ Çö»óÀÌ ¿µ¾î ÀÌ¿ÜÀÇ ¾ð¾î¿¡¼ ÀÚÁÖ ³ªÅ¸³´Ù´Â Á¡¿¡¼, ¸ðµ¨ÀÇ ´äº¯ ǰÁúÀÌ ¿µ¾î±Çº¸´Ù ºñ¿µ¾î±Ç¿¡¼ ´õ¿í ÀúÇ쵃 ¼ö ÀÖ´Ù´Â °¡´É¼ºÀ» Á¦½ÃÇß´Ù.
¿µ¾î´Â ÇÑ ±ÛÀÚ°¡ 1¹ÙÀÌÆ®(byte)·Î ±¸¼ºµÇÁö¸¸ Çѱ¹¾î, ÀϺ»¾î, Áß±¹¾î µîÀº ÇÑ ±ÛÀÚ°¡ ¿©·¯ ¹ÙÀÌÆ®·Î Ç¥ÇöµÈ´Ù. ÀÌ ¶§¹®¿¡ ¡®¹ÙÀÌÆ® Æä¾î ÀÎÄÚµù(BPE)¡¯ ±â¹Ý ÅäÅ©³ªÀÌÀú´Â ¹®ÀÚ¸¦ ¹ÙÀÌÆ® ´ÜÀ§·Î ºÐÇØÇÏ´Â °úÁ¤¿¡¼ ±ÛÀÚÀÇ Áß°£ÀÌ À߸° ºÒ¿ÏÀü ÅäÅ«À» »ý¼ºÇϱ⠽±´Ù. ÀÌ·¯ÇÑ ±¸Á¶Àû ÇѰ谡 ºñ¿µ¾î±Ç¿¡¼ÀÇ ÀÇ¹Ì º¹¿ø ½ÇÆÐ³ª ¹®¸Æ ¿Ö°îÀ¸·Î À̾îÁ®, ȯ°¢ ¹ß»ý·üÀ» ³ôÀÌ´Â ¿äÀÎÀ¸·Î ÀÛ¿ëÇÒ ¼ö ÀÖ´Â °ÍÀÌ´Ù.
³í¹®ÀÇ °øµ¿ÀúÀÚ·Î Âü¿©ÇÑ ¹Ú±ÙÅ S2W ÃÖ°í±â¼úÃ¥ÀÓÀÚ(CTO)´Â ¡°º» ³í¹®Àº °¢±¹ÀÌ ÀÚ±¹ ¾ð¾î¿Í µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î AI¸¦ °³¹ß¡¤¿î¿µÇØ¾ß ÇÏ´Â ¡®¼Ò¹ö¸° AI¡¯¿¡ °üÇÑ ³íÀÇ¿¡ À¯ÀǹÌÇÑ ½Ã»çÁ¡À» Á¦°øÇÑ´Ù¡±¸ç ¡°ÅäÅ©³ªÀÌÀú°¡ ¿µ¾î ¿Ü ¾ð¾î¸¦ ¾ÈÁ¤ÀûÀ¸·Î ó¸®ÇÏÁö ¸øÇÑ´Ù¸é, ¿©·¯ ±¹°¡ÀÇ ÀÚ±¹ ¾ð¾î ±â¹Ý AI ¸ðµ¨À» ½Å·Ú¼º ÀÖ°Ô ¿î¿µÇÏ±â ¾î·Æ±â ¶§¹®¡±À̶ó°í ¼³¸íÇß´Ù.
ÀÌ¾î ±×´Â ¡°S2W´Â ½Å·ÚÇÒ ¼ö ÀÖ´Â AI¸¦ ¸¸µé±â À§ÇÑ °¡Àå ¼±µµÀûÀÎ ¿¬±¸ ¼º°ú¸¦ Áö¼Ó âÃâÇÒ °èȹ¡±À̶ó°í ¹àÇû´Ù.
[¿©ÀÌ·¹ ±âÀÚ(gore@boannews.com)]
<ÀúÀÛ±ÇÀÚ: º¸¾È´º½º(www.boannews.com) ¹«´ÜÀüÀç-Àç¹èÆ÷±ÝÁö>












¿©ÀÌ·¹±âÀÚ ±â»çº¸±â








































.jpg)



.jpg)


.jpg)
