S2W, NLPºÐ¾ß 3´ë ÇÐȸ Áß ÇϳªÀÎ ¡®NAACL 2024¡¯¿¡¼ »çÀ̹öƪ °ø°³
»çÀ̹öƪ, ¹®¸Æ ÆÄ¾ÇÇÏ´Â ¹öÆ® °íµµÈÇØ º¸¾È ¹®¼ ÀÌÇØ °¡´ÉÇÑ AI ¾ð¾î¸ðµ¨
´ÙÅ©À¥ Àü¿ë AI ¾ð¾î¸ðµ¨ ¡®´ÙÅ©¹öÆ®¡¯¸¦ ÀÕ´Â S2W ÀÚü ¾ð¾î¸ðµ¨·Î ¡®ÁÖ¸ñ¡¯
[º¸¾È´º½º ¹ÚÀºÁÖ ±âÀÚ] AI ¹× º¸¾È Àü¹® µ¥ÀÌÅÍ ÀÎÅÚ¸®Àü½º ±â¾÷ ¡®¿¡½ºÅõ´õºíÀ¯(ÀÌÇÏ S2W, ´ëÇ¥ ¼»ó´ö)¡¯´Â ¼¼°è 3´ë ÀΰøÁö´É ÇÐȸ·Î ²ÅÈ÷´Â ¡®NAACL(ºÏ¹Ì Àü»ê¾ð¾îÇÐÇÐȸ)¡¯¿¡¼ »çÀ̹öº¸¾È ¹®¼¿¡ Æ¯ÈµÈ AI ¾ð¾î¸ðµ¨ ¡®»çÀ̹öƪ(CyBERTuned)¡¯À» °ø°³Çß´Ù°í 20ÀÏ ¹àÇû´Ù.

¡ãS2W, ¼¼°è ÃÖÁ¤»ó ÀΰøÁö´É ÇÐȸ¼ º¸¾È Æ¯È AI ¾ð¾î¸ðµ¨ ¡®»çÀ̹öƪ¡¯ °ø°³[À̹ÌÁö=S2W]
S2W°¡ NLP(ÀÚ¿¬¾îó¸®) ÃÖ°í ±ÇÀ§ ÇÐȸ¿¡¼ ¼±µµÀûÀÎ AI ¾ð¾î¸ðµ¨ ±â¼ú·ÂÀ» ÀÎÁ¤¹ÞÀ¸¸ç ¼¼°è ½ÃÀåÀÇ ÁÖ¸ñÀ» ¹Þ¾Ò´Ù.
S2W´Â 6¿ù 16ÀϺÎÅÍ 21ÀϱîÁö ¸ß½ÃÄÚ½ÃÆ¼¿¡¼ ¿¸° NAACL 2024¿¡ Âü¼®ÇØ ¡®»çÀ̹öº¸¾È ¿µ¿ª¿¡¼ÀÇ »çÀü ÇнÀÀ» À§ÇÑ ºñ¾ð¾îÀû ¿ä¼Ò Ȱ¿ë(Ignore Me But Don¡¯t Replace Me: Utilizing Non-Linguistic Elements for Pretraining on the Cybersecurity Domain)¡¯ ³í¹®À» ¹ßÇ¥Çß´Ù. À̷νá S2W´Â NLP(ÀÚ¿¬¾îó¸®) ºÐ¾ß ¼¼°è ÃÖÁ¤»ó±Þ ÇÐȸ(ACL, EMNLP, NAACL)¿¡¼ 3³â ¿¬¼ÓÀ¸·Î ³í¹®ÀÌ Ã¤ÅõǴ ¼º°ú¸¦ ´Þ¼ºÇß´Ù.
S2W¿Í Ä«À̽ºÆ®(KAIST) ¿¬±¸ÁøÀÌ °øµ¿ °³¹ßÇÑ »çÀ̹öƪÀº »çÀ̹ö º¸¾È µ¥ÀÌÅÍ Æ¯¼ºÀ» °í·ÁÇØ ¹öÆ®(BERT) µî ÀÎÄÚ´õ ¸ðµ¨À» È¿°úÀûÀ¸·Î ¹Ì¼¼Á¶Á¤ Áï, ÆÄÀÎÆ©´×(Tuned)ÇÑ AI ¾ð¾î¸ðµ¨À̶ó´Â Àǹ̸¦ ´ã°í ÀÖ´Ù. 2023³â ¼¼°è ÃÖÃÊ·Î ¼±º¸ÀÎ ´ÙÅ©À¥ Àü¿ë AI ¾ð¾î¸ðµ¨ ¡®´ÙÅ©¹öÆ®¡¯¿¡ ÀÌ¾î µÎ ¹øÂ°·Î °ø°³ÇÏ´Â S2W¸¸ÀÇ ¾ð¾î¸ðµ¨·Îµµ ´«±æÀ» ²ö´Ù.
»çÀ̹öƪ ±âº» ƲÀÌ µÇ´Â ¡®¹öÆ®¡¯¶õ ¾ð¾î¸ðµ¨¿¡ ´õ¿í °íÂ÷¿ø ´Ü°èÀÎ ¹®¸ÆÀ» ÀÌÇØÇÒ ¼ö ÀÖµµ·Ï MLM(Masked Language Modeling)À» °ÅÃÄ ÀÛ¾÷ ¼öÇà ´É·ÂÀ» Çâ»óÇÏ´Â ¾ç¹æÇâ ¾ð¾î ÀÎÄÚ´õ ¸ðµ¨ÀÌ´Ù. ¹öÆ®°¡ ÀϹÝÀûÀÎ ¹®ÀÚ¿ ¿Ü¿¡µµ URL, SHA Hashó·³ »ç¶÷ÀÌ ½±°Ô ÇØ¼®Çϱ⠾î·Á¿î ºñ¾ð¾îÀû ¿ä¼Ò°¡ ´ã±ä »çÀ̹öº¸¾È ¹®¼¸¦ Àß ÀÌÇØÇϵµ·Ï µ½´Â °ÍÀÌ »çÀ̹öƪ Çٽɱâ¼úÀÌ´Ù.
¾÷°è Àü¹®°¡µé¿¡ µû¸£¸é ±âÁ¸¿¡µµ º¸¾È ¹®¼ ´ë»óÀ¸·Î AI ¾ð¾î¸ðµ¨À» ÇнÀÇÑ ½Ãµµ´Â ÀÖ¾ú´Ù. ´Ù¸¸ ÀϹÝÀûÀ¸·Î »ç¿ëµÇ´Â ¾ð¾î¿Í Àü¹®ÀûÀÎ »çÀ̹öº¸¾È Áö½Ä¿¡ »ç¿ëµÇ´Â ¾ð¾î°¡ ´Þ¶ó ¸Æ¶ôÀ» Á¦´ë·Î ÀÌÇØÇÏ´Â µ¥ ÇѰ谡 Á¸ÀçÇß´Ù.
S2W´Â À̸¦ °³¼±Çϱâ À§ÇØ ÀÚüÀûÀ¸·Î ºñÁ¤Çü µ¥ÀÌÅ͸¦ °¡°øÇÏ°í µ¶º¸ÀûÀÎ ¸ð´ÏÅ͸µ ±â¼ú·Î º¸¾È ¹®¼ µ¥ÀÌÅ͸¦ ¼öÁýÇß´Ù. ºñ¾ð¾îÀû ¿ä¼Ò¿¡ ´ëÇØ¼´Â ¹®Àå ±¸¼º ¿ä¼Ò ´ë½Å À¯Çü(Class)À» ÇнÀÇϵµ·Ï ¹æ½ÄÀ» º¯°æÇß´Ù. À̸¦ ÅëÇØ »çÀ̹öº¸¾È °ü·Ã ¹®¼ ºÐ·ù, °³Ã¼¸í ÀνÄ, »ç°Ç ŽÁö µî ´Ù¾çÇÑ ÀÛ¾÷¿¡¼ À¯ÀǹÌÇÑ °á°ú¸¦ ¾òÀ» ¼ö ÀÖ¾ú´Ù.
»çÀ̹öƪÀº ¿ÀǼҽº·Î °ø°³µÅ ¾ÕÀ¸·Î AI¸¦ ÀÌ¿ëÇØ »çÀ̹öº¸¾È ¹®¼¸¦ ºÐ¼®Çϰí À̸¦ ÅëÇØ »õ·Î¿î À§Çù ¹ß±¼ ¹× È¿°úÀû ´ëÀÀÀ» °í¹ÎÇÏ´Â Á¶Á÷°ú Àü¹®°¡¿¡°Ô µµ¿òÀ» ÁÙ °ÍÀ¸·Î ±â´ëµÈ´Ù. ¶ÇÇÑ, S2WÀÇ ÀÚºñ½º, ÄùÀÌ»ç µî ÀÚ»ç ¼ºñ½º¿¡µµ Àû¿ëÇÏ´Â µî ´Ù¾çÇÑ AI °ü·Ã ¸ðµâ¿¡ È®´ë Àû¿ëÇÒ ¿¹Á¤ÀÌ´Ù.
±¸Ã¼ÀûÀ¸·Î »çÀ̹öƪÀ» ÅëÇØ À¥»óÀÇ ¼ö¸¹Àº »çÀ̹ö º¸¾È ¹®¼¸¦ ½Ç½Ã°£À¸·Î ÀÎÄÚµùÇØ º¤ÅÍDB¿¡ ÀúÀåÇÑ´Ù. »ç¿ëÀÚ Áú¹®ÀÌ ÁÖ¾îÁö¸é °Ë»öÁõ°»ý¼º(RAG) ¹æ½ÄÀ¸·Î Áú¹®¿¡ ´äÀÌ µÉ ¼ö ÀÖ´Â ¹®¼¸¦ ºü¸£°Ô °Ë»ö ÈÄ °Å´ë¾ð¾î¸ðµ¨(LLM)À» ÅëÇØ ´äº¯À» »ý¼º, »ç¿ëÀÚ¿¡°Ô Á¦°øÇÏ´Â ½ÄÀÇ °Ë»ö ±â¹Ý 꺿 ¼ºñ½º¸¦ °ø°³ÇÒ °èȹÀÌ´Ù.
S2W ¼»ó´ö ´ëÇ¥´Â ¡°»çÀ̹öƪÀº º¸¾È À§ÇùÀ» ¹ß°ßÇÏ´Â °ÍÀ» ³Ñ¾î ½ÇÁúÀûÀÎ ÇØ°á ¼Ö·ç¼Ç±îÁö Á¦½ÃÇÒ ¼ö ÀÖ´Â °·ÂÇÑ º¸¾È ±â¼ú·Î S2W°¡ ±Û·Î¹ú µ¥ÀÌÅÍ ÀÎÅÚ¸®Àü½º ±â¾÷À¸·Î °í¼Ó ¼ºÀåÇÏ´Â ÇÙ½É µ¿·ÂÀÌ µÉ °Í¡±À̶ó¸ç ¡°¾ÕÀ¸·Îµµ º¸¾È Æ¯È AI ¾ð¾î¸ðµ¨ ºÐ¾ß¿¡¼ µ¶º¸Àû ±â¼ú °æÀï·ÂÀ» À¯ÁöÇØ ³ª°¥ °Í¡±À̶ó°í ÀüÇß´Ù.
ÇÑÆí, S2W´Â ÃÖ±Ù AI ¹× º¸¾È Àü¹® µ¥ÀÌÅÍ ÀÎÅÚ¸®Àü½º ±â¾÷À¸·Î¼ÀÇ ºñÀüÀ» ¹ßÇ¥ÇØ ±¹³»¿Ü ½ÃÀå¿¡¼ À̸ñÀ» ¸ðÀº ¹Ù ÀÖ´Ù.
[¹ÚÀºÁÖ ±âÀÚ(boan5@boannews.com)]
<ÀúÀÛ±ÇÀÚ: º¸¾È´º½º(www.boannews.com) ¹«´ÜÀüÀç-Àç¹èÆ÷±ÝÁö>