¸Ó¸®¸»
¿À´Ã³¯ µðÁöÅÐ Ä«¸Þ¶óÀÇ º¸±ÞÀ¸·Î µðÁöÅÐ »çÁøÀ̳ª µ¿¿µ»óÀÌ ¿ì¸®µéÀÇ ÀÏ»ó¿¡ ´ë·®À¸·Î Á¸ÀçÇϸç ÀÌ·¯ÇÑ µðÁöÅÐ ¿µ»ó¿¡´Â ¿©·¯ °¡Áö Àå¸éÀ̳ª ¹°Ã¼°¡ ÃÔ¿µµÇ¾î ÀÖ´Ù. ÀÌó·³ ½ÇÁ¦ Àå¸éÀ» Á¦¾àÀÌ ¾ø´Â »óÅ¿¡¼ ÃÔ¿µÇÑ È»ó Áß¿¡¼ ¾î¶² ¹°Ã¼°¡ È»ó ³»¿¡ Á¸ÀçÇÏ´ÂÁö, ±×¸®°í ¾î¶² Àå¸éÀÎÁö¸¦ ÀϹÝÀûÀÎ ¸íĪ¿¡¼ ÄÄÇ»ÅÍ°¡ ÀνÄÇÏ´Â °ÍÀ» ÀÏ¹Ý ¹°Ã¼ÀνÄÀ̶ó ºÎ¸¥´Ù. ÀÏ¹Ý ¹°Ã¼ÀνÄÀ» Çؼ®ÇÏ·Á¸é ÄÄÇ»ÅÍÀÇ ¿¬»ê´É·ÂÀÌ Áß¿äÇѵ¥, Á¾·¡ÀÇ ÄÄÇ»ÅÍ¿¡¼´Â ´ë·®ÀÇ µ¥ÀÌÅÍ Ã³¸®°¡ ¾î·Á¿ö Àû¿ëÀÌ ºÒ°¡´ÉÇß´Ù. ÇÏÁö¸¸ ÃÖ±Ù ÄÄÇ»ÅÍ°¡ ¹ßÀüÇÏ¸é¼ ´ë·®ÀÇ µ¥ÀÌÅ͸¦ °í¼ÓÀ¸·Î ó¸®ÇÏ´Â °ÍÀÌ °¡´ÉÇØÁ³°í, ¶ÇÇÑ ±â°è ÇнÀ ºÐ¾ß¿¡¼ ¿¬±¸µÈ ÇнÀ ¹æ¹ýÀÌ ÀÏ¹Ý ¹°Ã¼ÀνĿ¡ Àû¿ëÇÒ ¼ö ÀÖ°Ô µÇ¾ú±â ¶§¹®¿¡ ¸¹Àº ¹æ¹ýÀÌ Á¦¾ÈµÇ¾î ÀÖ´Ù. ±× Áß¿¡¼µµ Viola&JonesÀÇ ¾ó±¼°ËÃâ ¹æ¹ýÀ̳ª Bag-of-Keypoints¿¡ ÀÇÇÑ È»ó ºÐ·ù µî°ú °°ÀÌ Åë°èÀûÀÎ ±â°è ÇнÀ¹ýÀ» »ç¿ëÇÑ ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä ¹æ¹ýÀÌ Á¦¾ÈµÇ¾î ÀÖ´Ù. ¶ÇÇÑ °¢ ¹æ¹ýÀÇ °´°üÀûÀÎ Æò°¡¸¦ Çϱâ À§ÇØ °øÅë µ¥ÀÌÅÍ ¼¼Æ®°¡ ±¸ÃàµÇ¾î ÃÖ±Ù¿¡´Â ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä ¿¬±¸°¡ ÇÑÃþ ´õ È°¹ßÇÏ°Ô ÀÌ·ç¾îÁö°í ÀÖ´Ù.
ÀÏ¹Ý ¹°Ã¼ÀνÄÀ̶õ
ÀÏ¹Ý ¹°Ã¼ÀνÄÀ̶õ Á¦¾àÀÌ ¾ø´Â ½ÇÁ¦ ¼¼°è Àå¸éÀÇ ¿µ»ó¿¡ ´ëÇÏ¿© ÄÄÇ»ÅÍ°¡ ±× ¾È¿¡ Æ÷ÇÔµÈ ¹°Ã¼¸¦ ÀϹÝÀûÀÎ ¸íĪÀ¸·Î ÀνÄÇÏ´Â °ÍÀÌ´Ù. ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ ÃÖÁ¾ÀûÀÎ ¸ñÇ¥´Â ¡®±×¸² 1¡¯¿¡ ³ªÅ¸³»µíÀÌ ºÐÇÒ(Segmentation)µÈ °¢ ¿µ¿ª¿¡ ´ëÇÏ¿© ¹°Ã¼ Ä«Å×°í¸®ÀÇ ¶óº§À» ºÙÀÌ´Â °ÍÀ̶ó ÇÒ ¼ö ÀÖ´Ù.
ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ ¾î·Á¿ò
ÀÏ¹Ý ¹°Ã¼ÀνÄÀ» ¾î·Æ°Ô ÇÏ´Â ÁÖ¿ä ¿äÀÎÀ¸·Î¼ ÀϹÝÀûÀÎ ¸íĪÀ» °¡¸®Å°´Â Ä«Å×°í¸®°¡ ¹æ´ëÇÏ´Ù´Â °Í°ú µ¿ÀÏ ¹°Ã¼ Ä«Å×°í¸® ³»ÀÇ º¯È(Variation)ÀÇ ´Ù¾çÇÔÀ» µé ¼ö ÀÖ´Ù. ÀϹÝÀûÀÎ ¸íĪ¿¡ ÀÇÇÑ Ä«Å×°í¸® ºÐ·ù¸¦ ÇÏ´Â °æ¿ì ±× Ä«Å×°í¸® ¼ö´Â 10,000¿¡¼ 30,000ÀÌ µÈ´Ù°í ÇÑ´Ù. ¶Ç Ä«Å×°í¸® ³»¿¡´Â ¼ºêŬ·¡½º(Subclass)°¡ Á¸ÀçÇÏ´Â °æ¿ì°¡ ÀÖ´Ù. ¿¹¸¦ µé¸é ¡®ÀÚµ¿Â÷¡¯¶ó´Â Ä«Å×°í¸®¿¡´Â ¡®¼¼´Ü(Sedan)¡¯, ¡®¿Ö°Ç(Wagon)¡¯, ¡®Æ®·°¡¯°ú °°Àº Çü»óÀÇ Â÷ÀÌ, ¡®Çìµå¶óÀÌÆ®¡¯, ¡®ÇÁ·±Æ® À¯¸®¡¯¿Í °°Àº ºÎÀ§ÀÇ Â÷ÀÌ¿¡ µû¸¥ ¼ºêŬ·¡½º·Î ³ª¿ÇÒ ¼ö ÀÖ´Ù. ¶§¹®¿¡ ¾îµð±îÁö¸¦ ´ë»ó Ä«Å×°í¸®·Î ÇÒÁö ¸íÈ®ÇÏ°Ô Á¤ÀÇÇÏ´Â °ÍÀÌ ¾î·Æ´Ù.
ÇÑÆí µ¿ÀÏ ¹°Ã¼¿¡¼µµ ½ÃÁ¡ÀÇ º¯È, Á¶¸í º¯È, Occlusion, ½ºÄÉÀÏ º¯È, ¹°Ã¼ÀÇ º¯Çü µî¿¡ ÀÇÇØ ¸ð½ÀÀÌ Å©°Ô º¯ÈÇϱ⠶§¹®¿¡ ÀÌ¿Í °°Àº Á¶°Ç ÇÏ¿¡¼ ÀνÄÇÏ´Â °ÍÀº ¾î·Á¿î ¹®Á¦ÀÌ´Ù. ¶ÇÇÑ ÀÎ½Ä ´ë»óÀÇ ¹°Ã¼°¡ È»ó ÁßÀÇ ¾îµð¿¡ Á¸ÀçÇÏ°í Àִ°¡¸¦ °ËÃâÇÒ ÇÊ¿äµµ ÀÖ´Ù. ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä ¹®Á¦¿¡¼´Â ¸ð½ÀÀÇ º¯È¿¡ ºÒº¯ÇÏ°í ¶ÇÇÑ ¹°Ã¼ ÀÌ¿ÜÀÇ ¹è°æ Á¤º¸¿¡ ¿µÇâÀ» ¹ÞÁö ¾Ê´Â Ư¡ ÃßÃâ°ú º¯È¸¦ ¸¹ÀÌ Æ÷ÇÔÇÑ ÇнÀ µ¥ÀÌÅÍ ¼¼Æ®ÀÇ ±¸ÃàÀÌ Áß¿äÇØÁø´Ù.
ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ °£·«È
ÀÏ¹Ý ¹°Ã¼ ÀνÄÀº ºÒÈ®Á¤ÇÑ ¿ä¼Ò°¡ ¸¹±â ¶§¹®¿¡ ¸Å¿ì ¾î·Á¿î ¹®Á¦ÀÌ´Ù. ±×·± ±î´ßÀ¸·Î ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä ¹®Á¦¿¡ Á¦¾àÀ» µÎ´Â °ÍÀ¸·Î ¹®Á¦¸¦ °£·«ÈÇÑ´Ù. °£·«ÈÇÑ ÀÏ¹Ý ¹°Ã¼ ÀÎ½Ä ¹®Á¦ÀÇ ¿¹¸¦ ÀÌÇÏ¿¡ ³ªÅ¸³½´Ù(±×¸² 2).
-
Verification(¹°Ã¼ Á¶ÇÕ)
È»ó ÁßÀÇ ¾î¶² ¹°Ã¼¸¦ °¡¸®Å°¸ç ´ë»ó ¹°Ã¼ÀÇ Ä«Å×°í¸®ÀÎÁö¸¦ Á¶ÇÕÇÏ´Â ¹®Á¦
¿¹ : ÀÌ°ÍÀº Ã¥ÀԴϱî? -
Object categorization(È»ó ºÐ·ù)
È»ó ÁßÀÇ ¹°Ã¼°¡ ¾î¶² ¹°Ã¼ Ä«Å×°í¸®ÀÎÁö¸¦ ºÐ·ùÇÏ´Â ¹®Á¦
¿¹ : ¾î¶² È»óÀԴϱî? -
Detection(ƯÁ¤ Ä«Å×°í¸®ÀÇ ¹°Ã¼ °ËÃâ)
ƯÁ¤ ¹°Ã¼°¡ È»ó ÁßÀÇ ¾îµð¿¡ ÀÖ´ÂÁö¸¦ ¿äûÇÏ´Â ¹®Á¦
¿¹ : »ç¶÷Àº ¾îµð¿¡ ÀÖ½À´Ï±î? -
Identification(ƯÁ¤ ¹°Ã¼ ÀνÄ)
È»ó ÁßÀÇ ¾î¶² ¹°Ã¼ÀÇ °íÀ¯ ¸í»ç¸¦ ´ë´äÇÏ´Â ¹®Á¦
¿¹ : ÀÌ°ÍÀº iMacÀԴϱî? -
Scene and context categorization (¾À Ä«Å×°í¸® ÀνÄ)
Àå¼Ò³ª ³¯¾¾ µî ¾î¶² Àå¸éÀÎÁö¸¦ ÀνÄÇÏ´Â ¹®Á¦
¿¹ : ¾î¶² Àå¸éÀԴϱî?
ƯÁ¤ Ä«Å×°í¸®ÀÇ ¹°Ã¼ °ËÃâ¿¡¼´Â Ä«Å×°í¸®ÀÇ ´Ù¾çÇÔÀ» ¾ïÁ¦Çϱâ À§ÇÏ¿© ƯÁ¤ Ä«Å×°í¸®¸¸À» ´ë»óÀ¸·Î ÇÏ¿© ´ë»ó Ä«Å×°í¸® ¹°Ã¼°¡ È»ó ¾îµð¿¡ Àִ°¡(Localization)¸¦ ´ë´äÇÏ´Â ¹®Á¦·Î ÇÏ°í ÀÖ´Ù. ÇÑÆí È»ó ºÐ·ù¿¡¼´Â ´ë»ó ¹°Ã¼ÀÇ ·ÎÄöóÀÌÁ¦À̼Ç(Localization)À» ¹«½ÃÇÏ¿© È»ó Áß¿¡ ÀÎ½Ä ´ë»óÀÇ ¹°Ã¼°¡ Å©°Ô ÃÔ¿µµÇ¾î ÀÖ´Ù´Â Á¶°Ç ÇÏ¿¡¼ ±× ¹°Ã¼ Ä«Å×°í¸®¸¦ ¼±ÅÃÇÏ´Â Ä«Å×°í¶óÀÌÁ¦À̼Ç(Categorization) ¹®Á¦·Î ÇÏ°í ÀÖ´Ù.
ÀÌó·³ ÀÏ¹Ý ¹°Ã¼ÀνĿ¡¼´Â ·ÎÄöóÀÌÁ¦À̼ǰú Ä«Å×°í¶óÀÌÁ¦À̼ÇÀÇ 2°¡ÁöÀÇ Á¦¾àÀ» µµÀÔÇÔÀ¸·Î½á Çö»ó¿¡¼´Â ¹®Á¦¸¦ °£·«ÈÇÏ¿© Çؼ®ÇÏ°í ÀÖ´Ù. ÀÌ 2°¡Áö¸¦ µ¿½Ã¿¡ ÇØ°áÇÏ´Â ¹æ¾ÈÀÌ ½ÇÇö °¡´ÉÇϸé ÀÏ¹Ý ¹°Ã¼ÀνÄÀ» ÇØ°áÇÏ´Â °ÍÀÌ µÇ±â ¶§¹®¿¡ ·ÎÄöóÀÌÁ¦ÀÌ¼Ç ¹®Á¦¿Í Ä«Å×°í¶óÀÌÁ¦ÀÌ¼Ç ¹®Á¦´Â ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä ¹®Á¦¿¡¼ Áß¿äÇÑ °úÁ¦¶ó ÇÒ ¼ö ÀÖ´Ù.
¿©±â¿¡¼´Â ÃÖ±Ù ¿¬±¸°¡ È°¹ßÇÏ°Ô ÀÌ·ç¾îÁö°í ÀÖ´Â ·ÎÄöóÀÌÁ¦ÀÌ¼Ç ¹®Á¦ÀÎ Detection(¹°Ã¼ °ËÃâ)°ú Ä«Å×°í¶óÀÌÁ¦ÀÌ¼Ç ¹®Á¦ÀÎ Object Categorization (È»ó ºÐ·ù)¿¡ ´ëÇÏ¿© ¼Ò°³ÇÑ´Ù.
¹°Ã¼ °ËÃâ =¡®Find all the Xs¡¯
¹°Ã¼ °ËÃâÀ̶õ ¾ó±¼À̳ª »ç¶÷ µîÀÇ Æ¯Á¤ÀÇ ÀÏ¹Ý ¹°Ã¼°¡ È»ó ÁßÀÇ ¾îµð¿¡ ÀÖ´ÂÁö¸¦ °ËÃâÇÏ´Â °ÍÀÌ´Ù. ÇϳªÀÇ °ËÃâ±â¿¡¼´Â ƯÁ¤ ¹°Ã¼¹Û¿¡ °ËÃâÇÒ ¼ö ¾øÁö¸¸, °¢ ¹°Ã¼ Ä«Å×°í¸®¿¡ ´ëÀÀÇÑ °ËÃâ±â¸¦ ÀÛ¼ºÇÏ¿© º´·Ä·Î µ¿ÀÛ½Ãų ¼ö ÀÖÀ¸¸é ÀÏ¹Ý ¹°Ã¼ÀνÄÀ» ½ÇÇöÇÏ´Â °ÍÀÌ °¡´ÉÇÏ´Ù°í »ý°¢µÈ´Ù.
¹°Ã¼ °ËÃâ¿¡¼ °¡Àå Å« ¹®Á¦¿´´ø ¾ó±¼ °ËÃâÀº 1990³â´ë ÈĹݺÎÅÍ Raster Scan ÁÖ»ç(ñËÞÛ)¿¡ ÀÇÇÑ ¾ó±¼ °ËÃâ¹ýÀÇ ¿¬±¸°¡ ÀÌ·ç¾îÁ® ÇöÀç¿¡´Â ÈÞ´ëÀüȳª µðÁöÅÐ Ä«¸Þ¶ó µî¿¡ ½Ç¿ëȵǾî ÀÖ´Ù. Rowley´Â ¾ó±¼ ¿µ¿ªÀÇ Å©±â¿¡ ¿µÇâÀ» ¹ÞÁö ¾Ê°í °ËÃâ °¡´ÉÇÑ ´º·² ³×Æ®¿öÅ©(Neural Network)¸¦ ÀÌ¿ëÇÑ ¾ó±¼ °ËÃâ ¹æ¹ýÀ» Á¦¾ÈÇÏ°í ±× ÈÄ Åë°èÀû ÇнÀ¹æ¹ýÀ» »ç¿ëÇÑ ¾ó±¼ °ËÃâÀÇ ¿¬±¸°¡ È°¹ßÇÏ°Ô ÀÌ·ç¾îÁö°Ô µÇ¾ú´Ù. Rowley¿¡ ÀÇÇÑ ¾ó±¼ °ËÃâ¹ý¿¡¼´Â È»ó Àüü¿¡¼ Ư¡·®À» ÃßÃâÇϱâ À§ÇØ Á¶¸í º¯È³ª Çü»ó º¯È¿¡ ´ëÇÏ¿© °ËÃâÀÌ °ï¶õÇØÁö´Â °æ¿ì°¡ ÀÖÀ¸¸ç, 2000³â ÀÌÈÄ¿¡¼´Â Åë°èÀû ÇнÀ ¹æ¹ý°ú ±¹¼Ò Ư¡·®ÀÇ Á¶ÇÕÀ¸·Î ¹°Ã¼ °ËÃâÇÏ´Â ¹æ¹ýÀÌ ÁÖ·ù°¡ µÇ¾ú´Ù. ViolaµéÀº ±¹¼Ò Ư¡·®À¸·Î¼ ¿µ¿ªÀÇ ¸íµµÂ÷¸¦ Ư¡À¸·Î ÇÏ´Â Haar-like Ư¡·®À» ´Ù¼ö Á¶ÇÕ½ÃÄÑ ¾ó±¼ °ËÃâ±â¸¦ ±¸ÃàÇÏ¿´´Ù(±×¸² 3).
°ËÃâ±â¿¡´Â AdaBoost¸¦ »ç¿ëÇÏ´Â °ÍÀ¸·Î ±¹¼Ò Ư¡·®ÀÇ ´Ù¼ö Á¶ÇÕ °¡¿îµ¥¿¡¼ ½Äº°¿¡ ÃÖÀûÀÇ Æ¯Â¡·®À» ÀÚµ¿ ¼±ÅÃÇÏ°í ÀÖ´Ù. À̷νá Å« Ư¡ Â÷¿ø¼ö¶óµµ °í¼Ó 󸮰¡ °¡´ÉÇØÁö¸ç °íÁ¤¹ÐµµÀÇ ¾ó±¼ °ËÃâÀ» ½ÇÇöÇÏ¿´´Ù.
2005³â¿¡´Â »ç¶÷ °ËÃâ¿¡ À¯È¿ÇÑ ±â¿ï±â Á¤º¸¸¦ ÀÌ¿ëÇÑ Æ¯Â¡·®À¸·Î¼ HOG(Histograms of Oriented Gradients)°¡ Dalalµé¿¡ ÀÇÇØ Á¦¾ÈµÇ¾ú´Ù. HOG´Â SIFT(Scale Invariant Feature Transform)¿Í ¸¶Âù°¡Áö·Î ±¹¼Ò ¿µ¿ª¿¡¼ ÈÖµµÀÇ ±â¿ï±â ¹æÇâÀ» È÷½ºÅä±×·¥ÈÇÑ Æ¯Â¡·®ÀÌ´Ù. SIFT¿Í À¯»çÇÑ Æ¯Â¡·®ÀÇ ±â¼úÀ» ÇÏÁö¸¸ SIFT´Â Ư¡Á¡¿¡ ´ëÇÏ¿© Ư¡·®À» ±â¼úÇÏ´Â °Í¿¡ ºñÇÏ¿© HOG¿¡¼´Â ¾î¶² ÀÏÁ¤ÇÑ ¿µ¿ª¿¡ ´ëÇÑ Æ¯Â¡·®À» ±â¼úÇÑ´Ù. ¶§¹®¿¡ ´ë·«ÀûÀÎ ¹°Ã¼ Çü»óÀ» Ç¥ÇöÇÏ´Â °ÍÀÌ °¡´ÉÇÏ¸ç »ç¶÷ °ËÃâÀ̳ª ÀÚµ¿Â÷ °ËÃâ µîÀÇ ÀÏ¹Ý ¹°Ã¼ÀÎ½Ä µî¿¡ »ç¿ëµÇ°í ÀÖ´Ù(±×¸² 4).
È»ó ºÐ·ù =¡®Whats this?¡¯
È»ó ºÐ·ù´Â ±× È»óÀÌ ¾î¶² ¹°Ã¼ Ä«Å×°í¸®¸¦ Æ÷ÇÔÇÏ´Â È»óÀÎÁö¸¦ ÀνÄÇÏ´Â ¹®Á¦ÀÌ´Ù. ÃÖ±Ù ´ë»ó ¹°Ã¼ÀÇ ±¸Á¶ Á¤º¸(À§Ä¡ Á¤º¸)¸¦ ¾Æ¿¹ »ç¿ëÇÏÁö ¾Ê°í È»óÀ» ±¹¼Ò Ư¡·®ÀÇ ÁýÇÕÀ¸·Î °£ÁÖÇÏ´Â °ÍÀ¸·Î ÀÎ½Ä ¹°Ã¼¸¦ Ç¥ÇöÇÏ´Â Bag-of-Keypoints¶ó ºÒ¸®´Â ¹æ¹ýÀÌ Á¦¾ÈµÇ°í ÀÖ´Ù.
Bag-of-Keypoints´Â ¹®¼ ºÐ·ù ¹æ¹ýÀÎ Bag-of-words¸¦ È»ó¿¡ Àû¿ëÇÑ ¹æ¹ýÀÌ´Ù. Bag-of-words´Â ¹®ÀåÀ» ´Ü¾î ÁýÇÕÀ¸·Î °£ÁÖÇÏ¿© ´Ü¾îÀÇ ¾î¼øÀ» ¹«½ÃÇÏ¿© ±× ºóµµ·Î ¹®Àå ºÐ·ù¸¦ ÇÑ´Ù. ¸¶Âù°¡Áö·Î Bag-of-Keypoints¿¡¼´Â È»óÀ» ±¹¼Ò Ư¡·®(Keypoint)ÀÇ ÁýÇÕÀ¸·Î °£ÁÖÇÏ¿©, ±× À§Ä¡ Á¤º¸¸¦ ¹«½ÃÇϸç È»óÀνÄÀ» ÇÑ´Ù. Bag-of-Keypoints¿¡¼ ±¹¼Ò Ư¡·®¿¡´Â ½ºÄÉÀÏ°ú ȸÀü¿¡ ´ëÇÏ¿© ºÒº¯ÀÇ Æ¯Â¡·®À» ¾òÀ» ¼ö ÀÖ´Â SIFT°¡ »ç¿ëµÇ°í ÀÖ´Ù. SIFT´Â È»ó ³»ÀÇ ´ë»ó¹°ÀÌ ½ºÄÉÀÏ º¯È³ª ȸÀü¿¡ ¿µÇâÀ» ¹ÞÁö ¾Ê´Â Ư¡À» ±â¼úÇÒ ¼ö Àֱ⠶§¹®¿¡ ´ë»ó¹°ÀÇ Å©±â³ª ȸÀüÀÌ ¹ÌÁöÀÎ ¹°Ã¼ Ä«Å×°í¸® ºÐ·ùÀÇ ÀԷ Ư¡¿¡ ÀûÇÕÇÏ´Ù. ±×¸² 5¿¡ Bag-of-Keypoints¿¡ ÀÇÇÑ È»ó ºÐ·ùÀÇ È帧À» ³ªÅ¸³½´Ù. Bag-of-Keypoint¿¡¼´Â »çÀü¿¡ °¢ ¹°Ã¼ Ä«Å×°í¸®ÀÇ ÇнÀ Ȼ󿡼 SIFT Ư¡·®À» ÃßÃâÇÏ¿© ±¹¼Ò Ư¡·®À» º¤ÅÍ(Vector) ¾çÀÚÈÇÑ´Ù.
ÀÌ º¤ÅÍ ¾çÀÚÈµÈ Æ¯Â¡·®Àº Visual Word³ª Visual Alphaber·Î ºÒ¸®¾î ¹°Ã¼ Ä«Å×°í¸®¸¶´ÙÀÇ Visual WordÀÇ È÷½ºÅä±×·¥À» »ç¿ëÇÏ¿© ÇнÀ Ȼ󱺿¡¼ ½Äº°±â¸¦ ÀÛ¼ºÇØ µÐ´Ù. 1ÀåÀÇ ÀԷ Ȼ󿡼 ¾ò¾îÁø Visual WordÀÇ È÷½ºÅä±×·¥À» ±× ÀÔ·Â È»óÀÇ Æ¯Â¡·®À¸·Î °¢ ¹°Ã¼ Ä«Å×°í¸®ÀÇ ½Äº°±â¿¡ ÀÔ·ÂÇÏ¿© ÆÇÁ¤ÇÑ´Ù.
Æò°¡ µ¥ÀÌÅÍ ¼¼Æ®¿Í ¿öÅ©¼ó
ÃÖ±Ù ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ ¿¬±¸°¡ È°¹ßÇÏ°Ô ÀÌ·ç¾îÁö°Ô µÈ ¿äÀÎÀÇ Çϳª¿¡´Â °øÅë µ¥ÀÌÅÍ ¼¼Æ®¸¦ »ç¿ëÇÏ¿© Æò°¡ÇÏ´Â °ÍÀÌ °¡´ÉÇØ Áø °ÍÀ» µé ¼ö ÀÖ´Ù. È»ó ºÐ·ùÀÇ ÀϹÝÀûÀÎ Æò°¡ µ¥ÀÌÅͺ£À̽º·Î¼ Caltech101/256ÀÌ ÀÖ´Ù. Caltech101Àº 101Á¾·ùÀÇ Ä«Å×°í¸®·Î ±¸¼ºµÇ¾î ÀÖÀ¸¸ç Google Image Search¸¦ »ç¿ëÇÏ¿© ¸ðÀº 9,144ÀåÀÇ È»ó µ¥ÀÌÅ͸¦ ºÐ·ù, ¹°Ã¼ÀÇ ¹æÇâ°ú Å©±â°¡ °ÅÀÇ °®Ãß¾îÁ® ÀÖ´Ù. ¶ÇÇÑ °¢ Ä«Å×°í¸® È»ó ¼ö´Â 31Àå¿¡¼ 800ÀåÀ¸·Î ºÒ±ÔÄ¢ÇÏ´Ù. ÀÌ¿¡ ºñÇÏ¿© Caltech256¿¡¼´Â Ä«Å×°í¸® 256Á¾·ù¿¡ 3¸¸607ÀåÀÇ È»óÀ» ¼öÁýÇØ ¹æÇâÀ̳ª Å©±â¸¦ ÅëÀÏÇÏÁö ¾Ê¾Æµµ µÇ´Â µ¥ÀÌÅͺ£À̽º¸¦ ±¸ÃàÇÏ¿© Caltech101°ú ÇÔ²² °ø°³µÇ¾î ÀÖ´Ù.
ÇöÀç È»ó ºÐ·ù ¹æ¹ýÀÇ ºñ±³¿¡¼´Â ÀÌ Caltech256¿¡ ÀÇÇÑ Æò°¡°¡ ÀϹÝÀûÀÌ´Ù. Caltech 101/256 ÀÌ¿ÜÀÇ µ¥ÀÌÅͺ£À̽º¿¡´Â LabelMe Dataset, Graz-02 Database, NORB DATA SET°¡ ÀÖÀ¸¸ç À̵鵵 °ø°³µÇ¾î ÀÖ´Ù.
¶ÇÇÑ À̵é Æò°¡ µ¥ÀÌÅͺ£À̽º¸¦ »ç¿ëÇÑ ÀÏ¹Ý ¹°Ã¼ ÀνÄÀÇ º¥Ä¡¸¶Å© ¿öÅ©¼óÀÌ °³ÃֵǾî ÀÖ´Ù. ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ º¥Ä¡¸¶Å© ¿öÅ©¼óÀº PSCAL, Challenge, TRECVID µîÀÌ ÀÖ´Ù. PASCAL Challenge Visual Object Class´Â À¯·´ÀÇ ÆÐÅÏ ÀνÄ, ±â°è ÇнÀ Ä¿¹Â´ÏƼÀÇ PASCAL(Pattern Analysis. Statistieal Modeling and Computational Leaning)¿¡ ÀÇÇØ ÁÖÃֵǾî ÀÖ´Â ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ ÄÜÅ×½ºÆ®·Î ÇнÀ¿ë È»ó°ú Æò°¡¿ë È»óÀÌ ÁÖ¾îÁ® È»ó Áß¿¡ 10Á¾·ùÀÇ ¹°Ã¼(Bicycle, Bus, Car, Cow, Dog, Horse, Motorbike, Person, Sheep)°¡ È»ó¿¡ Æ÷ÇԵǾî Àִ°¡¸¦ ÆǺ°ÇÏ´Â Classification°ú ¾îµð¿¡ Æ÷ÇԵǾî Àִ°¡¸¦ ±¸ÇÏ´Â DetectionÀÇ 2°¡Áö °úÁ¦°¡ ÀÖ´Ù. °Ô´Ù°¡ CVPR2007°ú ICCV2005¿¡¼´Â Recognizing and Learning Object Categories¶ó´Â Áöµµ¼(Tutorial)³ª ¿öÅ©¼óÀÌ °³ÃֵǾî ÀÖ´Ù.
ÀÏ¹Ý ¹°Ã¼ÀνÄÀÇ ½ÇÇöÀ» À§ÇÑ °úÁ¦
Haar-like³ª HOG Ư¡·®À» »ç¿ëÇÑ ¹°Ã¼ °ËÃâ ¹æ¹ýÀ̳ª Bag-of-keypoints¿¡ ÀÇÇÑ È»ó ºÐ·ù ¹æ¹ýÀÇ Á¦¾È¿¡ µû¶ó ÀÏ¹Ý ¹°Ã¼ÀνÄÀº »õ·Î¿î ±¹¸éÀ» ¸ÂÀÌÇßÁö¸¸ ½Ç¿ëÈ¿¡´Â ¾ÆÁ÷ ÇØ°áÇØ¾ß ÇÒ ¹®Á¦°¡ ¸¹ÀÌ ³²¾Æ ÀÖ´Ù. ¾ÕÀ¸·Î´Â ÀνÄÇÏ´Â Ä«Å×°í¸® ¼ö°¡ ÇÑÃþ ´õ Áõ°¡ÇÒ °ÍÀ¸·Î º¸ÀÌ¸ç ¹æ¹ýÀÇ °í¼ÓÈ¿Í ÇÔ²² ´õ ³ªÀº ÀνÄÀ²ÀÇ °íÁ¤¹ÐµµÈ°¡ ±â´ëµÇ°í ÀÖ´Ù. ÇöÀçÀÇ ¹°Ã¼ °ËÃâÀ̳ª È»ó ºÐ·ù ¹æ¹ýÀº ±âº»ÀûÀ¸·Î ´ÜÀÏ ´ë»ó¹°À» ÀνÄÇÏ°í ÀÖ´Ù. ±×·¯³ª ½ÇÁ¦ Àå¸é¿¡¼´Â ¿©·¯ °¡Áö ¹°Ã¼°¡ Æ÷ÇԵǾî ÀÖÀ¸¸ç ±×µé ¹°Ã¼¿¡´Â ´ëÀÀÇϴ Ŭ·¡½º¿Í °íÀ¯¸í»ç°¡ ÀÖ´Ù(±×¸² 6). ±×·¸±â ¶§¹®¿¡ ÀνķüÀ» ³ôÀÌ·Á¸é Àå¸éÀ̳ª ¹°Ã¼°£ÀÇ °ü°è¼ºÀ» °í·ÁÇÑ Å¾ ´Ù¿î(Top Down)¿¡ ÀÇÇÑ Á¤¹Ðµµ Çâ»óÀ» ÁöÇâÇÏ´Â ¹æ¹ý°ú ƯÁ¤ ¹°Ã¼ÀÇ ÀÎ½Ä Á¤¹Ðµµ¸¦ Çâ»ó½ÃÅ´À¸·Î¼ »óÀ§ °èÃþÀÎ ¹°Ã¼ Ä«Å×°í¸®ÀÇ ÀνķüÀ» Çâ»ó½ÃÅ°´Â º¸ÅÒ ¾÷(Bottom Up)¿¡ ÀÇÇÑ ¹æ¹ýÀÌ Áß¿äÇÏ´Ù°í ÇÒ ¼ö ÀÖ´Ù.
¹°Ã¼ °£ÀÇ °ü°è¸¦ ÀÌ¿ëÇÑ ÀÎ½Ä ¹æ¹ýÀº ¹®¸Æ(Context)À» ÀÌ¿ëÇÑ ÀÎ½Ä ¹æ¹ýÀ¸·Î¼ TorralbaµéÀº Part, Object, SceneÀÇ °ü°è¸¦ ±×·¡ÇÇÄà ¸ðµ¨¿¡ ÀÇÇÑ È®·ü ¸ðµ¨·Î Ç¥ÇöÇÏ´Â ¹æ¹ýÀ» Á¦¾ÈÇÏ°í ÀÖ´Ù. HoiemµéÀº Ȼ󿡼 ¼Ò½ÇÁ¡À» »ç¿ëÇÏ¿© °£´ÜÇÑ 3Â÷¿ø º¹¿øÀ» ÇÏ¿© 3Â÷¿ø »óÀÇ ¹®¸ÆÀ» ÀÌ¿ëÇÏ´Â ¹æ¹ýÀ» Á¦¾ÈÇÏ°í ÀÖÀ¸¸ç CVPR2006ÀÇ Best Paper¿¡ ä¿ëµÇ¾î ÀÖ´Ù. ÀÌó·³ È»ó »óÀÇ ¹®¸Æ, 3Â÷¿ø »óÀÇ ¹®¸Æ, ¿ÀºêÁ§Æ® °£ÀÇ ¹®¸ÆÀ» ÀÌ¿ëÇÏ´Â ¹æ¹ý µîÀÌ Á¦¾ÈµÇ¾î ÀÏ¹Ý ¹°Ã¼ÀνĿ¡ µµÀԵDZ⠽ÃÀÛÇß´Ù.
¶ÇÇÑ ¾ó±¼À̳ª »ç¶÷ µîÀÇ ¹°Ã¼ °ËÃâ¿¡¼´Â ±¹¼Ò Ư¡·® °£ÀÇ °ø±â¼ºÀ» °í·ÁÇÏ´Â °ÍÀ¸·Î ÀνķüÀ» Çâ»ó½ÃÅ°´Â ¹æ¹ýÀÌ Á¦¾ÈµÇ¾î ÀÖÀ¸¸ç Low-LevelÇÑ ±¹¼Ò Ư¡·®À» Åë°èÀû ÇнÀ ¹æ¹ýÀ» »ç¿ëÇÏ¿© ¾î¶»°Ô Á¶ÇÕ½ÃųÁö, ¾î¶»°Ô °íÁ¤½ÃųÁö°¡ Áß¿äÇÑ °úÁ¦°¡ µÇ°í ÀÖ´Ù.
Á¾·¡¿¡´Â Ä«Å×°í¸® ºÐ·ù¿Í ¹°Ã¼ °ËÃâÀº ´Ù¸¥ ¹®Á¦·Î Ãë±ÞµÇ°í ÀÖ¾úÁö¸¸, ±¹¼Ò Ư¡·®ÀÎ HOG¸¦ ÇǶó¹ÌµåÈ ÇÏ¿© °¢ ºÎÇ°ÀÇ À§Ä¡ °ü°è¸¦ °í·ÁÇÔÀ¸·Î½á Ä«Å×°í¶óÀÌÁ¦ÀÌ¼Ç ¹®Á¦¿Í ·ÎÄöóÀÌÁ¦ÀÌ¼Ç ¹®Á¦¸¦ µ¿½Ã¿¡ Çؼ®ÇÏ´Â ¹æ¾ÈÀÌ 2008³â¿¡ Á¦¾ÈµÇ¾î »õ·Î¿î ±¹¸éÀ» ¸ÂÀÌÇÏ°í ÀÖ´Ù.
¸ÎÀ½¸»
ÀÌ ¿ø°í¿¡¼´Â ÀÏ¹Ý ¹°Ã¼ ½ÄÀº ¾î¶² ¹®Á¦Àΰ¡, ±×¸®°í ÇöÀç ÇØ°áµÇ¾î ÀÖ´Â ¹®Á¦¿¡ ´ëÇÏ¿© ±â¼úÇÏ¿´´Ù. ¾ó±¼ °ËÃâÀ̳ª »ç¶÷ °ËÃâ¿¡ ´ëÇ¥µÇ´Â ¹°Ã¼ °ËÃâÀ̳ª Bag-of-Keypoints¿¡ µû¸¥ È»ó ºÐ·ù ¹æ¹ýÀº Åë°èÀûÀÎ ÇнÀ ¹æ¹ý°ú Ư¡·®ÀÇ ÁøÈ°¡ µ¿¹ÝµÇ¾î À¯È¿ÇÑ ¹æ¹ýÀÌ Á¦¾ÈµÇ°í ÀÖ´Ù. ¾ÕÀ¸·Î´Â Ư¡·® °£ÀÇ °ø±â(ÍìÑÃ: ÇÔ²² °ü°è¸¦ ¸ÎÀ½)³ª ¹®¸ÆÀÇ ÀÌ¿ë¿¡ ÀÇÇÑ ÀÎ½Ä ´É·ÂÀÇ °íÁ¤¹ÐµµÈ¿Í º¸´Ù ¸¹Àº ¹°Ã¼ Ä«Å×°í¸®¸¦ ´ë»óÀ¸·Î Çϱâ À§ÇÑ Ã³¸®ÀÇ °í¼ÓÈ°¡ ÇÑÃþ ´õ ±â´ëµÈ´Ù. ÀÏ¹Ý ¹°Ã¼ÀνÄÀº ÄÄÇ»ÅÍ ºñÀü ºÐ¾ß¿¡¼ ±Ã±ØÀûÀÎ °úÁ¦ÀÌ¸ç ¿¬±¸ÀÚ, °³¹ßÀÚ °£¿¡ ¹®Á¦¸¦ °øÀ¯ÇÏ¿© ÀÌ¿Í °°Àº ¾î·Á¿î ¹®Á¦¿¡ µµÀüÇØ ³ª°¨À¸·Î½á ÀÌ·¯ÇÑ ºÐ¾ß°¡ Å©°Ô ÀüÁøÇØ ³ª°¥ °ÍÀ» ±â´ëÇÑ´Ù.
<±Û : ±è ¼º Å | ÈÄÁö¿ä½Ã È÷·Î³ëºÎ(hf@cs.chubu.ac.jp) / ÃòºÎ ´ëÇÐ>
[¿ù°£ ½ÃÅ¥¸®Æ¼¿ùµå Åë±Ç Á¦148È£ (info@boannews.com)]
<ÀúÀÛ±ÇÀÚ: º¸¾È´º½º(www.boannews.com) ¹«´ÜÀüÀç-Àç¹èÆ÷±ÝÁö>