Àü»ê ´ÙÁß¹°¸®(Computational Multi-Physics) ¾ÖÇø®ÄÉÀ̼ÇÀÇ 30¹è ¼Óµµ ¸ñÇ¥
[º¸¾È´º½º ±âȹÃëÀçÆÀ] ÀΰøÁö´É(AI) ÄÄÇ»Æà ±â¼ú ºÐ¾ßÀÇ ¼±µÎÁÖÀÚÀÎ ¿£ºñµð¾Æ(CEO Á¨½¼ Ȳ)´Â ¾Æ½Ã¾Æ, À¯·´, ¹Ì±¹ µîÀÇ ½´ÆÛÄÄÇ»Æà ¼¾ÅÍ°¡ ¿£ºñµð¾Æ ÄöÅÒ ÀÎÇǴϹêµå(NVIDIA Quantum InfiniBand) ³×Æ®¿öÅ©¿¡¼ ¿£ºñµð¾Æ ºí·çÇʵå(BlueField) DPU¸¦ ÅëÇØ °¡¼Ó ÄÄÇ»ÆÃÀ» ÇÑ ´Ü°è ²ø¾î¿Ã¸°´Ù°í ¹ßÇ¥Çß´Ù.
[À̹ÌÁö=¿£ºñµð¾Æ Á¦°ø]
¹Ì±¹ ·Î½º ¾Ë¶ó¸ð½º ±¹¸³¿¬±¸¼Ò(Los Alamos National Laboratory, LANL)¿¡¼ NVIDIA¿ÍÀÇ ´Ù³â°£ ±¤¹üÀ§ÇÑ Çù¾÷ÀÇ ÇÑ ºÎºÐÀ¸·Î, Àü»ê ´ÙÁß¹°¸®(Computational Multi-Physics) ¾ÖÇø®ÄÉÀ̼ÇÀÇ 30¹è ¼Óµµ¸¦ ¸ñÇ¥·Î ÇÑ´Ù.
.
LANL ¿¬±¸¿øµéÀº ¿£ºñµð¾Æ ÄöÅÒ ÀÎÇǴϹêµå(NVIDIA Quantum InfiniBand) ³×Æ®¿öÅ©¿¡¼ ½ÇÇàµÇ´Â µ¥ÀÌÅÍ Ã³¸® ÀåÄ¡(DPU)¸¦ »ç¿ëÇÏ¿© ¾öû³ ¼º´É Çâ»óÀ» ¿¹»óÇÏ°í ÀÖ´Ù. À̵éÀº BlueField ¹× NVIDIA DOCA ¼ÒÇÁÆ®¿þ¾î ÇÁ·¹ÀÓ¿öÅ©¸¦ »ç¿ëÇÑ ÄÄÇ»Æà ½ºÅ丮Áö, ÆÐÅÏ ¸ÅĪ µîÀÇ ±â¼úÀ» °³Ã´ÇÑ´Ù´Â °èȹÀÌ´Ù.
DPU¸¦ À§ÇÑ ¿ÀÇ API
ÀÌ·¯ÇÑ ³ë·ÂÀ» ÅëÇØ ´©±¸³ª DPU¸¦ È°¿ëÇÏ´Â µ¥ »ç¿ëÇÒ ¼ö ÀÖ´Â ¾ÖÇø®ÄÉÀÌ¼Ç ÀÎÅÍÆäÀ̽ºÀÎ OpenSNAPI¸¦ Á¤ÀÇÇÒ ¼ö ÀÖ´Ù. ÀÌ´Â À¯´ÏÆÄÀ̵å Ä¿¹Â´ÏÄÉÀÌ¼Ç ÇÁ·¹ÀÓ¿öÅ©(Unified Communication Framework)ÀÇ ÇÁ·ÎÁ§Æ®ÀÌ´Ù. À¯´ÏÆÄÀ̵å Ä¿¹Â´ÏÄÉÀÌ¼Ç ÇÁ·¹ÀÓ¿öÅ©´Â Arm, IBM, ¿£ºñµð¾Æ, ¹Ì±¹ ±¹¸³ ¿¬±¸¼Ò(U.S. national labs) ¹× ¹Ì±¹ ´ëÇеéÀ» Æ÷ÇÔÇÑ HPC ¾ÖÇø®ÄÉÀ̼ÇÀ» À§ÇÑ À̱âÁ¾ ÄÄÇ»ÆÃ(heterogeneous computing)À» °¡´ÉÇÏ°Ô ÇÏ´Â ÄÁ¼Ò½Ã¾öÀÌ´Ù.
LANL´Â DPU ±â¹Ý ½ºÅ丮Áö ½Ã½ºÅÛ ´öºÐ¿¡ ÀÌ¹Ì Àγ×Æ®¿öÅ©(in-network) ÄÄÇ»ÆÃÀÇ ÈûÀ» ´À³¢°í ÀÖ´Ù.
¿¢¼¿·¯·¹ÀÌƼµå ¹Ú½º ¿Àºê Ç÷¡½Ã(Accelerated Box of Flash, ABoF)´Â ¼Ö¸®µå ½ºÅ×ÀÌÆ®(solid state) ½ºÅ丮Áö, DPU, ÀÎÇǴϹêµå °¡¼Ó±â¸¦ °áÇÕÇÏ¿© ¸®´ª½º(Linux) ÆÄÀÏ ½Ã½ºÅÛÀÇ ¼º´É¿¡ Áß¿äÇÑ ºÎºÐÀ» °¡¼ÓÈÇϴµ¥ µµ¿òÀ» ÁØ´Ù. À¯»çÇÑ ½ºÅ丮Áö ½Ã½ºÅÛº¸´Ù ÃÖ´ë 30¹è ´õ¿í ºü¸£¸ç, LANL ÀÎÇÁ¶óÀÇ ÇÙ½É ±¸¼º ¿ä¼Ò°¡ µÉ ¿¹Á¤ÀÌ´Ù.
ÃÖ±Ù LANL ºí·Î±×¸¦ ÅëÇØ ÇÑ ¿¬±¸¿øÀº ¡®ABoF¸¦ ½ºÅ丮Áö ±Ùó¿¡ ÄÄÇ»Å×À̼ÇÀ» ¹èÄ¡ÇÏ¸é µ¥ÀÌÅÍ À̵¿ÀÌ ÃÖ¼ÒÈµÇ°í ½Ã¹Ä·¹À̼ǰú µ¥ÀÌÅÍ ºÐ¼® ÆÄÀÌÇÁ¶óÀÎÀÇ È¿À²¼ºÀÌ Çâ»óµÈ´Ù¡¯°í ÀüÇß´Ù.
Ŭ¶ó¿ìµå ³×ÀÌƼºê ½´ÆÛ(Cloud-Native Super)
¹Ì±¹ Åػ罺 ÷´Ü ÄÄÇ»Æà ¼¾ÅÍ(Texas Advanced Computing Center, TACC)´Â µ¨ ÆÄ¿ö¿§Áö(Dell PowerEdge) ¼¹ö¿¡ ºí·çÇʵå-2¸¦ ÃÖ±Ù¿¡ äÅÃÇß´Ù. ÀÌ´Â ÀÎÇǴϹêµå ³×Æ®¿öÅ©ÀÇ DPU¸¦ »ç¿ëÇÏ¿© ·Ð½ºÅ¸6(Lonestar) ½Ã½ºÅÛÀ» Ŭ¶ó¿ìµå ³×ÀÌƼºê ½´ÆÛÄÄÇ»ÆÃÀ» À§ÇÑ °³¹ß Ç÷§ÆûÀ¸·Î ¸¸µé ¿¹Á¤ÀÌ´Ù.
TACCÀÇ ·Ð½ºÅ¸ 6´Â Åػ罺 A&M ´ëÇб³, Åػ罺 °ø°ú ´ëÇб³(Texas Tech University) ¹× ³ë½º Åػ罺 ´ëÇб³(University of North Texas)ÀÇ ´Ù¾çÇÑ HPC °³¹ßÀÚµé°ú ¼ö¸¹Àº ¿¬±¸¼¾ÅÍ¿Í ±³¼öÁøÀ» Á¦°øÇÑ´Ù.
MPI °¡¼ÓÈ
¹Ì±¹ ¿ÀÇÏÀÌ¿À ÁÖ¸³ ´ëÇÐ(Ohio State University)ÀÇ ¿¬±¸¿øµéÀº DPU°¡ ¾î¶»°Ô HPCÀÇ °¡Àå Àαâ ÀÖ´Â ÇÁ·Î±×·¡¹Ö ¸ðµ¨ Áß Çϳª¸¦ ÃÖ´ë 21% ´õ ºü¸£°Ô ½ÇÇàÇÒ ¼ö ÀÖ´ÂÁö¸¦ º¸¿©Áá´Ù. ¸Þ½ÃÁö Àü´Þ ÀÎÅÍÆäÀ̽º(MPI)ÀÇ Áß¿ä ºÎºÐÀ» ¿ÀÇÁ·ÎµåÇÏ¿©, ¸¹Àº ´ë±Ô¸ð HPC ½Ã¹Ä·¹À̼ǿ¡ »ç¿ëµÇ´Â ¶óÀ̺귯¸®ÀÎ P3DFFT¸¦ °¡¼ÓÈÇß´Ù.
ÀÚ½ÅÀÇ ÆÀÀÇ MVPICH ¿ÀǼҽº ¼ÒÇÁÆ®¿þ¾î¸¦ »ç¿ëÇÏ¿© DPU ÀÛ¾÷À» À̲ö ¿ÀÇÏÀÌ¿À ÁÖ¸³ ´ëÇÐÀÇ ÄÄÇ»ÅÍ°øÇÐ ±³¼öÀÎ ´Ù¹ß·¹½º¿ö K. (DK) ÆÒ´õ(Dhabaleswar K. (DK) Panda)´Â ¡°DPU´Â ¹Ù»Û °æ¿µÁøÀÇ ¾÷¹«¸¦ ó¸®ÇÏ´Â Á¶¼ö¿Í °°À¸¸ç, ¸ðµç ¿öÅ©·Îµå¸¦ ´õ ºü¸£°Ô ½ÇÇàÇÒ ¼ö Àֱ⠶§¹®¿¡ ÁÖ·ù°¡ µÉ °Í¡±À̶ó°í ¸»Çß´Ù.
HPC ¼¾ÅÍ, Ŭ¶ó¿ìµå ³» DPU
¾à¹° ¹ß°ßÀ̳ª Ç×°ø±â ¼³°è¿Í °°Àº HPC ½Ã¹Ä·¹À̼ÇÀ» ½ÇÇàÇÏ´Â ½´ÆÛÄÄÇ»ÅÍÀÇ °æ¿ì µÎ ÀÚ¸´¼ö »ó½Â È¿°ú°¡ Å©°Ô ÀÛµ¿ÇÑ´Ù. ±×¸®°í ¿©·¯ HPC ¼¾ÅͷκÎÅÍ ÄÚµå ¿äûÀ» ¹ÞÀº ÆÒ´õ´Â ¡°Å¬¶ó¿ìµå ¼ºñ½º´Â °í°´ÀÇ »ý»ê¼ºÀ» ³ôÀ̱â À§ÇØ ÀÌ·¯ÇÑ ÀÌÁ¡À» È°¿ëÇÒ ¼ö ÀÖ´Ù¡±°í ¸»Çß´Ù.
¿£ºñµð¾Æ »þÇÁ(SHARP)¿Í °°Àº ±â´ÉÀ» °¡Áø ÄöÅÒ ÀÎÇǴϹêµå ³×Æ®¿öÅ©´Â ±×ÀÇ ÀÛ¾÷À» °¡´ÉÇÏ°Ô ÇÑ´Ù. ÆÒ´õ´Â ¡°´Ù¸¥ »ç¶÷µéÀº Àγ×Æ®¿öÅ©(in-network) ÄÄÇ»Æÿ¡ ´ëÇØ À̾߱âÇÏÁö¸¸, ÀÎÇǴϹêµå´Â ¿À´Ã³¯ ÀÌ°ÍÀ» µµ¿î´Ù¡±°í ¸»Çß´Ù.
·Îµå ¹ë·±½Ì(Load Balancing)À» ¼öÇàÇÏ´Â ´õ·³ ´ëÇÐ
À¯·´ÀÇ ¿©·¯ ¿¬±¸ÆÀÀÌ ºí·çÇʵåDPU¸¦ »ç¿ëÇØ MPI ¹× ±âŸ HPC ¿öÅ©·Îµå¸¦ °¡¼ÓÈÇÏ°í ÀÖ´Ù. ¿¹¸¦ µé¸é ¿µ±¹ ºÏºÎÀÇ ´õ·³ ´ëÇÐ(Durham University)Àº 16³ëµåÀÇ µ¨ ÆÄ¿ö¿§Áö Ŭ·¯½ºÅÍ¿¡¼ ºí·çÇʵå DPU¸¦ »ç¿ëÇÏ¿© MPI ÀÛ¾÷ÀÇ ·Îµå ¹ë·±½ÌÀ» À§ÇÑ ¼ÒÇÁÆ®¿þ¾î¸¦ °³¹ßÇÏ°í ÀÖ´Ù. ÀÌ ÇÁ·ÎÁ§Æ®ÀÇ ¼ö¼® Á¶»ç¿øÀÎ Åäºñ¾Æ½º ¹ÙÀÎÄ¡¸¦(Tobias Weinzierl)Àº ¡°À̹ø ÀÛ¾÷Àº Àü ¼¼°èÀÇ HPC ½Ã¼³À» À§ÇØ ´õ ³ªÀº ¾Ë°í¸®ÁòÀ» º¸´Ù È¿À²ÀûÀ¸·Î ó¸®ÇÒ ¼ö ÀÖ´Â ±æÀ» ¿¾îÁÙ °Í¡±À̶ó°í ¸»Çß´Ù.
¹ºÇî ¹× ÄÉÀӺ긮ÁöÀÇ DPU
ÄÉÀӺ긮Áö, ·±´ø ¹× ¹ÀÇîÀÇ ¿¬±¸¿øµéµµ DPU¸¦ »ç¿ëÇÏ°í ÀÖ´Ù. À¯´Ï¹ö½ÃƼ Ä®¸®Áö ·±´ø(University College London)Àº ºí·çÇʵå-2 DPU¿¡¼ È£½ºÆ® ½Ã½ºÅÛÀÇ ÀÛ¾÷À» ¿¹¾àÇÏ´Â ¹æ¹ýÀ» ¿¬±¸ÇÏ°í ÀÖ´Ù. ¿¹¸¦ µé¸é È£½ºÆ® ÇÁ·Î¼¼¼ °£¿¡ µ¥ÀÌÅ͸¦ À̵¿ÇÏ¿© ÇÊ¿äÇÒ ¶§ »ç¿ëÇÒ ¼ö ÀÖ´Â ±â´ÉÀÌ´Ù.
CSD3(Cambridge Service for Data Driven Discovery)ÀÇ µ¨ ÆÄ¿ö¿§Áö ¼¹ö ³»ºÎÀÇ ºí·çÇʵå DPU´Â È£½ºÆ® CPU¿¡¼ º¸¾È Á¤Ã¥, ½ºÅ丮Áö ÇÁ·¹ÀÓ¿öÅ© ¹× ±âŸ ÀÛ¾÷À» ¿ÀÇÁ·ÎµåÇÏ¿© ½Ã½ºÅÛ ¼º´ÉÀ» ±Ø´ëÈÇÑ´Ù.
¹ÀÇî °ø°ú´ëÇÐ(Technical University of Munich)ÀÇ ÄÄÇ»ÅÍ ¾ÆÅ°ÅØó ¹× º´·Ä ½Ã½ºÅÛ ±×·ìÀÇ ¿¬±¸¿øµéÀº EuroHPC ÇÁ·ÎÁ§Æ®ÀÇ ÀϺηΠDPU¸¦ »ç¿ëÇØ MPI ¹× ¿î¿µ üÁ¦ ÀÛ¾÷À» ¿ÀÇÁ·ÎµåÇÏ´Â ¹æ¹ýÀ» ¸ð»öÇÏ°í ÀÖ´Ù.
¹Ì±¹ Á¶Áö¾ÆÅØ(Georgia Tech)ÀÇ ¿¬±¸¿øµéÀº ºí·çÇʵå-2 DPU¸¦ »ç¿ëÇÏ¿© ºÐÀÚ ¿ªÇÐ ¿¬±¸¸¦ °¡¼ÓÈÇϱâ À§ÇØ »÷µð¾Æ ±¹¸³¿¬±¸¼Ò(Sandia National Laboratory)¿Í Çù·ÂÇÏ°í ÀÖ´Ù. Áö±Ý±îÁöÀÇ À̵éÀÇ ¿¬±¸¸¦ ¼³¸íÇÏ´Â ³í¹®Àº ¾Ë°í¸®ÁòÀÌ ½Ã¹Ä·¹À̼ÇÀÇ Á¤È®¼ºÀ» ÀÒÁö ¾Ê°í ÃÖ´ë 20%±îÁö °¡¼ÓµÉ ¼ö ÀÖ´Ù´Â °ÍÀ» º¸¿©ÁØ´Ù.
³×Æ®¿öÅ© È®Àå
ÀÌ´Þ ÃÊ ÀϺ»ÀÇ ¿¬±¸¿øµéÀº ¿£ºñµð¾Æ ³‚ÅÒ-2 ÀÎÇǴϹêµå Ç÷§ÆûÀ» ±â¹ÝÀ¸·Î ´ç»çÀÇ °¡Àå ºü¸£°í ½º¸¶Æ®ÇÑ ³×Æ®¿öÅ©ÀÎ ¿£ºñµð¾Æ H100 ÅÙ¼ ÄÚ¾î(Tensor Core) GPU¸¦ »ç¿ëÇÏ´Â ½Ã½ºÅÛÀ» ¹ßÇ¥Çß´Ù.
NEC´Â ¾²Äí¹Ù ´ëÇÐ(University of Tsukuba)ÀÇ ÄÄÇ»ÅÍ °úÇÐ ¼¾Å͸¦ À§ÇØ ¾à 6 ÆäŸÇ÷Ó, H100 ±â¹Ý ½´ÆÛÄÄÇ»Å͸¦ ±¸ÃàÇÒ ¿¹Á¤ÀÌ´Ù. ¿¬±¸¿øµéÀº À̸¦ ±âÈÄÇÐ, õü¹°¸®ÇÐ, ºòµ¥ÀÌÅÍ ¹× AI µî¿¡ »ç¿ëÇÒ °èȹÀÌ´Ù. ÇÑÆí, ÆÒ´õ¿Í °°Àº ¿¬±¸¿øµéÀº ÀÌ¹Ì ºí·çÇʵå-3 DPUÀÇ Äھ ¾î¶»°Ô »ç¿ëÇÒÁö¿¡ ´ëÇØ »ý°¢ÇÏ°í ÀÖ´Ù.
ÆÒ´õ´Â ¡°ÀÌ´Â °íµîÇб³ Á¹¾÷À» ÇÑ Á¶±³°¡ ¾Æ´Ï¶ó ´ëÇÐ ÇÐÀ§¸¦ °¡Áø Á¶±³¸¦ °í¿ëÇÏ´Â °Í°ú °°¾Æ¼, Á¡Á¡ ´õ ¸¹Àº ¿ÀÇÁ·Îµù ÀÛ¾÷ÀÌ ÀÌ·ç¾îÁö±â¸¦ ¹Ù¶õ´Ù¡±°í ¸»Çß´Ù.
[±âȹÃëÀçÆÀ(boan3@boannews.com)]
<ÀúÀÛ±ÇÀÚ: º¸¾È´º½º(www.boannews.com) ¹«´ÜÀüÀç-Àç¹èÆ÷±ÝÁö>