1. R_script ÆÄÀÏ
LDA(Latent Dirichlet Allocation)´Â ¹®¼¿¡¼ ¼û°ÜÁø ÁÖÁ¦¸¦ ¹ß°ßÇϱâ À§ÇØ »ç¿ëµÇ´Â È®·üÀû ÅäÇÈ ¸ðµ¨¸µ ±â¹ýÀÌ´Ù. R¿¡¼ LDA¸¦ ÀÌ¿ëÇÑ 4Â÷ »ê¾÷Çõ¸í¿¡ °üÇÑ ÅäÇÈ ¸ðµ¨¸µÀ» ¼öÇàÇϱâ À§ÇØ ÇÊ¿äÇÑ ±âº»ÀûÀÎ R ½ºÅ©¸³Æ®¸¦ »ìÆ캸°Ú´Ù. ÀÌ ½ºÅ©¸³Æ®´Â ´ÙÀ½ ´Ü°è·Î ±¸¼ºµÈ´Ù. ù°, ÇÊ¿äÇÑ ÆÐÅ°Áö¸¦ ¼³Ä¡ÇÏ°í ·ÎµåÇÏ´Â °úÁ¤ÀÌ´Ù. LDA ¸ðµ¨À» ±¸ÃàÇϱâ À§ÇØ `topicmodels`, `tm`, `tidyverse` µîÀÇ ÆÐÅ°Áö°¡ ÇÊ¿äÇÏ´Ù. ÀÌ ÆÐÅ°ÁöµéÀº ÅؽºÆ® µ¥ÀÌÅ͸¦ Àüó¸®ÇÏ°í ºÐ¼®ÇÏ´Â µ¥ À¯¿ëÇÏ´Ù. µû¶ó¼ ¸ÕÀú ÆÐÅ°Áö¸¦ ¼³Ä¡ÇÏÁö ¾ÊÀº °æ¿ì¿¡´Â `install. packages(`ÆÐÅ°Áö¸í`)` ¸í·É¾î¸¦ »ç¿ëÇÏ¿© ¼³Ä¡ÇÏ°í, ÀÌÈÄ `library(ÆÐÅ°Áö¸í)`À» ÅëÇØ ·ÎµåÇÑ´Ù. µÑ°, µ¥ÀÌÅÍ ¼öÁý ¹× Àüó¸® ´Ü°èÀÌ´Ù. 4Â÷ »ê¾÷Çõ¸í°ú °ü·ÃµÈ ¹®¼¸¦ µ¥ÀÌÅÍÇÁ·¹ÀÓ ÇüÅ·ΠÁغñÇÑ´Ù. ÀÌ´Â CSV ÆÄÀÏ·Î ÀúÀåµÈ µ¥ÀÌÅ͸¦ Àоî¿À´Â ¹æ½ÄÀ¸·Î ÁøÇàµÉ ¼ö ÀÖ´Ù. `read. csv(`ÆÄÀÏ°æ·Î`)` ¸í·É¾î·Î µ¥ÀÌÅ͸¦ ºÒ·¯¿À°í, ÅؽºÆ® µ¥ÀÌÅÍ°¡ Æ÷ÇÔµÈ ¿À» ¼±ÅÃÇÏ¿© Àü󸮸¦ ÁøÇàÇÑ´Ù. Àüó¸® °úÁ¤¿¡¼´Â ºÒ¿ë¾î Á¦°Å, Ư¼ö¹®ÀÚ Á¦°Å, ¼Ò¹®ÀÚ º¯È¯ µî ÅؽºÆ® Ŭ¸®´× ÀÛ¾÷ÀÌ ÇÊ¿äÇÏ´Ù. `tm` ÆÐÅ°Áö¸¦ »ç¿ëÇÏ¿©¡¦(»ý·«)
|