๐Ÿ“Š Data Analysis/๐Ÿ—‚๏ธ Note

240717 Today I Learnํฌ๋กค๋ง๊ณผ ์Šคํฌ๋ž˜ํ•‘ํฌ๋กค๋ง vs. ์Šคํฌ๋ž˜ํ•‘์›น ํฌ๋กค๋ง: ์›น์ƒ์— ์กด์žฌํ•˜๋Š” ๋ชจ๋“  ์›น ํŽ˜์ด์ง€๋ฅผ ๋ฐฉ๋ฌธํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๋ฐฉ๋ฒ•. ํฌ๋กค๋Ÿฌ๋Š” ์ธํ„ฐ๋„ท ์ƒ์˜ ๋ชจ๋“  ํŽ˜์ด์ง€๋ฅผ ๋ฐฉ๋ฌธํ•˜๋ฉฐ, ๊ฐ ํŽ˜์ด์ง€์˜ ๋งํฌ๋ฅผ ๋”ฐ๋ผ๊ฐ€๋ฉด์„œ ์ž๋™์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•จ.์›น ์Šคํฌ๋ž˜ํ•‘: ํŠน์ • ์›น ์‚ฌ์ดํŠธ๋‚˜ ํŽ˜์ด์ง€์—์„œ ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ž๋™์œผ๋กœ ์ถ”์ถœํ•ด ๋‚ด๋Š” ๊ฒƒ ์›น ํฌ๋กค๋ง์Šคํฌ๋ž˜ํ•‘๊ณตํ†ต์ ์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•  ์ˆ˜ ์žˆ๋‹ค.๊ธฐ์ˆ ์ ์œผ๋กœ ํŒŒ์ด์ฌ์œผ๋กœ ํ•จ๊ป˜ ์‚ฌ์šฉ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Œ. (์›น ํฌ๋กค๋ง์„ ํ†ตํ•œ ์›น์ ‘๊ทผ โ†’ ์Šคํฌ๋ž˜ํ•‘์„ ํ†ตํ•œ ํŠน์ • ๋ฐ์ดํ„ฐ ์ถ”์ถœ)์ค‘๋ณต์ œ๊ฑฐ์ค‘๋ณต์ œ๊ฑฐ ํ•„์ˆ˜โ†’ ๋™์ผํ•œ ์ฝ˜ํ…์ธ ๊ฐ€ ์—ฌ๋Ÿฌ ํŽ˜์ด์ง€์— ์—…๋กœ๋“œ ๋œ ๊ฒƒ์„ ์ธ์‹ํ•˜์ง€ ๋ชปํ•จ.๋ฐ˜๋“œ์‹œ ํ•„์š”ํ•œ ๊ฒƒ์€ ์•„๋‹˜โ†’ ํŠน์ • ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ์ฐจ์ด์ ์›น์‚ฌ์ดํŠธ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์ƒ‰์ธํ™”ํ•˜๊ณ  ์ €์žฅํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๊ฒ€์ƒ‰ ์—”์ง„ ๋ฐ..
240716 Today I Learn API ํ†ต์‹ ์˜ ๊ฐœ๋…๊ฐœ๋…API(Application Programming Interface)์†Œํ”„ํŠธ์›จ์–ด ๊ตฌ์„ฑ ์š”์†Œ๊ฐ€ ์„œ๋กœ ํ†ต์‹ ํ• ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ๋ฐฉ์‹(๋ฉ”์ปค๋‹ˆ์ฆ˜).โ†’ ํ”„๋กœ๊ทธ๋žจ๊ณผ ํ”„๋กœ๊ทธ๋žจ์„ ์—ฐ๊ฒฐ์‹œ์ผœ์ฃผ๋Š” ํ†ต์‹ ์˜ ๋ฐฉ๋ฒ• ๊ฐ„๋‹จํ•œ ํ˜ธ์ถœ๊ตฌ๋ฌธ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์†ก์‹ ๋ฐ›์„ ์ˆ˜ ์žˆ์Œ.์˜คํ”ˆ API ๋ž€, ๊ธฐ์—… ๋‚ด ๋ฐ์ดํ„ฐ๋ฅผ ์ผ๋ฐ˜ ์‚ฌ์šฉ์ž์—๊ฒŒ ๊ณต๊ฐœํ•˜๋Š” ๊ฒƒ์—ญํ•  ๋ฐ ํŠน์ง•๊ถŒํ•œ๊ด€๋ฆฌ๋งŽ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ ์žฌ(์ €์žฅ)๋˜๋Š” DB ์—๋Š” ๋ชจ๋“  ์‚ฌ๋žŒ๋“ค์ด ์ด DB์— ์ ‘๊ทผํ•˜๋ฉด ๋ณด์•ˆ์ƒ์˜ ์ด์Šˆ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Œ.API ๋Š” ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ์ ‘๊ทผ์ด ํ—ˆ์šฉ๋œ ๋กœ์ปฌ์—๊ฒŒ๋งŒ ๊ถŒํ•œ์„ ๋ถ€์—ฌํ•˜๋Š” โ€˜์ค‘๊ฐ„๊ด€๋ฆฌ์žโ€™ ์—ญํ• ์„ ์ˆ˜ํ–‰ํ”„๋กœ๊ทธ๋žจ ๊ฐ„ (์›ํ™œํ•œ) ํ†ต์‹  ์ง€์›API ๋Š” ์ž์นซ ์–ด๋ ค์šด ๋ฐฉ์‹์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„์„ ํ‚ค๊ฐ’์„ ํ†ตํ•ด ๊ฐ„ํŽธํ•œ ํ†ต์‹ ์„ ์ง€์›ํ•ด๋‹น ํ‚ค..
240529 Today I Learn์ž๋ฃŒํ˜•๊ณผ ํ†ต๊ณ„๋ชจํ˜•์ž๋ฃŒํ˜•์งˆ์ Qualitative ์ž๋ฃŒ: ์ˆ˜์น™ ์—ฐ์‚ฐ์ด ๋ถˆ๊ฐ€ํ•œ ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค. ๋ฒ”์ฃผํ˜•Categorical์ด๋ผ๊ณ ๋„ ํ•ฉ๋‹ˆ๋‹ค.๋ช…๋ชฉํ˜•Nominal: ์ด๋ฆ„, ์„ฑ๋ณ„๊ณผ ๊ฐ™์ด ์œ„๊ณ„๋‚˜ ์ˆœ์„œ๊ฐ€ ์—†๋Š” ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค.์ˆœ์„œํ˜•Ordinal: ํ•™๋…„ ๋ณ„์ ๊ณผ ๊ฐ™์ด ์ˆœ์„œ๊ฐ€ ์žˆ์ง€๋งŒ ์‚ฌ์น™์—ฐ์‚ฐ์ด ์ ์šฉ๋˜๊ธฐ ์–ด๋ ค์šด ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค.์–‘์ Quantitative ์ž๋ฃŒ: ์ˆ˜์น™ ์—ฐ์‚ฐ์ด ๊ฐ€๋Šฅํ•œ ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค.์—ฐ์†ํ˜•Continuous: ๊ธธ์ด๋‚˜ ๋ฌด๊ฒŒ์ฒ˜๋Ÿผ, ๋ถ„์ ˆ๋˜์ง€ ์•Š๊ณ  ์—ฐ์†์ ์ธ ์ˆ˜์น˜ํ˜• ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค.์ด์‚ฐํ˜•Discrete: ๊ฐœ์ˆ˜์™€ ๊ฐ™์ด ์—ฐ์†์ ์ด์ง€ ์•Š์€ ์ˆ˜์น˜ํ˜• ์ž๋ฃŒ์ž…๋‹ˆ๋‹ค.๋…๋ฆฝ ๋ณ€์ˆ˜์™€ ์ข…์† ๋ณ€์ˆ˜์ข…์† ๋ณ€์ˆ˜Dependent variable์šฐ๋ฆฌ๊ฐ€ ์˜ˆ์ธก ํ˜น์€ ์„ค๋ช…ํ•˜๊ณ ์ž ํ•˜๋Š” ๋ณ€์ˆ˜์ž…๋‹ˆ๋‹ค.๋ฐ˜์‘ ๋ณ€์ˆ˜, ํ‘œ์  ๋ณ€์ˆ˜, ์˜ˆ์ธก ๋ณ€์ˆ˜ ๋“ฑ์ด๋ผ๊ณ ๋„ ํ•ฉ๋‹ˆ๋‹ค.๋…๋ฆฝ ..
240528 Today I Learnํ†ต๊ณ„์  ๊ฐ€์„ค๊ฒ€์ •์ด๋ž€?๐Ÿ’ก ํ†ต๊ณ„์  ๊ฐ€์„ค๊ฒ€์ •์ด๋ž€?์ฃผ์–ด์ง„ ์ž๋ฃŒ๊ฐ€ ํŠน์ • ๊ฐ€์„ค์„ ์ถฉ๋ถ„ํžˆ ๋’ท๋ฐ›์นจํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ํ†ต๊ณ„์  ์ถ”๋ก  ๋ฐฉ๋ฒ•๋ชจ์ˆ˜์— ๋Œ€ํ•œ ์˜ˆ์ƒ, ์ฃผ์žฅ ๋“ฑ์˜ ์˜ณ๊ณ  ๊ทธ๋ฆ„์„ ํ‘œ๋ณธ์œผ๋กœ๋ถ€ํ„ฐ ์ฃผ์–ด์ง€๋Š” ์ •๋ณด๋ฅผ ์ด์šฉํ•ด ํŒ๋‹จํ•˜๋Š” ์‚ฌํ›„์  ๋ถ„์„๊ณผ์ •์œผ๋กœ, ์ƒ๋ฐ˜๋œ ๋‘๊ฐ€์ง€ ๊ฐ€์„ค ์ค‘ ํ•œ๊ฐ€์ง€๋ฅผ ์ˆ˜์ง‘๋œ ์ž๋ฃŒ์— ๊ทผ๊ฑฐํ•ด ์„ ํƒํ•˜๋Š” ๋ถ„์„๊ณผ์ • (2020 ํ™•ํ†ต ๊ฐ•์˜)ํ†ต๊ณ„์  ๊ฐ€์„ค๊ฒ€์ •์˜ 4๋‹จ๊ณ„๊ท€๋ฌด๊ฐ€์„ค๊ณผ ๋Œ€๋ฆฝ ๊ฐ€์„ค ์„ค์ •ํ•˜๊ธฐ๊ฐ€์„ค๊ฒ€์ •์„ ์œ„ํ•œ ํ‘œ๋ณธํ†ต๊ณ„๋Ÿ‰ ์„ ํƒํ•˜๊ธฐ๊ธฐ๊ฐ์—ญ ์„ค์ •ํ•˜๊ธฐํ†ต๊ณ„์  ๊ฒฐ๋ก  ๋‚ด๋ฆฌ๊ธฐ โ†’ ๊ท€๋ฌด๊ฐ€์„ค์˜ ๊ธฐ๊ฐ ์—ฌ๋ถ€, ๊ฒฐ๋ก ์€ ๋ง๋กœ ๊ธฐ์ˆ ํ•œ๋‹ค.๊ฐ€์„ค ๊ฒ€์ • ํ•˜๊ธฐ๊ท€๋ฌด๊ฐ€์„ค๊ณผ ๋Œ€๋ฆฝ๊ฐ€์„ค๊ท€๋ฌด๊ฐ€์„ค, Null Hypothesis (H0)์ง€๊ธˆ๊นŒ์ง€ ์˜ณ๋‹ค๊ณ  ๋ฏฟ์–ด์˜จ ์ฃผ์žฅ์ฃผ๋กœ ํ˜„์žฌ๊นŒ์ง€ ์ธ์ •๋˜๊ณ  ์žˆ๋Š” ์‚ฌ์‹ค ๋˜๋Š” ๊ฐ„๋‹จํ•˜๊ณ  ๊ตฌ์ฒด์ ์ธ ์‚ฌ์‹ค์„ ์ง€์ •์˜ˆ์‹œ - ..
240527 Today I Learnํ‰๊ท ์ด๋ž€?ํ‰๊ท ์ด๋ž€?a single number or value that best represents a set of data๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์„ ๊ฐ€์žฅ ์ž˜ ๋‚˜ํƒ€๋‚ด๋Š” ๋‹จ์ผ ์ˆซ์ž ๋˜๋Š” ๊ฐ’์„ ์ด์•ผ๊ธฐํ•œ๋‹ค.์™œ๋„์™€ ์ด์ƒ์น˜๐Ÿ’ก ์™œ๋„, Skewness์™œ๋„๋Š” ํŠน์ •ํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ์ ๋ ค์žˆ๋Š” ๊ฒƒ์œผ๋กœ, ์™œ๋„๊ฐ€ ์žˆ์œผ๋ฉด ํ‰๊ท ์ด ์ „์ฒด ๋ฐ์ดํ„ฐ๋ฅผ ๋Œ€ํ‘œํ•˜์ง€ ๋ชปํ•œ๋‹ค.๋ณดํ†ต ๊ทธ๋ž˜ํ”„๋กœ ํ™•์ธํ•˜๋ฉฐ ๊ผฌ๋ฆฌ(tail, ๊ธธ๊ฒŒ ๋Š˜์–ด์ง„ ๋ถ€๋ถ„)์˜ ๋ฐฉํ–ฅ์— ๋”ฐ๋ผ left skewed/ right skewed๋กœ ๊ตฌ๋ถ„ํ•œ๋‹ค. ์™ผ๊ผฌ๋ฆฌ ๋ถ„ํฌ, Left Skewedํ‰๊ท  ๋ถ„ํฌ๊ฐ€ ์™ผ์ชฝ์œผ๋กœ ๋ชฐ๋ ค์žˆ๊ณ  ์˜ค๋ฅธ์ชฝ์œผ๋กœ ๊ธด ๊ผฌ๋ฆฌ๊ฐ€ ๋Š˜์–ด์ง„ ํ˜•ํƒœ์˜ค๋ฅธ ๋ถ„ํฌ, Right Skewedํ‰๊ท  > ์ค‘์•™๊ฐ’๋ถ„ํฌ๊ฐ€ ์˜ค๋ฅธ์ชฝ์œผ๋กœ ๋ชฐ๋ ค์žˆ๊ณ  ์™ผ์ชฝ์œผ๋กœ ๊ธด ๊ผฌ๋ฆฌ๊ฐ€ ๋Š˜์–ด์ง„ ํ˜•ํƒœ๐Ÿ’ก ์ด์ƒ์น˜,..
๋ฐ์ดํ„ฐ ๋ฆฌํ„ฐ๋Ÿฌ์‹œ๋ž€?๐Ÿ’ก ๋ฐ์ดํ„ฐ ๋ฆฌํ„ฐ๋Ÿฌ์‹œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ํ™œ์šฉํ•˜๊ณ  ํ•ด์„ํ•  ์ˆ˜ ์žˆ๋Š” ์—ญ๋Ÿ‰ โ–ถ๏ธŽ ๊ตฌ์„ฑ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ๋Š” ๋Šฅ๋ ฅ๋ฐ์ดํ„ฐ๋ฅผ ์ดํ•ดํ•˜๋Š” ๋Šฅ๋ ฅ๋ฐ์ดํ„ฐ๋ฅผ ๋น„ํŒ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ๋Šฅ๋ ฅ๊ฒฐ๊ณผ๋ฅผ ์˜์‚ฌ์†Œํ†ต์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅโ–ถ๏ธŽ ๋ฐ์ดํ„ฐ ๋ฆฌํ„ฐ๋Ÿฌ์‹œ๊ฐ€ ํ•„์š”ํ•œ ์ด์œ ๋ฐ์ดํ„ฐ ๋ถ„์„์ด ๋ชฉ์ ์ด ๋˜์ง€ ์•Š๋„๋ก โ€˜์™œ?โ€™๋ฅผ ํ•ญ์ƒ ์ƒ๊ฐํ•ด์•ผ ํ•จ๋ฌธ์ œ ์ •์˜๋ฌธ์ œ ์ •์˜๋Š” ํ’€๊ณ ์ž ํ•˜๋Š” ๊ฒƒ์„ ๋ช…ํ™•ํ•˜๊ฒŒ ์ •์˜ํ•˜๊ณ ์ด๊ฒƒ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„์˜ ๋ฐฉํ–ฅ์„ฑ์„ ์ •ํ•˜๊ณ ๊ฒฐ๊ณผ๋ฅผ ์ •๋ฆฌํ•˜๊ณ  ํ•ด์„ํ•˜์—ฌ๋” ๋‚˜์•„์ง€๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์•ก์…˜ ํ”Œ๋žœ์„ ์ˆ˜๋ฆฝํ•˜๊ธฐ ์œ„ํ•จ๋ฌธ์ œ ์ •์˜ ๋ฐฉ๋ฒ•๋ก ๐Ÿ’ก MECE (Mutually Exclusive, Collectively Exhaustive)๋ฌธ์ œ๋ฅผ ์ƒํ˜ธ ๋ฐฐํƒ€์ (mutually exclusive)์ด๋ฉด์„œ, ์ „์ฒด์ ์œผ๋กœ ํฌ๊ด„์ (collectively exhaustiv..