240603 Today I Learn
λ°μ΄ν°μ μ’ λ₯
μμΉν μλ£ - μ«μλ₯Ό μ΄μ©ν΄ ννν μ μλ λ°μ΄ν°
- μ°μν : μΌμ λ²μ μμμ μ΄λ€ κ°μ΄λ μ·¨ν μ μλ λ°μ΄ν°
→ 체μ€, μ μ₯ - μ΄μ°ν : νμμ κ°μ μ μν κ°λ§ μ·¨ν μ μλ λ°μ΄ν°(μμμ μ΄ μλ―Έκ° μμ)
→ μ¬κ³ 건μ, μΌ λ°©λ¬Έμμ
λ²μ£Όν μλ£ - κ°λ₯ν λ²μ£Ό μμ κ°λ§μ μ·¨νλ λ°μ΄ν°
- μμν(μμν) : κ°λ€ μ¬μ΄μ λΆλͺ
ν μμκ° μλ λ°μ΄ν°
→ λ±μ - λͺ
λͺ©ν : κ°λ€ μ¬μ΄μ μμκ° μλ λ°μ΄ν°
→ λλΌ, λμ, νμ‘ν, μ±λ³, μ±κ³΅μ¬λΆ, MBTI- μ΄μ§ν : λκ°μ κ°λ§μ κ°μ§λ λ²μ£Όν λ°μ΄ν°
→ Y/N, T/F, M/F
- μ΄μ§ν : λκ°μ κ°λ§μ κ°μ§λ λ²μ£Όν λ°μ΄ν°
νΈμ°¨, λΆμ°, νμ€νΈμ°¨, νλ³ΈλΆν¬
νΈμ°¨
π‘ νΈμ°¨
κ°κ°μ κ°μμ νκ· μ λΊ κ°μΌλ‘, ν΄λΉ κ°μ΄ νκ· μΌλ‘λΆν° μΌλ§λ λ¨μ΄μ Έ μλμ§λ₯Ό μλ―Ένλ€.
- μΈ νμμ μμ΄μ μ νκ· μ 60μ μ΄κ³ A,B,C νμμ κ°κ° 30,-10,-20μ΄λΌλ νΈμ°¨λ₯Ό κ°μ§κ³ μλ€.
- νΈμ°¨μ ν©μ 0 (30-10-20 = 0)μ΄λ€.
→ μ΄λ κ² νΈμ°¨λ μλ‘ μμ λλ―λ‘ λΆν¬λ₯Ό μ νν νμ ν μ μλ€. λ°λΌμ μ°λ¦¬λ λΆμ°μ μ¬μ©νλ€.
λΆμ°, νμ€νΈμ°¨
π‘ λΆμ°
νΈμ°¨ μ κ³±ν©μ νκ· μΌλ‘, νΈμ°¨μ ν©μ΄ 0μΌλ‘ λμ€λ κ²μ λ°©μ§νκΈ° μν΄ μμ±λ κ°λ μ΄λ€.
- A, B, C μΈ νμμ νΈμ°¨λ₯Ό μ κ³±νλ©΄ κ°κ° 900, 100, 400μ΄ λλ€.
- μ΄ κ²½μ° νΈμ°¨μ ν©μ νμμλ‘ λλ μ€ κ²μ΄ λΆμ°μ΄ λκ³ , λΆμ°μ 1400/3 = 466 μ΄ λλ€.
→ νΈμ°¨λ₯Ό μ κ³±νλ©΄ νΈμ°¨μ ν©μ΄ μμλλ λ¬Έμ λ₯Ό ν΄κ²°ν μ μμ§λ§, νΈμ°¨λ₯Ό μ κ³±νκΈ° λλ¬Έμ κ·Έ λ¨μκ° λ¬λΌμ§κ² λμλ€. λ°λΌμ μ΄λ₯Ό 보μ νκΈ° μν΄ λΆμ°μ μ κ³±κ·Όμ μμ΄ νμ€νΈμ°¨λ₯Ό νμ©νλ€.
π‘ νμ€νΈμ°¨
λΆμ°μ μ κ³±κ·Όμ μμμ€ κ°. μλ κ°μΌλ‘ λλ리기
- λΆμ°(466)μ μ κ³±κ·Όμ μμ°λ©΄ μ½ 21.6μ΄ λκ³ , μ΄κ²μ νμ€νΈμ°¨λΌκ³ νλ€.
νλ³ΈλΆν¬
π‘ νλ³ΈλΆν¬
νλ³Έμ λΆν¬. λͺ¨μ§λ¨μμ μ¬λ¬ νλ³Έμ μΆμΆνκ³ κ° νλ³Έμ νκ· μ κ³μ°νλ€λ©΄, μ΄λ μ€μ¬κ·Ήνμ 리*μ λ°λΌ μ κ·λΆν¬μ κ°κΉμμ§λ€.
* μ€μ¬κ·Ήνμ 리 : νλ³Έ ν¬κΈ°κ° μΆ©λΆν ν¬λ€λ©΄ μ΄λ€ λΆν¬μμλ νλ³Έ νκ· μ΄ μ κ·λΆν¬λ₯Ό λ°λ₯Έλ€λ κ²μ μλ―Έ
μ κ·λΆν¬, μ 뒰ꡬκ°
μ κ·λΆν¬
- μ κ· λΆν¬λ μ’μ° λμΉμ ννμ΄λ©° νκ· μΉμμ κ°μ₯ κ·Έ νλ₯ μ΄ λλ€.
- 곑μ μ κ° νλ₯ κ°μ λνλ΄λ©°, λͺ¨λ λνλ©΄ 1μ΄ λλ€
- μ κ·λΆν¬λ νκ· κ³Ό λΆμ°(νΌμ§μ λ)μ λ°λΌ λ€λ₯Έ ννλ₯Ό κ°μ§λ€
- νκ· 0, λΆμ° 1μ κ°μ§λ κ²½μ°, μ΄λ₯Ό νμ€μ κ·λΆν¬λΌκ³ νλ€. (κ·Έλ¦Όμ λΆμμ κ·Έλν)
β νμ€ μ κ· λΆν¬κ° μ€μν μ΄μ
κ°κ°μ κ·Έλνλ νκ· κ³Ό λΆμ°κ°μ λ°λΌ λ€λ₯΄κ² κ·Έλ €μ§ μ μλ€. νμ§λ§ μ΄λ¬ν κ²½μ°, νλ₯ μ κ³μ°ν λ μ΄λ €μμ κ²ͺμ μ μλ€. μ΄λ₯Ό ν΅μΌνκΈ° μν΄ λΆν¬μ νκ· κ³Ό λΆμ° κ°μ ν΅μΌνλ νμ€ν μμ μ΄ νμνλ€.
- λ¨Έμ λ¬λ λͺ¨λΈμ λ§λ€ λ, λ°μ΄ν°μ λ²μκ° λ§μ΄ μ°¨μ΄λλ κ²½μ° νμ€νκ° νμνλ€.
μ 뒰ꡬκ°
π‘μ 뒰ꡬκ°
νΉμ λ²μ λ΄μ κ°μ΄ μ‘΄μ¬ν κ²μΌλ‘ μμΈ‘λλ μμ
→ μμ - μμ΄μ μκ° 10μ μμ 90μ μ¬μ΄μΌ κ² κ°μμ
π‘ μ λ’°μμ€
μ€μ λͺ¨μλ₯Ό μΆμ νλλ° λͺ νΌμΌνΈμ νλ₯ λ‘ μ 뒰ꡬκ°μ΄ μ€μ λͺ¨μλ₯Ό ν¬ν¨νκ² λλ νλ₯ . μ£Όλ‘ 95%μ 99% λ₯Ό μ΄μ©νλ€.
→ μμ - μμ΄μ μκ° 10μ μμ 90μ μ¬μ΄μΌμ λΆν¬ν νλ₯ μ΄ 95% κ°μμ
scipy λΌμ΄λΈλ¬λ¦¬ μ΄μ©ν΄μ μ λ’°κ΅¬κ° κ΅¬νκΈ°
import scipy.stats as st
import numpy as np
#μν λ°μ΄ν° μ μΈ
sample1 = [5, 10, 17, 29, 14, 25, 16, 13, 9, 17]
sample2 = [21, 22, 27, 19, 23, 24, 20, 26, 25, 23]
df = len(sample1) - 1 # μμ λ : μν κ°μ - 1
mu = np.mean(sample1) # νλ³Έ νκ·
se = st.sem(sample1) # νμ€ μ€μ°¨
# 95% μ λ’°κ΅¬κ° ( = 95% μ λ’°νλ €λ©΄ λ°μ΄ν°μ λ²μκ° μ΄λ»κ² λλμ§?)
st.t.interval(0.95, df, mu, se) # (10.338733110887336, 20.661266889112664)
# 99% μ 뒰ꡬκ°( = 99% μ λ’°νλ €λ©΄ λ°μ΄ν°μ λ²μκ° μ΄λ»κ² λλμ§?)
# 99% λ‘ μ λ’°ν μ μμ΄μΌ νλ―λ‘, μμ 95% λ³΄λ€ λ°μ΄ν° λ²μκ° λμ μ μ΄ν΄λμ
¨λμ? :)
st.t.interval(0.99, df, mu, se) # (8.085277068873378, 22.914722931126622)