학술연구/통계 & R

통계의 기본개념 #1, 자료와 변수 개념

정현민 Hyun-min Jeong 2020. 5. 18. 00:52

자료(DATA)

양적 자료(정성적 자료, Quantitative data) 

정의 : 숫자로 표현되는 데이터
예제 : 수고, 흉고직경, 나이테폭, 기온, 습도 등
분석방법 : 평균, 분산, 편차 등 수식을 통하여 산출함

 

질적 자료(정량적 자료, Qualitative data)

정의 : 숫자로 표현할 수 없는 데이터
예제 : 지역, 사이트명, 수종, 계절  등
분석방법 : 주로 빈도수(frequency)를 이용함

 

자료의 구성

개체(Item)

연구 대상
수목

 

요인(Factor)

개체의 특성들의 집합
수목의 생장량, 날씨

 

변수(Variable)

요인을 구성하는 요소들
수목의 나이테폭, 수령, 시간, 온도, 습도
독립변수(Independent variable) : 의도적으로 변화시키는 변수(원인변수, 설명하는 변수, 예측하는 변수)
종속변수(Dependent variable) : 독립변수의 변화에 따라 어떻게 변화하는지 알고 싶은 변수(결과변수, 설명되는 변수, 예측되는 변수)

 

 

 

 

 

 

 

구분 범주형 데이터 Categorical data 연속형 데이터 Continuous data
양적 자료 질적 자료
명목척도
Norminal scale
순위척도
Ordinal scale
등간척도
Interval scale
비율척도
Ratio scale
정보 내용 집단 구분 순위 간격 비교 시간 절대크기 비교
대표값 최빈값 중앙값 평균 평균
적용 통계분석법 빈도분석, 비모수통계, 교차분석 서열상관관계, 비모수통계 모수통계 모수통계
예제 수종, 지역, 계절,
수피(유/무) 
영급, 경급 온도, 습도 나이테폭, 수령, 흉고직경
명목변수 : 집단의 구분
간격변수 : 절대 0과 비율은 의미가 없으며, 더할 수는 있지만 곱할 수는 없다.
비율변수 : 절대 0과 비율은 의미가 있으며, 곱할 수 있다.

영급별: 임상의 나이별로 구분 
경급별: 입목의 흉고직경에 따라 소경목, 중경목, 대경목으로 구분 
임상별: 임상의 종류별 구분 
수관밀도별: 수관의 지표점유 밀도에 따라 소, 중, 밀의 세 가지 등급

 

'학술연구 > 통계 & R' 카테고리의 다른 글

통계의 기본개념 #1, 자료와 변수 개념  (0) 2020.05.18
Hierarchical Clustering using R  (0) 2019.06.20
dplR 패키지 설치하기  (0) 2019.06.20
R 설치하기  (0) 2019.06.20
R 시작하다.  (0) 2019.03.31
1 2 3 4 5 6 7 8 ··· 72