학술연구/통계 & R 5

통계의 기본개념 #1, 자료와 변수 개념

자료(DATA) 양적 자료(정성적 자료, Quantitative data) 정의 : 숫자로 표현되는 데이터 예제 : 수고, 흉고직경, 나이테폭, 기온, 습도 등 분석방법 : 평균, 분산, 편차 등 수식을 통하여 산출함 질적 자료(정량적 자료, Qualitative data) 정의 : 숫자로 표현할 수 없는 데이터 예제 : 지역, 사이트명, 수종, 계절 등 분석방법 : 주로 빈도수(frequency)를 이용함 자료의 구성 개체(Item) 연구 대상 수목 요인(Factor) 개체의 특성들의 집합 수목의 생장량, 날씨 변수(Variable) 요인을 구성하는 요소들 수목의 나이테폭, 수령, 시간, 온도, 습도 독립변수(Independent variable) : 의도적으로 변화시키는 변수(원인변수, 설명하는 변수..

Hierarchical Clustering using R

- 계층적 군집분석(Hierarchical Clustering) - 거리가 가장 가까운 대상부터 결합하여 나무모양의 - 계층구조를 상향식(Bottom-up)으로 만들어가면서 군집을 형성 1. common.interval 을 이용한 missing Ring을 제외하기 wapd.fh data02 d02 hc02 plot(hc02, cex = 0.6, hang = -1) > rect.hclust(hc02, k=3, border="red") ## 시각화 ## > hc03 plot(hc03, cex = 0.6, hang = -1) > rect.hclust(hc03, k=3, border="red") ## 데이터 만들기 ## kopd.fh

R 시작하다.

통계 분석 프로그램의 대세인 'R'을 이제서야 시작해봅니다. 글자색 빨간색 : 명령문 명령문 실행은 enter key 결과값 Inf = Infinity (무한값) 제곱급 = sqrt(숫자) R을 통해서 한 첫번째 연산 연습 자료 = 객체 object 벡터 = 개체의 한유형이며, 하나의 변수를 뜻함, 동일한 특성과 요소로 구성됨. 함수 funtion - 평균 mean - 파일을 복사해서 R에 넣을때 문자는 조심 - 윈도우와 R이 사용하는 문자 기반이 다르기 때문