(통계분석) SAS 7

21.06.14~21.06.16 통계특강 내용 정리(2)

저번 포스팅에서는 통계의 기본과 Z검정, T검정, ANOVA검정에 대해 정리했고, 이번 포스트에서는 회귀분석과 GLM 관련 이론들에 대해 정리해보고자 한다. 1) 다양한 통계분석기법 독립변수 = 범주변수 독립변수 = 연속변수 종속변수 = 범주변수 카이제곱검정 로지스틱회귀분석 종속변수 = 연속변수 분산분석&공분산분석 회귀분석&공분산분석 결과변수 회귀모형 연속변수 일반회귀분석 순위 순서 회귀분석 2개의 카테고리 로지스틱 회귀분석 3개 이상 카테고리 다중명목 회귀분석 발생횟수 포아송 회귀분석 2) 상관관계(Correlation) - 두 변수 간 선형 상관관계 분석, 상관분석의 결과로 상관관계 정도를 나타내는 상관계수가 도출됨 - 모상관계수는 p, 표본상관계수는 r 사용. 상관관계가 0

(통계분석) SAS 2021.06.28

21.06.14~21.06.16 통계특강 내용 정리(1)

4학년 1학기를 마치고 종강 이후에 학과에서 'SAS/R을 이용한 통계특강'을 개설했다. 빅데이터분석론 수업을 들으면서 SAS를 돌릴 수 있는 정도가 되었고, R은 혼자 공부했던 적이 있었기에 혹시나 독학에 도움이 될까 수강 신청을 했고 그렇게 3일간 통계 특강을 듣게 되었다. 오전 10시부터 오후 5시까지(점심시간 제외) 수업이 진행되었는데, 첫날은 통계의 개념, Z검정, T검정, ANOVA검정에 대해 배우고, 둘째날은 Linear regression과 Generalized linear model에 대해, 마지막날은 실습을 해보는 시간을 가졌다. 첫날 특강을 들을 때 굉장히.,, 사조사 필기 준비할때와 같은 기분이들었다..하하 좀 꼼꼼히? 복습할수 있는 기회?가 된 것 같아서 좋았다..! 1) 통계의 ..

(통계분석) SAS 2021.06.28

주관적 스트레스 수준이 비만에 미치는 영향 (SAS 분석 실전)

"주관적 스트레스 수준이 비만에 미치는 영향"은 보건의료빅데이터 전공 수업 때 기말 프로젝트로 제출했던 리포트 주제이다. 2017년 국민건강영양조사 결과를 바탕으로 분석했고, 이번 포스팅에서는 리포트로 썼던 내용을 정리해보고자한다. * 25 미만 - 1; 저체중, 정상 * 25 이상 - 2; 비만 관심변수: 주관적 스트레스 수준 (BP1이용 stress 변수 생성) * stress = 1 - 많음 * stress = 2 - 보통 * stress = 3 - 적음 통제변수: - age (연령) - sex (성별) * sex = 1 - 남자 * sex = 2 - 여자 - educ 이용 edu_final 생성 (교육수준) * edu_final = 1 - 고등학교 이하 * edu_final = 2 - 2/3년제 ..

(통계분석) SAS 2021.06.25

건강보험종류에 따른 연간 입원/외래 이용 분석

이번 포스트에서는 1)건강보험종류에 따른 연간 입원/외래 이용 분석 2)건강보험종류에 따른 자살계획, 자살시도 분석을 주제로 다뤄볼것이다! 전공수업 실습 과제로 제출했던 주제들인데, 이전 포스트에 비교했을 때 데이터 매니지먼트 과정이 포함되어있어 약간 복잡했다. 우선 교수님이 조건을 주신대로 이용할 변수들에 대해 데이터 매니지먼트를 끝냈다는 가정하에, 분석하는 부분부터 글을 작성해보려한다. proc univariate data=a; var income; run; proc glm data = a; class sex R incomepart BMI_FINAL marry private self stress NHI(ref='1'); model inpatient = age sex R incomepart BMI_FI..

(통계분석) SAS 2021.06.25

PROC GLM & PROC LOGISTIC 활용 실습

[실습1] 종속변수: phb_01z1 (하루 10분이상 걷기 일수 - 연속변수) 독립변수: sex(범주), age(연속), bogun_cd(범주), soa_01z1(범주) 결과에 대한 해석 (Estimate 값과 통계적 유의성을 모든 독립변수에 대해 제시) - 코드 PROC GLM DATA=KSY_LIB.SAMPLE; CLASS sex bogun_cd soa_01z1; MODEL phb_01z1 = sex age bogun_cd soa_01z1 / solution; RUN; - 결과값 - 해석 1. 연속형 독립변수 ‘age’ - 성별(sex), 보건소 지역번호(bogun_cd), 경제활동유무(soa_01z1)의 값을 보정한 결과, 독립변수 age가 하나씩 증가할 때마다 하루 10분이상 걷기 일수(phb_..

(통계분석) SAS 2021.06.25

SAS 기본 코드(2)

SAS 기본 코드에 대한 저번 포스트에 이어, 이번에는 PROC 구문을 이용하는 기본 구문들을 정리해보고자 한다. 통계분석에서 사용되는 ANOVA, T-TEST, 로지스틱회귀분석 등 다양한 분석기법들은 모두 PROC구문을 이용해 작성된다. (데이터 매니지먼트 잘해놔도 여기서 꼬이면 답도없다는..ㅠ) 해당 포스트는 아마 SAS를 실행할 때마다 자주 찾아볼 것 같은 느낌이 든다,,ㅎㅎ 1. PROC FORMAT 이전 포스트 8번 input문을 간단히 설명하며, put(숫자변수, format); 이 숫자변수를 문자변수로 바꿔주는 역할을 한다고 설명했다. 같은 원리로 작성된 문구라고 보면 된다! 보라색은 포맷이름이다. 구문만 제대로 쓴다면 마음대로 설정할 수 있지만, 헷갈림을 방지하기 위해 보통 변수명fmt 형..

(통계분석) SAS 2021.06.23

SAS 기본 코드(1)

4학년 1학기 전공으로 개설된 "보건의료빅데이터분석론"이라는 수업을 듣게되었다. 지금까지 혼자 공부해왔던 R이 아닌, SAS로 통계분석을 해볼수 있었던 한 학기였다. SAS도 한번은 해보고 싶은 생각이 있었지만, 무료인 R에 비해 설치 비용이 비싸고, 복잡하다는 후기가 많아 R을 선택했었다. 하지만 수업을 통해 가상화 프로그램으로 SAS를 작동시킬수 있다는 꿀팁을 알게 되었고, 비록 무료버전이라 골치가 아팠지만,, 새로운 걸 배울 수 있는 좋은 기회였다고 한다 :) 전공 수업 15주차 중 약 2주차는 SAS 기본 설명, 8주차는 SAS 기본 코드 설명, 4주차는 실습, 마지막주차는 기말고사를 보는 것으로 구성되었다. SAS 코드는 R과 다른점이 정말 정말 많다. 이번 포스팅에서는 수업때 배운 것을 바탕으..

(통계분석) SAS 2021.06.23