📚해당 게시글은 '이지스 퍼블리싱' 출판, 데이터 분석가 '김영우'님이 지은 도서 "Do it! 쉽게 배우는 R 데이터 분석" 을 기반으로 작성된 게시글입니다. 저작권 문제 시 게시글을 삭제 하겠습니다 :)
하루만에 R 교재 도착했다.. 역시 믿고 보는 YES24인가요..ㅋㅋ 오늘부터 바로 독학 시작했다!
- R이 뭔데?
R은 데이터 분석에 쓰이는 소프트웨어이다. 다양한 분야의 데이터 분석가들이 R을 사용하는 추세이고, 입문자들도 R을 익힌다. R은 통계분석, 머신러닝 모델링, 텍스트 마이닝, 소셜 네트워크 분석, 지도 시각화, 주식 분석, 이미지 분석, 사운드 분석, 웹 어플 개발 등 다양한 분야에서 쓰인다. 또한 전세계 데이터 분석가들부터 시작해 연구자, 세계적 기업, 데이터 분석 대회 참가자들, 심지어 데이터 관련 업무가 많은 국내 기업들도 R을 많이 사용한다.
위 그래프에서 볼 수 있듯, R을 사용한 논문의 수는 지속적으로 증가하는 중이며, 증가 속도도 다른 도구들 보다 빠르다. 심지어 2015년에는 SAS를 앞질러 1위를 차지했다. 반면, 해당 사이트의 다른 그래프를 보면 SPSS를 사용하는 논문의 수는 급격히 줄어들고 있다는 것을 알 수 있다.
- R의 장점
1. 무료로 사용가능 한 오픈소스; 나와 같은 학생들이 사용하는데 부담이 없다는 것. 내가 SAS 대신 R 독학을 선택한 이유이기도 하다.
2. 다양한 패키지와 최신 분석 기법 포함; R의 사용량이 증가하는 만큼, CRAN(R 사용자들이 패키지를 만들어 공유하는 사이트)에는 만개가 넘는 패키지가 공개되어있다. 정식 루트는 CRAN이지만, Github나 FTP등의 루트를 통해서도 더 많은 패키지가 공유되고 있다.
3. 다양한 교육 자료
4. 다양한 그래프 구현
5. 프로그래밍 방식; SPSS를 공부하면서 불편했던건 코딩을 하는게 아니라 툴이 제공되어있어서 내가 분석하고싶은 걸 맘대로 못했다는 것.. 하지만 R은 코딩을 하는 프로그래밍 방식이라 명령어로 내가 하고싶은걸 할 수 있다!
6. 오류 최소화: 이것도 SPSS에서 불편했던 것.. 버튼 한번 잘못누르고 입력한번 잘못하면 1로 다시 되돌아가야한다. 심지어 하다보면 어디서 틀렸는지 모를때가 대부분... 다 하고 결과가 뭔가 이상해서 보면 입력 잘못했었고 버튼 잘못눌렀었고...욕나오고....ㅋㅋㅋ하지만,, R은 내가 뭘 입력했는지 위에 다 보이기 때문에 오류뜨면 그부분 고쳐서 다시 입력하면 된다
7. 공동작업 가능; GUI방식(SPSS등)을 사용하는 분석도구는 위에 말했 듯 결과만 남는다. 이 때문에 여러명이 공동작업을 하기에는 어려움이 있다. 하지만 프로그래밍 방식의 분석 도구는 모든 분석 과정이 남기때문에 코드를 공유하며 공동 작업을 할 수 있다.
R에 대해서 알아보는건 이정도로 하고,,
R이랑 R Studio 설치하고 주문한 책으로 각각 기능들에 대해서 알아보는데까지 완료했다! 아직은 단어도 어렵고 맞게 하는게 맞는지 두세번씩 확인해야되지만,, 곧 적응하겠지..
이제부터는 진짜 코딩 시작이다👊
'(통계분석) R' 카테고리의 다른 글
09.25(금) 데이터 전처리, 필요한 데이터 추출, 필요한 변수 추출 (0) | 2020.09.28 |
---|---|
09.24(목) 데이터 파악, 변수명 변경, 파생변수 생성 (0) | 2020.09.27 |
09.24(목) 데이터 프레임 이해 및 생성, 외부 데이터 불러오기 (0) | 2020.09.27 |
09.23(수) 변수, 함수, 패키지 이해하기 (0) | 2020.09.26 |
09.22(화) R과의 첫..만남.. (0) | 2020.09.26 |