통계학
-
[생명과학을 위한 통계학] (4) T-test in R공부 2020. 4. 27. 23:11
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 게시물에서 정리한 가설검정 중 T-test를 R로 할 것이다. 이번 실습에서는 참고서적에서 제공한 femaleMiceWeights.csv 데이터를 사용했다. 1. 라이브러리 로딩 & 데이터 읽기 femaleMiceWeights.csv는 먹이의 종류 (chow, hf)와 체중이 기록된 데이터이다. read.csv()를 통해 working directory에 있는 ...
-
[생명과학을 위한 통계학] (3) 중심 극한 정리, 가설 검정공부 2020. 4. 23. 01:05
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 글에서 정규 분포에 대해서 간단히 언급을 했는데, 다시 짚고 넘어가자. 1. 정규 분포 (Normal Distribution) DEFINITION 확률 변수 \(X\)의 확률 밀도가 다음과 같을 때 $$f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}, \quad -\inft..
-
[생명과학을 위한 통계학] (2) 통계적 추론, 확률 변수, 확률 분포, 통계적 가설검정, P-value공부 2020. 4. 21. 02:30
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 1. 통계적 추론 (Statistical Inference)이란? 신종 코로나바이러스 (SARS-CoV-2)가 아주 기승이다. 2월이면 끝날 줄 알았는데 벌써 5월을 향해 달려가고 있다. 신약 개발이 평균 10~15년인 것을 감안하면 신종 코로나바이러스 감염증 (COVID-19) 치료제를 전통적인 신약 개발 프로세스대로 개발하는 것은 현실성이 없다. 그렇기에 미국을 비..
-
[생명과학을 위한 통계학] (1) R 프로그래밍 준비하기공부 2020. 4. 21. 02:28
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 세상에는 수많은 프로그래밍 언어가 존재한다. 필자가 학부 시절 컴퓨터공학을 부전공하면서 경험해본 프로그래밍 언어만 해도 꽤 많은데 (C, C++, Java, Python, Bash, SAS, MATLAB), 컴퓨터공학을 전공으로 했던 친구들은 훨씬 더 많은 종류의 프로그래밍 언어를 접했을 것이다. R은 SAS, Python과 함께 통계분석에서 많이 사용되는 프로그래밍 ..