공부
-
[생명과학을 위한 통계학] (5) Confidence Interval, Effect Size, Power Calculation공부 2020. 5. 4. 17:37
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 게시물에서도 예시로 들었던 일반식 먹은 쥐와 고지방식을 먹은 쥐의 몸무게를 비교하는 실험을 생각해보자. 앞으로 일반식을 먹은 쥐들을 그룹 N, 고지방식을 먹은 쥐들을 그룹 H라고 부르겠다. 만약 실험자가 "그룹 H의 평균 몸무게가 그룹 N의 평균 몸무게보다 크다 (p-value % unlist mu_hf
-
[생명과학을 위한 통계학] (4) T-test in R공부 2020. 4. 27. 23:11
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 게시물에서 정리한 가설검정 중 T-test를 R로 할 것이다. 이번 실습에서는 참고서적에서 제공한 femaleMiceWeights.csv 데이터를 사용했다. 1. 라이브러리 로딩 & 데이터 읽기 femaleMiceWeights.csv는 먹이의 종류 (chow, hf)와 체중이 기록된 데이터이다. read.csv()를 통해 working directory에 있는 ...
-
[생명과학을 위한 통계학] (3) 중심 극한 정리, 가설 검정공부 2020. 4. 23. 01:05
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 글에서 정규 분포에 대해서 간단히 언급을 했는데, 다시 짚고 넘어가자. 1. 정규 분포 (Normal Distribution) DEFINITION 확률 변수 \(X\)의 확률 밀도가 다음과 같을 때 $$f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}, \quad -\inft..
-
[생명과학을 위한 통계학] (2) 통계적 추론, 확률 변수, 확률 분포, 통계적 가설검정, P-value공부 2020. 4. 21. 02:30
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 1. 통계적 추론 (Statistical Inference)이란? 신종 코로나바이러스 (SARS-CoV-2)가 아주 기승이다. 2월이면 끝날 줄 알았는데 벌써 5월을 향해 달려가고 있다. 신약 개발이 평균 10~15년인 것을 감안하면 신종 코로나바이러스 감염증 (COVID-19) 치료제를 전통적인 신약 개발 프로세스대로 개발하는 것은 현실성이 없다. 그렇기에 미국을 비..
-
[생명과학을 위한 통계학] (1) R 프로그래밍 준비하기공부 2020. 4. 21. 02:28
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 세상에는 수많은 프로그래밍 언어가 존재한다. 필자가 학부 시절 컴퓨터공학을 부전공하면서 경험해본 프로그래밍 언어만 해도 꽤 많은데 (C, C++, Java, Python, Bash, SAS, MATLAB), 컴퓨터공학을 전공으로 했던 친구들은 훨씬 더 많은 종류의 프로그래밍 언어를 접했을 것이다. R은 SAS, Python과 함께 통계분석에서 많이 사용되는 프로그래밍 ..