분류 전체보기
-
[생명과학을 위한 통계학] (5) Confidence Interval, Effect Size, Power Calculation공부 2020. 5. 4. 17:37
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 게시물에서도 예시로 들었던 일반식 먹은 쥐와 고지방식을 먹은 쥐의 몸무게를 비교하는 실험을 생각해보자. 앞으로 일반식을 먹은 쥐들을 그룹 N, 고지방식을 먹은 쥐들을 그룹 H라고 부르겠다. 만약 실험자가 "그룹 H의 평균 몸무게가 그룹 N의 평균 몸무게보다 크다 (p-value % unlist mu_hf
-
[생명과학을 위한 통계학] (4) T-test in R공부 2020. 4. 27. 23:11
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 게시물에서 정리한 가설검정 중 T-test를 R로 할 것이다. 이번 실습에서는 참고서적에서 제공한 femaleMiceWeights.csv 데이터를 사용했다. 1. 라이브러리 로딩 & 데이터 읽기 femaleMiceWeights.csv는 먹이의 종류 (chow, hf)와 체중이 기록된 데이터이다. read.csv()를 통해 working directory에 있는 ...
-
[생명과학을 위한 통계학] (3) 중심 극한 정리, 가설 검정공부 2020. 4. 23. 01:05
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 이전 글에서 정규 분포에 대해서 간단히 언급을 했는데, 다시 짚고 넘어가자. 1. 정규 분포 (Normal Distribution) DEFINITION 확률 변수 \(X\)의 확률 밀도가 다음과 같을 때 $$f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}, \quad -\inft..
-
블로그에서 수식 입력하기 (MathJax)기타 2020. 4. 22. 12:35
※ 아래 기술된 방법으로 수식 입력을 제대로 해도 모바일 환경에서 수식이 깨지는 경우들을 확인했습니다. 이는 모바일 웹으로 자동으로 변환해주는 과정에서 MathJax 스크립트가 제대로 넘어가지 않아서 생기는 문제로 파악되며, 티스토리 설정에서 모바일웹 자동 연결을 사용하지 않음으로 바꾸면 해결됩니다. MathJax project는 웹상에서 양질의 과학적 콘텐츠 생산을 목적으로 American Mathematical Society (AMS)와 Society for Industrial and Applied Mathematics (SIAM)의 지원을 받아 시작된 오픈소스 프로젝트이다. 이 프로젝트는 다음과 같은 목표를 가지고 있으며, 직접 써본 결과 수식 입력이 매우 편리하다. - High-quality di..
-
왜 유튜브 안하고 블로그 하세요?잡생각 2020. 4. 21. 02:32
오랜 친구 중에 안○○이라고 있다. 이 친구는 고등학교 시절부터 거의 10여 년간 네이버 블로그를 운영해오고 있는데, 오랫동안 블로그를 운영한 덕분인지 글을 맛깔나게 쓰는 재주가 있다. 덕분에 네이버에 로그인할 때마다 MY구독 탭을 확인하는 버릇이 생겼는데, 새 글 알림이 떠있는 경우 이번에는 어떤 재미있는 글이 나를 즐겁게 할지 두근거리곤 한다. 그 블로그에는 '카투사 훈련 중 탄창 잃어버린 썰'이라든지, 지금은 잘 기억도 나지 않는 고등학교 기숙사에서의 해프닝이라든지... 다시 봐도 재미있는 명작들이 즐비하다. 이 친구 외에도 블로그를 운영하는 지인들이 몇 있다. 안○○의 블로그처럼 열정적으로 구독하고 있지는 않지만, 가끔 생각나서 들어가 보면 기록된 글들을 통해 그 사람에게 조금이나마 가까워지는 느..
-
[생명과학을 위한 통계학] (2) 통계적 추론, 확률 변수, 확률 분포, 통계적 가설검정, P-value공부 2020. 4. 21. 02:30
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 1. 통계적 추론 (Statistical Inference)이란? 신종 코로나바이러스 (SARS-CoV-2)가 아주 기승이다. 2월이면 끝날 줄 알았는데 벌써 5월을 향해 달려가고 있다. 신약 개발이 평균 10~15년인 것을 감안하면 신종 코로나바이러스 감염증 (COVID-19) 치료제를 전통적인 신약 개발 프로세스대로 개발하는 것은 현실성이 없다. 그렇기에 미국을 비..
-
[생명과학을 위한 통계학] (1) R 프로그래밍 준비하기공부 2020. 4. 21. 02:28
[생명과학을 위한 통계학] 시리즈 글들은 Data Analysis for the Life Sciences by Rafael A Irizarry & Michael I Love와 오픈 강의 플랫폼들 (Coursera, edX)에서 제공하는 강의들을 바탕으로 작성되었습니다. 더 자세한 내용을 확인하고 싶으신 경우 글 하단의 링크를 확인해주세요. 세상에는 수많은 프로그래밍 언어가 존재한다. 필자가 학부 시절 컴퓨터공학을 부전공하면서 경험해본 프로그래밍 언어만 해도 꽤 많은데 (C, C++, Java, Python, Bash, SAS, MATLAB), 컴퓨터공학을 전공으로 했던 친구들은 훨씬 더 많은 종류의 프로그래밍 언어를 접했을 것이다. R은 SAS, Python과 함께 통계분석에서 많이 사용되는 프로그래밍 ..