파이썬을 이용한 바이오인포매틱스 + 딥러닝에 대한 스터디입니다
https://drive.google.com/drive/folders/0B6bSLTlVnagfQ1ozTnV0anRqQWc
- 파이션 기초 - 정보교육을 위한 파이썬 ( http://python.xwmooc.org/ )
- bioPython 교재 - Bioinformatics with Python Cookbook ( http://www.amazon.com/gp/aw/d/1782175113 )
- Theano 교재 1 - Theano 기초 ( http://deeplearning.net/software/theano/tutorial/ )
- Theano 교재 2 - Deeplearning ( http://deeplearning.net/tutorial/deeplearning.pdf )
- 실습 주제 : 암 환자 RNA정보를 활용한 암 예측 모델 개발
- 암환자 RNA 정보 획득방법 및 Data 구조파악
- 암환자 mRNA 데이터 수집 및 구조
- 암환자 mRNA데이터를 DB와 HBase에 올리기
- 암환자 mRNA에서 학습용, Valiaiotion용, Test용 데이터 만들기
- 실습 계획 :
-
- 회귀모형을 활용한 모형 개발
-
- Multilayer Perceptron을 활용한 모형 개발
-
- DBN을 활용한 모형 개발
-
- 실습 환경 : NCloud 서버 4대와 스터디 구성원의 준비해주는 장비
서버명 | 서버OS | 서버 구성 | 공인 IP | PORT 영역 |
---|---|---|---|---|
biospin | ubuntu 14.04 | 8CPU, 16G Mem, 500G HDD | 211.249.50.37 | 1xxxx, 예) 18888 |
darwin | ubuntu 14.04 | 8CPU, 16G Mem, 500G HDD | 211.249.50.37 | 2xxxx, 예) 28888 |
babelpish | ubuntu 14.04 | 4CPU, 16G Mem, 500G HDD | 211.249.50.159 | 3xxxx, 예) 38888 |
psygrammer | ubuntu 14.04 | 4CPU, 16G Mem, 500G HDD | 211.249.50.159 | 4xxxx, 예) 48888 |
S/W | node01(darwin) | node02(biospin) | node03(babelpish) | node04(psygrammer) |
---|---|---|---|---|
Hadoop2.6 | NameNode | NodeManager | NodeManager | NodeManager |
DataNode | DataNode | DataNode | DataNode | |
ResourceManager | ||||
SecondaryNameNode | ||||
Hbase1.1.2 | HMaster | |||
HRegionServer | HRegionServer | |||
Zookeeper | QuorumPeerMain | |||
Spark 1.5 | Master | |||
Worker | Worker | Worker | Worker | |
MariaDB | mysqld |
- Bengio 교수의 딥러닝 강의 - 딥러닝에 대한 깊은 통찰을 얻을 수 있음.
- 스탠포드대학의 Convolutional Neural Networks for Visual Recognition 강의 - 딥러닝에 사용되는 수식을 쉽게 설명
- Docker로 Caffe 실습하기
- Basset-Deep convolutional neural networks for DNA sequence analysis
- 남광우님의 Basset 노트
- Theano의 Graph Structures예제에서 발생하는 오류 해결방법
- NVIDA CUDA 드라이버설치 방법
- [우분투 14.04에 NVIDA CUDA 드라이버설치 ] (https://github.com/biospin/DeepBio/blob/master/reference/00_cuda_install.ipynb)
- 손고리즘ML 발표자료
- 인공신경망과 딥러닝 무료 강좌 한글
- udacity의 Deep Learning강좌 영어
- 02월 23일 DeepBio:파트 4 - 3회차
- 02월 16일 DeepBio:파트 4 - 2회차
- 02월 02일 DeepBio:파트 4 - 1회차
- 01월 26일 DeepBio:파트 3 - 4회차
- 01월 19일 DeepBio:파트 3 - 3회차
- 01월 12일 DeepBio:파트 3 - 2회차
- 01월 05일 DeepBio:파트 3 - 1회차
- 12월 29일 DeepBio:파트 2 - 4회차
- 12월 15일 DeepBio:파트 2 - 3회차
- 12월 08일 DeepBio:파트 2 - 2회차
- 12월 01일 DeepBio:파트 2 - 1회차
- 11월 24일 DeepBio:파트 1 - 4회차
- 11월 17일 DeepBio:파트 1 - 3회차
- 11월 10일 DeepBio:파트 1 - 2회차
- 장소: 토즈 신촌본점 ( http://www.toz.co.kr/branch/main/index.htm?id=5 )
- 매주 화요일, 저녁 7시 30분~10시
- 시작: 2015년11월 3일
seq. | 날짜 | 내용 | 후기 |
---|---|---|---|
1 | 2015/11/03 | 오리엔테이션( 김무성 ) | [남광우님] (https://www.facebook.com/groups/biospin/permalink/770735179703033/) |
(가상머신)우분투 OS에서 BioPython과 Theano 설치 ( 지용기) | 먹방사진 | ||
(Docker)Mac에서 BioPython과 Theano 설치 (박세진) | |||
2 | 2015/11/10 | (파이션 기초) 2장 변수,표현식,문장 와 3장 조건부실행 (안효준) | 김강용님 |
연습문제풀이 | |||
(Theano) Theano 기초 - NumPy refresher과 Baby Steps - Algebra(박세진) | 김가경님 | ||
3 | 2015/11/17 | (파이션 기초) 4장 함수, 5장, 6장 문자열(이찬희), 7장 파일(조익연) | |
5장연습문제 6장연습문제 7장연습문제 | |||
(Theano) Theano 기초 - More Examples(안효준) | 김가경님 | ||
4 | 2015/11/24 | (파이션 기초) 8장 리스트 와 9장 딕셔너리 (김미송), [10장 튜플(성민경) ] (https://github.com/biospin/DeepBio/blob/master/part01/Week1_151117/chap10_Tuple_study.ipynb) | 뒷풀이 |
9장 연습문제 | 김가경님 | ||
(Theano) Theano 기초 - Graph Structures과 Printing/Drawing Theano graphs(최홍용) | |||
(보강) Theano 기초 - More Examples(지용기) |
seq. | 날 짜 | 내용 | 후기 |
---|---|---|---|
1 | 2015/12/01 | (파이션 기초) 11장 정규표현식, 12장 네트워크 프로그램과 13장 웹서비스(김슬기) | 후기&뒷풀이 |
[11장 연습문제] (https://github.com/biospin/DeepBio/blob/master/part02/Week1_151201/11%EC%9E%A5%EC%97%B0%EC%8A%B5%EB%AC%B8%EC%A0%9C.ipynb) | |||
(Theano) Theano 기초 - Derivatives in Theano (박혜진) | |||
2 | 2015/12/08 | (파이션 기초) 14장 데이터베이스와 SQL, Relational Databases, 15장 데이터 시각화와 16장 (이승현) | 후기 |
(Theano) Theano 기초 - Configuration Settings and Compiling Modes 와 Loading and Saving(성민경) | |||
3 | 2015/12/15 | (bioPython ) 1장: Python and the Surrounding Software Ecology, Interface R, R Magic (김가경) | |
(Theano) Theano 기초 - Conditions과 Loop, inotebook (조강익) | |||
(특강)우분투에 CUDA 설치 (지용기) | |||
4 | 2015/12/29 | (bioPython ) 2장: Next-generation Sequencing (김가경) | 후기 |
(Theano) Theano 기초 - Sparse 과 Using the GPU (문명진) | |||
(논문리뷰) Assessing the clinical utility of cancer genomic and proteomic data across tumor types, 논문코드 실습(성민경) |
seq. | 날 짜 | 내용 | 후기 |
---|---|---|---|
1 | 2016/01/05 | (bioPython ) 3장: Working with Genomes (박혜진) | 후기 |
(Theano) Deeplearning - 3장 GETTING STARTED, 4장 Classifying MNIST digits using Logistic Regression (이승우) | |||
2 | 2016/01/12 | (bioPython ) 4장: Population Genetics (성민경) | 후기 |
(보강) 회귀분석 기초 (김가경) | |||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - 암환자 RNA 정보 획득방법 및 Data 구조파악 | |||
3 | 2016/01/19 | (bioPython ) 5장: Population Genetics Simulation (이승현) | 후기 |
(Theano) 5장 Multilayer Perceptron 이론 (박혜진) | |||
(Theano) 5장 Multilayer Perceptron 코드설명 및 실습 | |||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - Data 전처리(지용기) | |||
4 | 2016/01/26 | (bioPython ) 6장: Phylogenetics (류재면) | 후기 |
(Theano) 6장 Convolutional Neural Networks (LeNet) 이론1, CNN 이론2(황성원) | |||
(Theano) 6장 Convolutional Neural Networks (LeNet) 코드설명 및 실습 | |||
(보강) Tensor (황성원) | |||
(보강) Tensor 참고자료 | |||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - 회귀모형을 활용한 모형 개발(박혜진) |
seq. | 날 짜 | 내용 |
---|---|---|
1 | 2016/02/02 | (bioPython) 7장: Using the Protein Data Bank(박혜진) |
(Theano) 7장 Denoising Autoencoders (dA) 이론(지용기) | ||
(Theano) 7장 Denoising Autoencoders (dA) 코드설명 및 실습 | ||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - Multilayer Perceptron을 활용한 모형 개발 (1)(박혜진) | ||
2 | 2016/02/16 | (bioPython)8장: Other Topics in Bioinformatics |
(Theano) 8장 Stacked Denoising Autoencoders (SdA) 이론(김가경) | ||
(Theano) 8장 Stacked Denoising Autoencoders (SdA) 코드설명 및 실습 | ||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - Multilayer Perceptron을 활용한 모형 개발 (2)(박혜진) | ||
3 | 2016/02/23 | (Theano) 9장 Restricted Boltzmann Machines (RBM) 이론(황성원) |
(Theano) 10장 Deep Belief Networks 실습 (성민경) | ||
(실습) 암 환자 RNA정보를 활용한 암 예측 모델 개발 - DBN을 활용한 모형 개발 (2)(성민경) |