data analysis & visualization



기계학습


지도학습(supervised learning) : 독립변수와 종속변수 쌍으로 된 데이터가 주어질 때 새로운 데이터에 대한 문제를 풀 수 있는 함수를 찾는 것.


ex)분류 모형, 예측모형


비지도학습(unsupervised learning) : 종속변수가 없는 데이터들로부터 패턴을 추출하는 것


군집분석


강화학습(reinforcement learning) : 문제에 대한 직접적인 답을 주지 않고 경험을 통해 기대값이 최대가 되는 것을 찾는 학습.


마리오게임 딥러닝, 알파고 딥러닝


반지도학습(semi-supervised learning) : 지도학습과 비지도학습을 같이 사용하는 ㄱ


전이학습(transper learning) : 딥러닝을 feature 추출로만 사용하고 추출된 피처를 통해 다른 모델을 학습하는 방법.



학습이란? : 데이터를 잘 반영하는 모형을 찾는 것. 즉 parameter를 결정하는 것.



> 과적합이 문제가 되는 이유 : 데이터는 오차를 가지고 있기 때문에 실제 데이터에서 성능이 안좋아지는 문제가 생긴다.



'머신러닝' 카테고리의 다른 글

정형데이터마이닝 - 비지도학습  (0) 2019.07.04
데이터마이닝 개요와 R 기초 사용법  (0) 2019.07.04
catboost  (0) 2019.06.21
Recommendation System  (0) 2019.06.10
randomForest 알고리즘  (0) 2019.04.10

R의 시동파일 위치


1. R HOME


2. R profile


3. R environ



R은 세션 당 하나의 R profile과 R environ을 사용한다.


R HOME


R_HOME은 R이 설치된 디렉터리로 R.home()이나 Sys.getenv('HOME')을 활용하여 확인 할 수 있다.



Rprofile


Rprofile은 특정 프로젝트 실행시 바로 로딩되는 스크립트를 만들고 싶을 때 사용하므로, 프로젝트 만드는 걸 할 줄 모르는 사람을 위해 간단히 프로젝트 만드는 방법을 나타냈다.


아래 그림에서 Console 글 위에 왼쪽 2번째 파란색 육면체를 클릭한다.



클릭하면 New Project 창이 열리는데 New Directory를 눌러준다.



그런 다음 New Project를 눌러 준다.



directory name 에 원하는 프로젝트 이름을 넣어준 후 Browse... 을 눌러 프로젝트가 저장될 경로를 설정한다.



생성되면 아래와 같이 창이 뜬다.



앞서 특정 프로젝트에서 시동 시 로딩되는 스크립트를 만들고 싶으면 .Rprofile을 디렉토리에 생성하여 R 코드를 추가하면 된다고 하였다.


file.edit('~/.Rprofile')을 사용하면 된다.


코드를 실행하면 아래와 같은 창이 열린다.



test를 위해 아래같이 코드를 저장 하였다.



프로젝트를 다시 실행하면 아래와 같이 메세지가 나타난다.(Ctrl+Shift+F10 사용)






프로젝트의 환경변수 또한 수정할 수 있다.


user_renviron=path.expand(file.path('~','.Renviron'))


file.edit(user_reviron)



>꺽쇄나 + 가 불편하다면 아래와 같이 옵션을 수정하여 제거 가능하다.


options에서

diGits로 표시되는 숫자의 자리수 변경

show.signif.stars로 p-value의 유의미를 나타내는 * 표시 유무

stringsAsFactors=F 등을 설정 가능 하다.


이밖에는 ?options 를 사용하여 확인하자.



효율적인 R 프로그래밍 책을 참고하였다.

'R' 카테고리의 다른 글

apply 와 sapply의 차이  (0) 2019.07.15
문자열 다루기와 텍스트 마이닝  (0) 2019.07.07
R Cloud 사용하기  (0) 2019.06.21
GET 과 POST(rvest)  (0) 2019.06.10
텍스트마이닝(사회관계망, 워드클라우드)  (0) 2019.06.06

R Cloud 사용하기

R2019. 6. 21. 02:15






요즘 여러가지 장점들로 클라우드 서비스가 대세를 이루고 있다. 그에 따라 python에서 코랩을 제공하듯, 코랩 처럼 R 또한 클라우드 서비스를 제공한다. 


웹에서 R 사용하기


위 링크를 따라 들어가면 R Studio Cloud 에 들어가진다. 로그인을 하자.



로그인을 하면 아래와 같은 창이 나타나는데 여기서 Project를 생성할 수 있다.


New Project를 클릭하여 새로운 프로젝트를 생성해보자.



클라우드 서비스는 웹 서비스이므로 일반 R과 데이터를 불러오는 면에서 차이가 있다. 


R Cloud 간단히 Upload를 통해 사용 가능하게 제공되고 있다.




파일은 위 그림에서 보이는  Upload를 활용하여 올릴 수 있다.




또한 클라우드 서비스의 장점은 협업이라 할 수 있는데 Workspace를 여러 명이서 사용 가능하다.


이는 Your Workspace의 왼쪽편을 누르면 목차가 열리는데 test를 클릭하면 멤버를 추가할 수 있다.




'R' 카테고리의 다른 글

문자열 다루기와 텍스트 마이닝  (0) 2019.07.07
자신에게 맞게 R 최적화를 해보자.  (0) 2019.06.21
GET 과 POST(rvest)  (0) 2019.06.10
텍스트마이닝(사회관계망, 워드클라우드)  (0) 2019.06.06
leaflet 지도그리기  (0) 2019.04.09

catboost

머신러닝2019. 6. 21. 01:39
RPubs - catboost example code


'머신러닝' 카테고리의 다른 글

정형데이터마이닝 - 비지도학습  (0) 2019.07.04
데이터마이닝 개요와 R 기초 사용법  (0) 2019.07.04
기계학습 간단한 개념  (0) 2019.06.27
Recommendation System  (0) 2019.06.10
randomForest 알고리즘  (0) 2019.04.10

간단하게 성능 비교를 해보자. (1)은 channel을 1개로 두고 CNN을 한경우이며 배치의 크기가 30이고 (2)은 channel을 3개로 두고 CNN을 한 경우이며 배치 크기가 50이라는 점에서 차이가 있다. 우선 배치크기가 서로 다르니 명확하게 비교하는게 맞지는 않을지도 모른다는 점을 언급하고 넘어가겠다.


RPubs - cats and dogs CNN 1 channel


예측 성능 비교에서 validation loss와 정확도 측면에서 channel이 한개 일 때는 다소 진동하는것이 보이고 있다. 

'딥러닝' 카테고리의 다른 글

전이학습(Transfer Learning)  (0) 2021.05.25
기울기 소실 문제와 ResNet  (0) 2021.05.25
순환신경망(1/3)  (0) 2021.04.11
tensorboard 외부접속  (0) 2020.11.27
GPU 메모리 조절 방법  (0) 2019.11.19

RPubs - recommendation system(1)


'머신러닝' 카테고리의 다른 글

정형데이터마이닝 - 비지도학습  (0) 2019.07.04
데이터마이닝 개요와 R 기초 사용법  (0) 2019.07.04
기계학습 간단한 개념  (0) 2019.06.27
catboost  (0) 2019.06.21
randomForest 알고리즘  (0) 2019.04.10