기계학습 간단한 개념
기계학습
지도학습(supervised learning) : 독립변수와 종속변수 쌍으로 된 데이터가 주어질 때 새로운 데이터에 대한 문제를 풀 수 있는 함수를 찾는 것.
ex)분류 모형, 예측모형
비지도학습(unsupervised learning) : 종속변수가 없는 데이터들로부터 패턴을 추출하는 것
군집분석
강화학습(reinforcement learning) : 문제에 대한 직접적인 답을 주지 않고 경험을 통해 기대값이 최대가 되는 것을 찾는 학습.
마리오게임 딥러닝, 알파고 딥러닝
반지도학습(semi-supervised learning) : 지도학습과 비지도학습을 같이 사용하는 ㄱ
전이학습(transper learning) : 딥러닝을 feature 추출로만 사용하고 추출된 피처를 통해 다른 모델을 학습하는 방법.
학습이란? : 데이터를 잘 반영하는 모형을 찾는 것. 즉 parameter를 결정하는 것.
> 과적합이 문제가 되는 이유 : 데이터는 오차를 가지고 있기 때문에 실제 데이터에서 성능이 안좋아지는 문제가 생긴다.
'머신러닝' 카테고리의 다른 글
정형데이터마이닝 - 비지도학습 (0) | 2019.07.04 |
---|---|
데이터마이닝 개요와 R 기초 사용법 (0) | 2019.07.04 |
catboost (0) | 2019.06.21 |
Recommendation System (0) | 2019.06.10 |
randomForest 알고리즘 (0) | 2019.04.10 |
자신에게 맞게 R 최적화를 해보자.
R의 시동파일 위치
1. R HOME
2. R profile
3. R environ
R은 세션 당 하나의 R profile과 R environ을 사용한다.
R HOME
R_HOME은 R이 설치된 디렉터리로 R.home()이나 Sys.getenv('HOME')을 활용하여 확인 할 수 있다.
Rprofile
Rprofile은 특정 프로젝트 실행시 바로 로딩되는 스크립트를 만들고 싶을 때 사용하므로, 프로젝트 만드는 걸 할 줄 모르는 사람을 위해 간단히 프로젝트 만드는 방법을 나타냈다.
아래 그림에서 Console 글 위에 왼쪽 2번째 파란색 육면체를 클릭한다.
클릭하면 New Project 창이 열리는데 New Directory를 눌러준다.
그런 다음 New Project를 눌러 준다.
directory name 에 원하는 프로젝트 이름을 넣어준 후 Browse... 을 눌러 프로젝트가 저장될 경로를 설정한다.
생성되면 아래와 같이 창이 뜬다.
앞서 특정 프로젝트에서 시동 시 로딩되는 스크립트를 만들고 싶으면 .Rprofile을 디렉토리에 생성하여 R 코드를 추가하면 된다고 하였다.
file.edit('~/.Rprofile')을 사용하면 된다.
코드를 실행하면 아래와 같은 창이 열린다.
test를 위해 아래같이 코드를 저장 하였다.
프로젝트를 다시 실행하면 아래와 같이 메세지가 나타난다.(Ctrl+Shift+F10 사용)
프로젝트의 환경변수 또한 수정할 수 있다.
user_renviron=path.expand(file.path('~','.Renviron'))
file.edit(user_reviron)
>꺽쇄나 + 가 불편하다면 아래와 같이 옵션을 수정하여 제거 가능하다.
options에서
diGits로 표시되는 숫자의 자리수 변경
show.signif.stars로 p-value의 유의미를 나타내는 * 표시 유무
stringsAsFactors=F 등을 설정 가능 하다.
이밖에는 ?options 를 사용하여 확인하자.
효율적인 R 프로그래밍 책을 참고하였다.
'R' 카테고리의 다른 글
apply 와 sapply의 차이 (0) | 2019.07.15 |
---|---|
문자열 다루기와 텍스트 마이닝 (0) | 2019.07.07 |
R Cloud 사용하기 (0) | 2019.06.21 |
GET 과 POST(rvest) (0) | 2019.06.10 |
텍스트마이닝(사회관계망, 워드클라우드) (0) | 2019.06.06 |
R Cloud 사용하기
요즘 여러가지 장점들로 클라우드 서비스가 대세를 이루고 있다. 그에 따라 python에서 코랩을 제공하듯, 코랩 처럼 R 또한 클라우드 서비스를 제공한다.
위 링크를 따라 들어가면 R Studio Cloud 에 들어가진다. 로그인을 하자.
로그인을 하면 아래와 같은 창이 나타나는데 여기서 Project를 생성할 수 있다.
New Project를 클릭하여 새로운 프로젝트를 생성해보자.
클라우드 서비스는 웹 서비스이므로 일반 R과 데이터를 불러오는 면에서 차이가 있다.
R Cloud 간단히 Upload를 통해 사용 가능하게 제공되고 있다.
파일은 위 그림에서 보이는 Upload를 활용하여 올릴 수 있다.
또한 클라우드 서비스의 장점은 협업이라 할 수 있는데 Workspace를 여러 명이서 사용 가능하다.
이는 Your Workspace의 왼쪽편을 누르면 목차가 열리는데 test를 클릭하면 멤버를 추가할 수 있다.
'R' 카테고리의 다른 글
문자열 다루기와 텍스트 마이닝 (0) | 2019.07.07 |
---|---|
자신에게 맞게 R 최적화를 해보자. (0) | 2019.06.21 |
GET 과 POST(rvest) (0) | 2019.06.10 |
텍스트마이닝(사회관계망, 워드클라우드) (0) | 2019.06.06 |
leaflet 지도그리기 (0) | 2019.04.09 |
'머신러닝' 카테고리의 다른 글
정형데이터마이닝 - 비지도학습 (0) | 2019.07.04 |
---|---|
데이터마이닝 개요와 R 기초 사용법 (0) | 2019.07.04 |
기계학습 간단한 개념 (0) | 2019.06.27 |
Recommendation System (0) | 2019.06.10 |
randomForest 알고리즘 (0) | 2019.04.10 |
CNN channel 1개와 3개의 성능비교(cats and dogs)
간단하게 성능 비교를 해보자. (1)은 channel을 1개로 두고 CNN을 한경우이며 배치의 크기가 30이고 (2)은 channel을 3개로 두고 CNN을 한 경우이며 배치 크기가 50이라는 점에서 차이가 있다. 우선 배치크기가 서로 다르니 명확하게 비교하는게 맞지는 않을지도 모른다는 점을 언급하고 넘어가겠다.
예측 성능 비교에서 validation loss와 정확도 측면에서 channel이 한개 일 때는 다소 진동하는것이 보이고 있다.
'딥러닝' 카테고리의 다른 글
전이학습(Transfer Learning) (0) | 2021.05.25 |
---|---|
기울기 소실 문제와 ResNet (0) | 2021.05.25 |
순환신경망(1/3) (0) | 2021.04.11 |
tensorboard 외부접속 (0) | 2020.11.27 |
GPU 메모리 조절 방법 (0) | 2019.11.19 |
Recommendation System
'머신러닝' 카테고리의 다른 글
정형데이터마이닝 - 비지도학습 (0) | 2019.07.04 |
---|---|
데이터마이닝 개요와 R 기초 사용법 (0) | 2019.07.04 |
기계학습 간단한 개념 (0) | 2019.06.27 |
catboost (0) | 2019.06.21 |
randomForest 알고리즘 (0) | 2019.04.10 |