18일차 - 지도학습 1

    주피터 한글 폰트

    # 사용자 운영체제 확인
    import platform
    platform.system()
    # 운영체제별 한글 폰트 설정
    if platform.system() == 'Darwin': # Mac 환경 폰트 설정
        plt.rc('font', family='AppleGothic')
    elif platform.system() == 'Windows': # Windows 환경 폰트 설정
        plt.rc('font', family='Malgun Gothic')
    
    plt.rc('axes', unicode_minus=False) # 마이너스 폰트 설정
    
    
    # 글씨 선명하게 출력하는 설정
    %config InlineBackend.figure_format = 'retina'

     

     

     


    k-최근접 이웃 회귀

    • 회귀: 끊어지지 않는 애매한 정도의 수준을 의미.
    • ex), 연봉의 높고 낮음.
    mglearn.plots.plot_knn_regression(n_neighbors = 1)

     

     

     

     

    mglearn.plots.plot_knn_regression(n_neighbors = 3)

     

     

     

     

     

     

    KNeighborsRegressor 분석

    첫 모델은 나누기 힘든 데이터셋 (과대적합)

    연관성이 높은 데이터들을 찾아야 함.

     

     

     

     


    선형 모델

    • 입력 특성에 대한 선형 함수를 만들어 예측을 수행.

     

    선형 회귀 모델

    • 모든 데이터를 고려해서 하나의 선을 그려야 함.
    • 모든 데이터가 만족할 수 있는 선을 그려야 함.

     

    • 테스트 세트 점수가 0.66인 것은 정확도가 낮은 결과 -> 보통 80 이상 정도는 되어야 함.
    • 훈련 세트와 테스트 세트의 점수가 매우 비슷하다면

    과소적합 상태.

     

    이 상태에서는 일반화 X -> 데이터 양을 늘려야 함.

     

     

     

     

     

     

    보스턴 주택가격 데이터셋을 활용한 LinearRegression 모델

     

    train data에 너무 적용을 시켜 실제 test data에 적용을 하지 못함.

    과대적합 상태.

     

    일반화를 시켜야 함.

    하지만 Linear 모델은 복잡도를 제어할 수 없음 -> 일반화를 시킬 수 없음.

     

     

     

     


    리지 회귀

    • L2 규제: 모델을 강제로 제한, 너무 다른 데이터들을 덜어내는 과정.

     

    + 리지 회귀 그래프 넣기

     

     

     

     

     


    라소 

    • 이해하기가 좋은 모델이기에 분석을 할 때 사용함.
    • L1 규제는 엄청 강함 -> 다 없애버림...

     

     

     

     

     

     

     


    분류용 선형 모델

    'ABC 부트캠프 > 머신러닝' 카테고리의 다른 글

    20일차 - 지도학습 3  (0) 2023.04.12
    19일차 - 지도학습 2  (1) 2023.04.12
    17일차 - 머신러닝(ML)  (0) 2023.04.11

    댓글