Saltar al contenido principal
Página

Tema 4.9 - Utilización de más Funciones

Utilización de más Funciones

Aquí hay una tabla que compara los valores de MSE y RMSE para los 2 modelos univariantes de la última misión y el modelo multivariante que acabamos de entrenar:


Como puedes ver, el modelo que entrenamos utilizando ambas características acabó funcionando mejor (menor puntuación de error) que cualquiera de los modelos univariantes de la última misión, ahora vamos a entrenar un modelo utilizando las siguientes 4 características:

  • accommodates
  • bedrooms
  • bathrooms
  • number_of_reviews

Scikit-learn hace que sea increíblemente fácil intercambiar las columnas utilizadas durante el entrenamiento y las pruebas, vamos a dejar esto como un reto para entrenar y probar un modelo "k-nearest neighbors" utilizando estas columnas en su lugar, utiliza el código que escribiste en la última pantalla como guía.


Instrucciones

  • Cree una nueva instancia de la clase KNeighborsRegressor class con los siguientes parámetros:
    1. n_neighbors: 5
    2. algorithm: brute

  • Ajuste un modelo que utilice las siguientes columnas de nuestro conjunto de entrenamiento (train_ df):
    1. Accommodates
    2. Bedrooms
    3. Bathrooms
    4. number_of_reviews
        • Use el modelo para hacer predicciones en el conjunto de prueba (test_df) utilizando las mismas columnas. Asignar la matriz NumPy de predicciones a four_predictions
        • Use la función mean_squared_error() para calcular el valor MSE de estas predicciones comparando four_predictions con la columna de price de test_df, asigne el valor MSE calculado a four_mse
        • Calcular el valor del RMSE y asignarlo a four_rmse
        • Mostrar four_mse y four_rmse mediante la función de impresión


        Soluciones


         1
         2
         3
         4
         5
         6
         7
         8
         9
        10
        11
        12
        features = ['accommodates', 'bedrooms', 'bathrooms',
        'number_of_reviews']
        from sklearn.neighbors import KNeighborsRegressor
        
        knn = KNeighborsRegressor (n_neighbors=5, algorithm='brute')
        knn.fit(train_df [features], train_df['price'])
        
        four_predictions = knn.predict(test_df[features])
        four_mse = mean_squared_error(test_df['price'], four_predictions)
        four_rmse = four_mse ** (1/2)
        print(four_mse)
        print(four_rmse)
        
        Última modificación: miércoles, 27 de abril de 2022, 23:19