Utilización de más Funciones
Aquí hay una tabla que compara los valores de MSE y RMSE para los 2 modelos univariantes de la última misión y el modelo multivariante que acabamos de entrenar:

Como puedes ver, el modelo que entrenamos utilizando ambas características acabó funcionando mejor (menor puntuación de error) que cualquiera de los modelos univariantes de la última misión, ahora vamos a entrenar un modelo utilizando las siguientes 4
características:
- accommodates
- bedrooms
- bathrooms
- number_of_reviews
Scikit-learn hace que sea increíblemente fácil intercambiar las columnas utilizadas durante el entrenamiento y las pruebas, vamos a dejar esto como un reto para entrenar y probar un modelo "k-nearest neighbors" utilizando estas columnas en su lugar, utiliza
el código que escribiste en la última pantalla como guía.
Instrucciones
- Cree una nueva instancia de la clase KNeighborsRegressor class con los siguientes parámetros:
- n_neighbors: 5
- algorithm: brute
- Ajuste un modelo que utilice las siguientes columnas de nuestro conjunto de entrenamiento (train_ df):
- Accommodates
- Bedrooms
- Bathrooms
- number_of_reviews
- Use el modelo para hacer predicciones en el conjunto de prueba (test_df) utilizando las mismas columnas. Asignar la matriz NumPy de predicciones a four_predictions
- Use la función mean_squared_error() para calcular el valor MSE de estas predicciones comparando four_predictions con la columna de price de test_df, asigne el valor MSE calculado a four_mse
- Calcular el valor del RMSE y asignarlo a four_rmse
- Mostrar four_mse y four_rmse mediante la función de impresión
Soluciones
|

|
1
2
3
4
5
6
7
8
9
10
11
12
|
features = ['accommodates', 'bedrooms', 'bathrooms',
'number_of_reviews']
from sklearn.neighbors import KNeighborsRegressor
knn = KNeighborsRegressor (n_neighbors=5, algorithm='brute')
knn.fit(train_df [features], train_df['price'])
four_predictions = knn.predict(test_df[features])
four_mse = mean_squared_error(test_df['price'], four_predictions)
four_rmse = four_mse ** (1/2)
print(four_mse)
print(four_rmse)
|
|
Última modificación: miércoles, 27 de abril de 2022, 23:19