Validación de la Retención
Ahora que hemos dividido nuestro conjunto de datos en 2 marcos de datos (dataframes), vamos a:
- Entrenar un modelo de k-nearest neighbors en la primera mitad
- Probar este modelo en la segunda mitad
- Entrenar un modelo de k-nearest neighbors en lsegunda mitad
- Probar este modelo en la segunda mitad
Instrucciones
-
Entrenar un modelo de k-nearest neighbors model utilizando el algoritmo por defecto (auto) y utilizar el numero por defecto (5) que:
- Utilize la columna de accommodates de train_one para entrenamiento
- Pruebe en test_one
- Asigna el valor de RMSE resultante a iteration_one_rmse
-
Entrenar un modelo de k-nearest neighbors model utilizando el algoritmo por defecto (auto) y utilizar el numero por defecto (5) que:
- Utilize la columna de accommodates de train_two para entrenamiento
- Pruebe en test_two
- Asigna el valor de RMSE resultante a iteration_two_rmse
- Utiliza numpy.mean() para calcular la media de los 2 valores de RMSE y la asigna a avg_rmse
Soluciones
 |
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_squared_error
train_one = split_one
test_one = split_two
train_two = split_two
test_two = split_one
#First half
model = KNeighborsRegressor()
model.fit(train_one[ ["acconmodates"]],
train_one["price"])
test_one["predicted_price"] =
model .predict(test_one[["accommodates"]])
iteration_one_rmse =
mean_squared_error(test_one["price"],
test_one["predicted_price"])**(1/2)
#Second half
model.fit(train_two[["accommodates"]],
train_two("price"])
test_two["predicted_price
model.predict(test_two[["acconmodates"]])
iteration_two_rmse =
mean_squared_error (test_two["
test_two["predicted_price"])**(1/2)
avg_rmse = np.mean([iteration_two_rmse,
iteration_one_rmse])
|
Última modificación: miércoles, 27 de abril de 2022, 23:49