Manejo de los Valores Perdidos
De las columnas restantes, 3 tienen algunos valores perdidos (menos del 1% del número total de filas):
Como el número de filas que contienen valores perdidos para una de estas 3 columnas es bajo, podemos seleccionar y eliminar esas filas sin perder mucha información. También hay 2 columnas que tienen un gran número de valores perdidos:
-
cleaning_fee - 37.3% de las columnas
-
security_deposit - 61.7% de las filas
Y no podemos manejarlos fácilmente. No podemos simplemente eliminar las filas que contienen valores perdidos para estas 2 columnas porque perderíamos la mayoría de las observaciones en el conjunto de datos. En lugar de ello, vamos a eliminar estas dos
columnas por completo.
Instrucciones
-
Elimine las columnas cleaning_fee y security_deposit de dc_listings
-
A continuación, elimine de dc_listings todas las filas que contengan un valor ausente para la columnas bedrooms, bathrooms o beds
- Para ello, utilice el Dataframe method dropna() del y establezca el parámetro del eje en 0
- Dado que sólo columnas bedrooms, bathrooms y beds contienen valores perdidos, se eliminarán las filas que contengan valores perdidos en estas columnas
-
Muestre los recuentos de valores nulos para el Dataframe dc_listings actualizado para confirmar que no quedan valores perdidos
Soluciones
|

|
1
2
3
4
|
dc_listings = dc_listings.drop(['cleaning_fee',
'security_deposit'], axis=1)
dc_listings = dc_listings.dropna(axis=0)
print(dc_listings.isnull().sum())
|
|
Última modificación: miércoles, 27 de abril de 2022, 18:11