Saltar al contenido principal
Página

Tema 4.3 - Manejo de los Valores Perdidos

Manejo de los Valores Perdidos

De las columnas restantes, 3 tienen algunos valores perdidos (menos del 1% del número total de filas):

  • bedrooms
  • bathrooms
  • beds

Como el número de filas que contienen valores perdidos para una de estas 3 columnas es bajo, podemos seleccionar y eliminar esas filas sin perder mucha información. También hay 2 columnas que tienen un gran número de valores perdidos:

  • cleaning_fee - 37.3% de las columnas
  • security_deposit - 61.7% de las filas

Y no podemos manejarlos fácilmente. No podemos simplemente eliminar las filas que contienen valores perdidos para estas 2 columnas porque perderíamos la mayoría de las observaciones en el conjunto de datos. En lugar de ello, vamos a eliminar estas dos columnas por completo.


Instrucciones

  • Elimine las columnas cleaning_fee y security_deposit de dc_listings
  • A continuación, elimine de dc_listings todas las filas que contengan un valor ausente para la columnas bedrooms, bathrooms o beds
    1. Para ello, utilice el Dataframe method dropna() del y establezca el parámetro del eje en 0
    2. Dado que sólo columnas bedrooms, bathrooms y beds contienen valores perdidos, se eliminarán las filas que contengan valores perdidos en estas columnas
  • Muestre los recuentos de valores nulos para el Dataframe dc_listings actualizado para confirmar que no quedan valores perdidos


Soluciones


1
2
3
4
dc_listings = dc_listings.drop(['cleaning_fee',
'security_deposit'], axis=1)
dc_listings = dc_listings.dropna(axis=0)
print(dc_listings.isnull().sum())
Última modificación: miércoles, 27 de abril de 2022, 18:11