Saltar al contenido principal
Página

Tema 2.5 - Calcular la distancia para todas las observaciones

La distancia euclidiana entre la primera fila del DataFrame dc_listings y nuestro propio espacio vital es 1.

¿Cómo sabemos si esto es alto o bajo? Si nos fijamos en la propia ecuación de la distancia euclidiana, el valor más bajo que podemos alcanzar es 0, esto sucede cuando el valor de la característica es exactamente el mismo para las dos observaciones que estamos comparando, si p1=q1, entonces d=|q1-p1|, lo que da como resultado d=0, cuanto más se acerque a 0 la distancia, más similares son los espacios vitales.

Si queremos calcular la distancia euclidiana entre cada espacio habitable del conjunto de datos y un espacio habitable con capacidad para 8 personas, he aquí una vista previa de cómo sería.


A continuación, podemos clasificar los espacios de vida existentes por valores de distancia ascendentes, el sustituto de la similitud.


Instrucciones

  1. Calcule la distancia entre cada valor de la columna de accommodates de dc_listings y el valor 3, que es el número de personas que aloja nuestro listado:
    • Utiliza el método apply para calcular el valor absoluto entre cada valor de los accommodates y 3, y devuelve una nueva Serie que contiene los valores de la distancia
  2. Asignar los valores de la distancia a la columna de la distancia 
  3. Utilice el método de la serie value_counts y la función de print para mostrar los recuentos de valores únicos para la columna de la distancia


Soluciones


1
2

3
4
5
new_listing = 3
dc_listings['distance'] =
dc_listings['accommodates'].apply(
lambda x: np.abs(x - new_listing)
)
print(dc_listings['distance'].value_counts())
Última modificación: miércoles, 27 de abril de 2022, 14:43