Saltar al contenido principal
Página

Tema 2.4 - Distancia Euclidiana

Distancia Euclidiana

La métrica de similitud funciona comparando un conjunto fijo de características numéricas (otra palabra para atributos) entre dos observaciones, o espacios vitales en nuestro caso, cuando se trata de predecir un valor continuo, como el precio, la principal métrica de similitud es la distancia euclidiana, esta es la fórmula general de la distancia euclidiana:


Donde q1 a qn representan los valores de las características de una observación y p1 a pn representan los valores de las características de la otra observación, a continuación se muestra un diagrama que desglosa la distancia euclidiana entre las dos primeras observaciones del conjunto de datos utilizando únicamente las columnas host_listing_count, accommodates, bedrooms, bathrooms y bed.



En esta lección, utilizaremos solo una característica para mantener las cosas simples mientras se familiariza con el flujo de trabajo del aprendizaje automático, dado que solo estamos utilizando una característica, este caso se denomina caso univariante. La fórmula para el caso univariante es:


La raíz cuadrada y la potencia al cuadrado se cancelan, y la fórmula se simplifica a:



La vivienda que queremos alquilar tiene capacidad para tres personas. En primer lugar, calculemos la distancia entre la primera vivienda del conjunto de datos y la nuestra, utilizando únicamente la función de accommodates.

Instrucciones

  1. Calcule la distancia euclidiana entre nuestro espacio vital, que tiene capacidad para tres personas, y el primer espacio vital del DataFrame dc_listings 
  2. Asigna el resultado a first_distance y muestra el valor con la función print


Soluciones


1
2
3

4

5
import numpy as np
our_acc_value = 3
first_living_space_value = dc_listings.iloc[0]
["accommodates']
first_distance = np.abs(first_living_space_value -
our_acc_value)
print(first_distance)
Última modificación: miércoles, 27 de abril de 2022, 14:31