Grupos de trazado que usan K-Media con la distancia de centroide -- r campo con cluster-analysis campo con k-means camp Relacionados El problema

Plotting clusters using k-means with distance from centroid


2
vote

problema

Español

Estoy tratando de crear una parcela similar a esta:

ingrese la descripción de la imagen aquí

Aquí hay tres grupos y todos los puntos de datos (círculos) se representan de acuerdo con su distancia euclidiana del centroide. Usando esta imagen es fácil de ver que 5 muestras de la clase 2 terminaron en grupos incorrectos.

Estoy ejecutando k-significa usar kmeans y no puedo averiguar cómo trazar este tipo de gráfico.

Por ejemplo, podemos usar el conjunto de datos del iris.

  > iri <- iris > cl <- kmeans (iri[, 1:4], 3) > cl K-means clustering with 3 clusters of sizes 38, 62, 50  Cluster means:   Sepal.Length Sepal.Width Petal.Length Petal.Width 1     6.850000    3.073684     5.742105    2.071053 2     5.901613    2.748387     4.393548    1.433871 3     5.006000    3.428000     1.462000    0.246000  Clustering vector:   [1] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3  [40] 3 3 3 3 3 3 3 3 3 3 3 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1  [79] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 1 1 1 2 1 1 1 1 1 1 2 2 1 1 [118] 1 1 2 1 2 1 2 1 1 2 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 1 2 1 1 2  Within cluster sum of squares by cluster: [1] 23.87947 39.82097 15.15100  (between_SS / total_SS =  88.4 %)  Available components:  [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss" [6] "betweenss"    "size"         "iter"         "ifault"         

Fuente para la imagen: https://github.com/michaelwsherman/winecluster El originador no 'T parece que está usando kmeans .

Sospecho que esto podría no ser factible usando kmeans para él no proporciona distancia desde el centroide. ¿Hay otra forma de mostrar datos de esta manera o algo similar?

Original en ingles

I am trying to create a plot similar to this:

enter image description here

Here there are three clusters and all the datapoints (circles) are plotted according to their euclidean distance from the centroid. Using this image its easy to see that 5 samples from class 2 ended up in wrong clusters.

I'm running k-means using kmeans and can't figure out how to plot this type of graph.

For example purposes we can use the iris dataset.

> iri <- iris > cl <- kmeans (iri[, 1:4], 3) > cl K-means clustering with 3 clusters of sizes 38, 62, 50  Cluster means:   Sepal.Length Sepal.Width Petal.Length Petal.Width 1     6.850000    3.073684     5.742105    2.071053 2     5.901613    2.748387     4.393548    1.433871 3     5.006000    3.428000     1.462000    0.246000  Clustering vector:   [1] 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3  [40] 3 3 3 3 3 3 3 3 3 3 3 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1  [79] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 1 1 1 1 2 1 1 1 1 1 1 2 2 1 1 [118] 1 1 2 1 2 1 2 1 1 2 2 1 1 1 1 1 2 1 1 1 1 2 1 1 1 2 1 1 1 2 1 1 2  Within cluster sum of squares by cluster: [1] 23.87947 39.82097 15.15100  (between_SS / total_SS =  88.4 %)  Available components:  [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss" [6] "betweenss"    "size"         "iter"         "ifault"       

Source for the image: https://github.com/michaelwsherman/winecluster The originator doesn't seem to be using kmeans though.

I suspect this might not be doable using kmeans for it does not provide distance from centroid. Is there another way to show data in this way or something similar?

        

Lista de respuestas


Relacionados problema

1  Agitán K-significa agrupación, datos idénticos en dos grupos. Pitón  ( Uneven k means clustering identical data in two clusters python ) 
Soy nuevo en el aprendizaje automático y quiero ayuda en la agrupación de texto. Por favor, sugiera cambios en el código si se siente. Mi declaración de pro...

1  ¿Puede Apache K significa un aumento de WSSSE con algunos k?  ( Can apache k means wssse increase with some k ) 
Estoy tratando de ver si hay un punto en el "gráfico de codo" que me ayudaría a elegir k en k significa algoritmo Sin embargo, noté que el WSSSE a veces aum...

0  Convertir datos de datos a vector. Dense por K-Meal  ( Converting dataframe to vector dense for k mean ) 
Siguiendo la respuesta a esta pregunta Cómo convertir el tipo fila en vector Alimentar a los KMEANS He creado la tabla de características para mis datos. ...

-3  K-significa múltiples dimensiones c #  ( K means multiple dimensions c sharp ) 
Me gustaría preguntar si alguien podría darme una referencia ¿Cómo implementar K-significa con múltiples dimensiones en C #? He seguido el tutorial para 2 d...

0  k-significa y minibatchkmean en Python está fuera de memoria  ( K means and minibatchkmean in python is out of memory ) 
Estoy usando Sklearn.Cluster "KMEAN" con Python. Estoy tratando de agrupar datos y trazar gráficos para vectores (Tamaño = 109977) Aquí está mi código: mod...

2  ¿Cómo calcular la suma total del error al cuadrado en la MATLAB CRUSTING DE MIENDA K?  ( How to compute the total sum of squared error in k mean clustering matlab ) 
Estoy implementando el algoritmo K-significa para dados datos 4-dimensionales con k = # del clúster y estoy ejecutando aproximadamente 5 veces con diferentes ...

0  KMEANS CLUSTING CON DATOS DE ETIQUETAS  ( Kmeans clustering with labels data ) 
Tengo una imagen RGB de forma (587, 987, 3). #hight, ancho, num_channels También tengo datos de etiqueta (ubicaciones de píxeles) para cada una de las 7 cla...

0  Errores de agrupamiento inesperados (partición alrededor de los médicos)  ( Unexpected clustering errors partitioning around mediods ) 
Estoy usando el paquete fpc para determinar el número óptimo de clusters. La función pamk() toma una matriz de disimilitud como argumento y no requiere qu...

2  Mal k-significa con descenso de degradado usando TensorFlow  ( Bad k means with gradient descent using tensorflow ) 
Actualmente aprendiendo TensorFlow Estoy trabajando para implementar Rimeans en clústering usando TensorFlow. Estoy siguiendo un tutorial en TensorFlow, que ...

48  Python k-significa algoritmo  ( Python k means algorithm ) 
Estoy buscando la implementación de Python de k-significa algoritmo con ejemplos para agrupar y cachear mi base de datos de coordenadas. ...




© 2022 respuesta.top Reservados todos los derechos. Centro de preguntas y respuestas reservados todos los derechos