Detectar valor extremo vector C ++ [cerrado] -- ++ campo con vector campo con standard-deviation camp Relacionados El problema

Detect extreme value vector C++ [closed]


0
vote

problema

Español
cerrado . Esta pregunta necesita detalles o claridad . Actualmente no está aceptando respuestas.

¿Quieres mejorar esta pregunta? Agregar detalles y aclarar el problema por Edición de este post .

cerrado hace 3 años .

Mejorar esta pregunta

Tengo un vector de valores (retrasos) como este {2,4,6,3,4,5,6,4, ..} en C ++. Mi objetivo es detectar cuando un nuevo valor es un valor extremo, por ejemplo, 96. Estoy tratando de crear una verificación general para detectar en lugar de poner cheques numéricos específicos.

por valor extremo Me refiero a que 96 sería x veces mayor que 2 o 3 o 4. Sin embargo, si tengo retrasos como {15,23,10,26, ...} y luego un valor 550, que es Y veces Más grande de lo normal: quiero detectar.

Necesito comenzar con la desviación estándar, pero no estoy seguro del mejor enfoque adicional.

gracias.

Original en ingles

I have a vector of values (delays) like this {2,4,6,3,4,5,6,4,..} in C++. My objective is to detect when a new value is an extreme value - for example, 96. I am trying to come up with a general check to detect instead of putting specific numerical checks.

By extreme value I mean 96 would be X times larger than 2 or 3 or 4. However, if I have delays as {15,23,10,26,..} and then a value 550, which is Y times larger than normal - I want to detect.

I need to start with the standard deviation, but not sure about the best approach further.

Thank you.

        
         
         

Lista de respuestas

3
 
vote
vote
La mejor respuesta
 

En ausencia de cualquier otra información estadística, calcule la media y la desviación estándar de la media de la media de sus datos existentes, y si el nuevo punto es más de 3 Las desviaciones estándar de la media fuera que significan, entonces no lo agregan.

Después de tener un cierto número de puntos para que pueda estar razonablemente seguro de que el límite central del teorema ha comenzado a trabajar su magia (20 puntos como regla general, especialmente como "retrasos" implica "Poisson" a primera vista) , desarrolle un algoritmo para eliminar los valores atípicos que puedan haberse agregado al conjunto inicial. Haz eso al considerar cada punto agregado a su vez, elimínelo, y vea que coincida con los criterios de inclusión. Este paso es importante: está diseñado para fallar un valor atípico que se ha introducido temprano; p.ej. {2, 96, 4, 6, 3, 4, 5}. Para obtener datos realmente hostiles, es posible que deba aumentar la dimensionalidad de ese algoritmo.

Esta es una ciencia complicada: tendrá que calibrar esto para satisfacer sus necesidades, pero lo que sugiero, te ayudará a comenzar.

 

In the absence of any other statistical information, compute the mean and the standard deviation of the mean of your existing data, and if the new point is more than 3 standard deviations of the mean outside that mean, then don't add it.

After you have a certain number of points so you can be reasonably sure that the central limit theorem has started to work its magic (20 points as a rule of thumb, especially as "delays" implies "Poisson" on first glance), develop an algorithm to eliminate any outliers that might have been added to the initial set. Do that by considering each added point in turn - eliminate it, and see it matches the criteria for inclusion. This step is important: it's designed to fail an outlier that's introduced early; e.g. {2, 96, 4, 6, 3, 4, 5}. For really hostile data you might need to increase the dimensionality of that algorithm.

This is a tricky science - you'll have to calibrate this to suit your requirements but what I suggest will get you started.

 
 

Relacionados problema

108  Desviación estándar de una lista  ( Standard deviation of a list ) 
Quiero encontrar la desviación media y estándar de 1º, 2º, ... dígitos de varias listas (Z). Por ejemplo, tengo comments0 Ahora quiero tomar la media y ...

0  Estadísticas de mesa de frecuencia GNUPLOT  ( Gnuplot frequency table stats ) 
Tengo una tabla de frecuencia de datos y me gustaría calcular su media y desviación estándar. La primera columna simboliza la frecuencia y el segundo: el valo...

1  ¿Hay una función R para encontrar valores P y desviación estándar para modelos de mezcla finita?  ( Is there an r function to find p values and standard deviation for finite mixtur ) 
Tengo una pregunta sobre cómo encontrar valores p y desviaciones estándar en R para modelos de mezcla finitos. He usado el paquete de Mixtools (Logisregmixem)...

13  Haskell - Error promedio de punto flotante usando QuickCheck  ( Haskell average floating point error using quickcheck ) 
Estoy usando QuickCheck-2.5.1.1 para hacer qa. Estoy probando dos funciones puras gold :: a -> Float y f :: a -> Float , donde a instancias arbitrary. ...

19  Utilizando desviaciones estándar en GenMatch para fomentar más pares  ( Using standard deviations in genmatch to encourage more pairs ) 
Siguiendo el ejemplo desde el paquete coincidente y, en particular, el ejemplo GenMatch. Esto continúa a partir de una pregunta anterior enlace a r paque...

5  Combine los cuadros de datos para los medios y la SD en un refrigerador de datos con SD entre paréntesis después de la media  ( Combine dataframes for means and sds into one dataframe with sd in brackets aft ) 
Me gustaría crear un marco de datos con varias columnas diferentes que contengan medios, después de lo cual se muestra el SD entre paréntesis. Para dar un eje...

0  Resultados extraños con Var y STDEV  ( Strange results with var and stdev ) 
este SELECT AVG(s.Amount/100)[Avg], STDEV(s.Amount/100) [StDev], VAR(s.Amount/100) [Var] devuelve esto: Avg StDev Var 133 550.82021581146...

0  R: Estandarizar usando funciones media y SD  ( R standardize using mean and sd functions ) 
Estoy tratando de hacer una transformación simple. He usado el siguiente código y funcionó bien: data_stdz <- transform(data_header, z.v1 = v1+2) Pero,...

0  SQL Server 2012: desviación estándar de filas por persona  ( Sql server 2012 standard deviation of rows per person ) 
Tengo tabla self.posterImageview9 : func animatePoster (imageArray: [UIImage], count: Int = 0) { UIView.transitionWithView ( ...

4  Milagro de desviación estándar de PANDAS  ( Pandas standard deviation miracle ) 
Aquí está mi código: import pandas as pd df = pd.DataFrame({'Test': [861166021755746, 861166021755746, 861166021755746]}) print(df.describe()) Aquí est...




© 2022 respuesta.top Reservados todos los derechos. Centro de preguntas y respuestas reservados todos los derechos