## Using lm() with just one variable in R

0 ### problema

Español

Tengo algunas estadísticas de béisbol, RBIS por temporada, digamos:

` ` player      s1  s2  s3 Brian_Giles 66  68  70 Joe_Thomas  71  72  71 Robin_Yount 71  69  68 Jim_Jones   66  66  65   ``

y quiero hacer una regresión lineal simple utilizando LM () en estos datos para predecir sus #s RBI en una cuarta temporada. ¿Necesitaría otra variable aquí para crear mi fórmula? ¿Cómo completaría más simplemente esta regresión lineal?

Estoy tratando de trabajar fuera de este tutorial ( http://www.r-bloggers.com/wp-content/uploads/2009/11/simplelInregexample1.txt ), lo que parece que podría necesitar una segunda variable, (soy nueva en regresiones lineales , obviamente) pero no puedo averiguar qué debería ser. ¿La pendiente de una línea mejor en forma para esas tres temporadas de datos?

Original en ingles

I've got some baseball stats, RBIs by season, let's say:

``player      s1  s2  s3 Brian_Giles 66  68  70 Joe_Thomas  71  72  71 Robin_Yount 71  69  68 Jim_Jones   66  66  65 ``

And I want to do a simple linear regression using lm() on this data to predict their RBI #s in a 4th season. Would I need another variable here to create my formula? How would I most simply complete this linear regression?

I'm trying to work off of this tutorial (http://www.r-bloggers.com/wp-content/uploads/2009/11/simpleLinRegExample1.txt), which seems like I might need a second variable, (I'm new to linear regressions, obviously) but I can't figure out what it should be. The slope of a best-fit line for those three seasons of data?

## Lista de respuestas

0  La mejor respuesta

Aquí es cómo hacerlo en R:

` ` DF <- read.table(text = "player      s1  s2  s3 Brian_Giles 66  68  70 Joe_Thomas  71  72  71 Robin_Yount 71  69  68 Jim_Jones   66  66  65", header = TRUE)  library(reshape2) DF <- melt(DF, id = "player", variable.name = "season") DF\$season <- as.integer(DF\$season)  fit <- lm(value ~ season * player, data = DF) summary(fit) setNames(predict(fit, newdata = data.frame(player = unique(DF\$player),                                   season = 4)),          unique(DF\$player)) #Brian_Giles  Joe_Thomas Robin_Yount   Jim_Jones  #   72.00000    71.33333    66.33333    64.66667  ` `

Al proporcionar una respuesta, no respaldo su elección de método.

Here is how to do this in R:

``DF <- read.table(text = "player      s1  s2  s3 Brian_Giles 66  68  70 Joe_Thomas  71  72  71 Robin_Yount 71  69  68 Jim_Jones   66  66  65", header = TRUE)  library(reshape2) DF <- melt(DF, id = "player", variable.name = "season") DF\$season <- as.integer(DF\$season)  fit <- lm(value ~ season * player, data = DF) summary(fit) setNames(predict(fit, newdata = data.frame(player = unique(DF\$player),                                   season = 4)),          unique(DF\$player)) #Brian_Giles  Joe_Thomas Robin_Yount   Jim_Jones  #   72.00000    71.33333    66.33333    64.66667 ``

By providing an answer I don't endorse your choice of method.

