Anallise e Estatística em R

Tipo de documento:Questões e Exercícios

Área de estudo:Tecnologia da informação

Documento 1

mpg). Utilizando então a base disponibilizada, você deve: a)    Ajustar um modelo de regressão linear sendo price a variável alvo (resposta), como função das demais variáveis citadas acima: horsepower, length, engine. size, city. mpg. b)    Realizar a análise do modelo ajustado, avaliando o valor do R-quadrado, a significância estatística de cada parâmetro ajustado e a qualidade total do ajuste pela estatística F. formula(modelo. equacao) ##criar modelo modelo <- lm(modelo. formula, data = autos) summary(modelo) ----------------------------------------------------------- Com os coeficientes obtidos, temos a relação: price = 52. horsepower + 114. length + 115. size) – 1. log(city. mpg) b) Primeiro, analisaremos o modelo feito com a relação linear entre as variáveis > summary(modelo) Call: lm(formula = modelo. formula, data = autos) Residuals: Min 1Q Median 3Q Max -9697.

Coefficients: Estimate Std. Adjusted R-squared: 0. F-statistic: 209. on 4 and 188 DF, p-value: < 2. e-16 -------------------------------------------------------------------------- Através da função summary, temos o valor de R²: 0,8129, que indica a qualidade do ajuste (este correspondente à 81,68% do modelo). anova(modelo) Analysis of Variance Table Response: price Df Sum Sq Mean Sq F value Pr(>F) horsepower 1 8292710641 8292710641 677. mpg), logo R-quadrado é significativamente diferente de 0. Nas saídas do teste F através da função ANOVA, temos: Pr(>F) < F-value, assim rejeita-se H0, concluindo que o modelo é representativo. essa análise não o classifica como “o melhor modelo”, pois seria necessário detalhar a relação entre cada combinação de variáveis separadamente. c) Os parâmetros do método dos mínimos quadrados são apresentados na penúltima linha da função summary: Multiple R-squared: 0.

Adjusted R-squared: 0. e-10 *** log(city. mpg) -0. Signif. codes: 0 ‘***’ 0. ‘ ’ 1 Residual standard error: 0. Residuals 188 7. Signif. codes: 0 ‘***’ 0. ‘ ’ 1 A princípio, o valor em summary (correspondente ao modelo_log), mantém-se semelahnte ao modelo. No entanto, em uma análise mais detalhada (coeficiente por coeficiente) através da função anova, percebe-se uma discrepância indicando melhora significativa no modelo_log, uma vez que o valor dos resíduos foi de 12245758 para 0. d) A análise dos resíduos e da curva normal QQ permitiu averiguar a relação entre os valores, consolidando observações feitas previamente através das tabelas/resumos estatísticos. O gráfico de resíduos é consistente com as observações feitas na alternativa b, em que mostra-se que a variância é distinta para os diferentes coeficientes. A curva QQ, por sua vez, mostra a normalidade nos resíduos.

Retomando ao modelo, vamos analisar os coeficientes para verificar o impacto de cada preditora: price = 52. horsepower + 114. Para fins de detalhamento, foram feitos os gráficos da variável depentende preço em função de cada parâmetro separadamente: GRÁFICO PRICE X HORSEPOWER GRÁFICO PRICE X LENGTH GRÁFICO PRICE X ENGINE. SIZE GRÁFICO CITY. MPG Assim, verificamos uma inconstência entre o comportamento da variável price em função de city. mpg, considerando “modelo”. Por fim, verificando o modelo_log, temos o comportamento de decrescimento evidenciado pelo valor negativo do coeficiente, de modo que este melhor representa a relação: log(price) = 2.

42 R$ para obter acesso e baixar trabalho pronto

Apenas no StudyBank

Modelo original

Para download