| Title: | Regressão Linear |
|---|---|
| Description: | Funções para análise e conjuntos de dados dos exemplos e exercícios utilizados na disciplina de Análise de Regressão Linear (EST035). |
| Authors: | Fabio Demarqui [aut, cre] |
| Maintainer: | Fabio Demarqui <[email protected]> |
| License: | MIT + file LICENSE |
| Version: | 0.0.9 |
| Built: | 2026-05-17 09:07:51 UTC |
| Source: | https://github.com/fndemarqui/reglin |
Funções e bancos de dados para a disciplina de Análise de Regressão.
_PACKAGE
Montgomery, D. C., Peck, E. A, and Vining, G. G, (2016). Introduction to Linear Regression Analysis, 5ª. Edição, New York: Wiley.
Montgomery, D. C., Runger, G. C. (2015) Estatística Aplicada e Probabilidade para Engenheiros, 5ª. Edição, Rio de Janeiro: LTC.
Exemplo: Dados referentes ao percentual de conversão de n-heptano para acetileno e três variáveis explicativas. Estes são dados típicos de processos químicos para os quais uma superfície de resposta quadrática completa envolvendo todas as três variáveis regressoras é frequentemente considerada como um modelo inicial de investigação.
Data frame com 16 linhas e 4 variáveis:
conversao: conversão de n-heptano para acetileno (%)
temperatura: temperatura de reação (em °C)
razao: razão de H2 para n-heptano (razão molar)
tempo: tempo de contato (em segundos)
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Exemplo: Uma engarrafadora de refrigerantes está analisando as rotas de serviço das máquinas de venda automática em seu sistema de distribuição. A empresa está interessada em prever a quantidade de tempo necessária para a rota percorrida pelo motorista para atender as máquinas de venda automática em um ponto de venda. Esta atividade de serviço inclui estocar a máquina com produtos de bebidas e a realização de pequenas manutenções. O engenheiro industrial responsável pelo estudo sugeriu que duas variáveis mais importantes que afetam o tempo de entrega são o número de caixas de produto estocado e a distância percorrida pelo roteirista . Foram coletadas 25 observações sobre o tempo de entrega.
Data frame com 25 linhas e 3 variáveis:
tempo: tempo de entrega (em minutos)
caixas: número de caixas a serem entregues
distancia: distância percorrida (em pés)
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Exemplo 2.28: Banco de dados com o tempo necessário para um comerciante estocar uma prateleira de supermercado com um refrigerante bem como o número de caixas do produto estocado.
Data frame com 15 linhas e duas variáveis:
tempo: tempo gasto para o estoque da mercadoria em uma prateleira.
caixas: número de caixas do produto estocado (covariável).
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Delineamento com um fator fixo e uma covariável conduzido para avaliar se existem diferenças na forças de fibras de monofilamentos produzidas por 3 máquinas.
Data frame com 15 linhas e 3 variáveis:
força: força da fibra de monofilamento (variável resposta)
maquina: máquina utilizada na produção das fibras de monofilamento (variável categórica com três níveis; fator de interesse principal)
diametro: diâmetro da fibra de monofilamento (covariável; interesse secundário)
Fábio N. Demarqui [email protected]
Montgomery, D. C. (2016). Design and Analysis of Experiments, 8ª. Edição, New York: Wiley.
Derek Whiteside, da Estação de Pesquisa de Edifícios do Reino Unido, registrou o consumo semanal de gás e a temperatura externa média em sua própria casa no sudeste da Inglaterra para duas estações de aquecimento, uma de 26 semanas antes e uma de 30 semanas após a instalação do isolamento térmico nas paredes da sua residência. O objetivo do exercício foi avaliar o efeito do isolamento térmico no consumo de gás.
Data frame com 56 linhas e 3 variáveis:
isolamento: variável indicadora (antes/depois) da instalação do isolamento (covariável)
temperatura: temperatura externa medida em graus Celsius (covariável)
consumo: consumo semanal de gás em metros cúbicos (variável resposta)
Fábio N. Demarqui [email protected]
Adummy A (2026). “Not avalable.” Failed to insert reference with key = MASS from package = 'reglin'. Possible cause — missing REFERENCES.bib in package 'reglin' or 'reglin' not installed..
ggplot version of influence diagnostic plots for an lm object
gginfluence( object, measure = c("leverage", "dfbetas", "cooksd", "dffits", "covratio"), ... )gginfluence( object, measure = c("leverage", "dfbetas", "cooksd", "dffits", "covratio"), ... )
object |
an object of class lm with the fitted linear model. |
measure |
the desired influence diagnostic measure; available options are:
|
... |
further arguments passed to other methods. |
Fábio N. Demarqui
ggplot version of plot diagnostics for an lm object
ggresiduals( object, type = c("default", "crPlots", "avPlots", "covPlots"), which = 1:4, alpha = 0.05, ... )ggresiduals( object, type = c("default", "crPlots", "avPlots", "covPlots"), which = 1:4, alpha = 0.05, ... )
object |
an object of class lm with the fitted linear model. |
type |
the desired type of plot; available options are:
|
which |
only used for the default type of plot; a subset of the numbers 1:6, by default 1:4, referring to:
|
alpha |
significance level used to determined inconsistent points in plot 5; default value is alpha = 0.05. |
... |
further arguments passed to other methods. |
Fábio N. Demarqui
Exemplo: Um engenheiro de pesquisa está investigando o uso de um moinho de vento para gerar eletricidade. Ele coletou dados sobre a tensão de saída de seu moinho de vento e a velocidade do vento correspondente.
Data frame com 25 linhas e duas variáveis:
velocidade: velocidade do vento (covariável)
tensao: tensão de saída (variável resposta)
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Em um experimento 125 moscas-das-frutas que foram divididas aleatoriamente em 5 grupos de 25 cada. A resposta foi a longevidade da mosca-da-fruta em dias. Um grupo foi mantido solitário (A), enquanto outro foi mantido individualmente com uma fêmea virgem a cada dia (B). Outro grupo recebeu 8 fêmeas virgens por dia (C). Como controle adicional, o quarto (D) e quinto (E) grupos foram mantidos com uma ou oito fêmeas grávidas por dia. As moscas-das-frutas grávidas não acasalam. O comprimento do tórax de cada macho foi medido, pois isso era conhecido por afetar a longevidade. Uma observação no grupo D foi perdida.
Data frame com 124 linhas e 3 variáveis:
torax: comprimento do tórax de cada macho (covariável)
longevidade: longevidade da mosca-da-fruta em dias (variável resposta)
grupo: grupos de interesse para comparação (covariável)
Fábio N. Demarqui [email protected]
Adummy A (2026). “Not avalable.” Failed to insert reference with key = faraway from package = 'reglin'. Possible cause — missing REFERENCES.bib in package 'reglin' or 'reglin' not installed..
Um experimento foi realizado com o objetivo de determinar como três regimes de alimentação diferentes (A, B e C) afetam o tamanho de ouriços-do-mar ao longo do tempo. O tamanho inicial dos ouriços-do-mar no início do experimento provavelmente afeta o tamanho que eles crescem à medida que são alimentados, e portanto foi considerado uma variável de perturbação.
Data frame com 72 linhas e 3 variáveis:
regime: regime de alimentação: A, B ou C (covariável)
tamanho_inicial: tamanho do ouriço antes do início da dieta (covariável)
tamanho_final: tamanho do ouriço no final do experimento (variável resposta)
Fábio N. Demarqui [email protected]
Function to compute PRESS statistic for one or more models.
press(object, ...)press(object, ...)
object |
one or more objects of class lm. |
... |
further arguments passed to or from other methods. |
the PRESS statistic when a single model is passed to the function; otherwise, a data.frame with the PRESS statistic values is returned.
library(reglin) data(entregas) fit0 <- lm(tempo ~ 1, data = entregas) fit1 <- lm(tempo ~ caixas, data = entregas) fit2 <- lm(tempo ~ distancia, data = entregas) fit3 <- lm(tempo ~ caixas + distancia, data = entregas) fit4 <- lm(tempo ~ caixas*distancia, data = entregas) press(fit1) press(fit1, fit2, fit3, fit4)library(reglin) data(entregas) fit0 <- lm(tempo ~ 1, data = entregas) fit1 <- lm(tempo ~ caixas, data = entregas) fit2 <- lm(tempo ~ distancia, data = entregas) fit3 <- lm(tempo ~ caixas + distancia, data = entregas) fit4 <- lm(tempo ~ caixas*distancia, data = entregas) press(fit1) press(fit1, fit2, fit3, fit4)
Exemplo: Um engenheiro está interessado em estudar a relação entre a pureza do oxigênio (y) produzido em um processo químico de destilação e o percentagem de hidrocarbonetos (x) presente no condensador principal de uma unidade de destilação.
Data frame com 20 linhas e duas variáveis:
percentual: percentual de hidrocarbonetos presentes no condensador principal (covariável)
pureza: purezao do oxigênio (variável resposta)
Fábio N. Demarqui [email protected]
Montgomery, D. C., Runger, G. C. (2015) Estatística Aplicada e Probabilidade para Engenheiros, 5ª. Edição, Rio de Janeiro: LTC.
Coefficient of determination (R2)
R2(object, ...)R2(object, ...)
object |
object of class lm, usually, a result of a call to lm. |
... |
other objects of class lm, usually, a result of a call to lm. |
the coefficient of determination associated with the fitted model.
Adjusted Coefficient of determination (R2adj)
R2adj(object, ...)R2adj(object, ...)
object |
object of class lm, usually, a result of a call to lm. |
... |
other objects of class lm, usually, a result of a call to lm. |
the coefficient of determination associated with the fitted model.
Exemplo: Dados relativos à resistência do papel kraft e ao percentual de madeira nobre no lote de celulose a partir do qual o papel foi produzido. O diagrama de dispersão desses dados, aliado ao conhecimento do processo de produção, sugere que um modelo quadrático pode descrever adequadamente a relação entre resistência à tração e concentração de madeira nobre.
Data frame com 19 linhas e duas variáveis:
concentracao: percentual de madeira nobre no lote de celulose
resistencia: resistencia do papel
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Exemplo: Um estudo foi realizado para avaliar o impacto do gasto anual com propagana sobre o rendimento médio mensal da venda de alimentos de 30 restaurantes.
Data frame com 3 linhas e 3 variáveis:
receita: receita média mensal do restaurante (variável resposta)
propaganda: gasto anual com propaganda (covariável)
id: indicadora de grupo de restaurantes
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
rlm: generation of data with a linear regression structure
rlm(formula, beta, sigma, data = NULL, ...)rlm(formula, beta, sigma, data = NULL, ...)
formula |
a formula containing the linear predictor. |
beta |
vector of regression coefficients. |
sigma |
error standard deviation. |
data |
a data.frame containing the set of covariates entering the linear predictor. |
... |
further arguments passed to other methods. |
a numeric vector containing the generated response variable.
Generic S3 method se
se(object, ...)se(object, ...)
object |
a fitted model object. |
... |
further arguments passed to or from other methods. |
the standard errors associated with a set of parameter estimators for a given model.
Estimated standard errors for the regression coefficients
## S3 method for class 'lm' se(object, ...)## S3 method for class 'lm' se(object, ...)
object |
an object of the class lm |
... |
further arguments passed to or from other methods |
the standard errors associated with the regression coefficients.
Implementation of the unit normal and unit length scaling methods to produce standardized regression coefficients.
standardization(x, type = c("normal", "length"))standardization(x, type = c("normal", "length"))
x |
a vector containing the values to be scaled (unit normal scaling and unit length scales) |
type |
type of scaling to be applied. |
a vector with the standardized variable
ANOVA table for linear models
tab_anova(model)tab_anova(model)
model |
an object of class lm or aov with the fitted linear model. |
the ANOVA table decomposed into model and error sources of variation.
Exemplo: Dados referentes à queda de tensão da bateria em um motor de míssil guiado observada durante o voo do míssil. O diagrama de dispersão sugere que a queda de tensão se comporta de maneira diferente em diferentes segmentos de tempo e, portanto, modelaremos os dados com um spline cúbico usando dois nós em t1 = 6,5 e t2 = 13 segundos após o lançamento, respectivamente.
Data frame com 41 linhas e duas variáveis:
tempo: tempo após o lançamento (em segundos)
tensao: queda de tensão (Volt)
Fábio N. Demarqui [email protected]
Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.
Residuals Tests for Linear Regression Models
testResiduals(object, ...)testResiduals(object, ...)
object |
an object of class lm with the fitted linear model. |
... |
further arguments passed to other methods. |
Fábio N. Demarqui
Conjunto de dados contendo o PIB per capita e a expectativa de vida de 211 países.
Data frame com 211 linhas e duas variáveis:
pib: PIB per capita, ou Produto Interno Bruto por habitante; o PIB per capita é um indicador econômico que reflete a riqueza média produzida por cada pessoa em um determinado local, como um país ou região, e é calculado dividindo o Produto Interno Bruto total pelo número de habitantes.
expectativa: expectativa de vida (em anos)
Fábio N. Demarqui [email protected]
Izbicki, R. e Santos, T. M. dos. Aprendizado de máquina: uma abordagem estatística. 1ª edição. 2020. 272 páginas. ISBN: 978-65-00-02410-4.