Package 'reglin'

Title: Regressão Linear
Description: Funções para análise e conjuntos de dados dos exemplos e exercícios utilizados na disciplina de Análise de Regressão Linear (EST035).
Authors: Fabio Demarqui [aut, cre]
Maintainer: Fabio Demarqui <[email protected]>
License: MIT + file LICENSE
Version: 0.0.9
Built: 2026-05-17 09:07:51 UTC
Source: https://github.com/fndemarqui/reglin

Help Index


Pacote Reglin - Regressão Linear.

Description

Funções e bancos de dados para a disciplina de Análise de Regressão.

Details

_PACKAGE

References

Montgomery, D. C., Peck, E. A, and Vining, G. G, (2016). Introduction to Linear Regression Analysis, 5ª. Edição, New York: Wiley.

Montgomery, D. C., Runger, G. C. (2015) Estatística Aplicada e Probabilidade para Engenheiros, 5ª. Edição, Rio de Janeiro: LTC.


Percentual de conversão de n-heptano para acetileno

Description

Exemplo: Dados referentes ao percentual de conversão de n-heptano para acetileno e três variáveis explicativas. Estes são dados típicos de processos químicos para os quais uma superfície de resposta quadrática completa envolvendo todas as três variáveis regressoras é frequentemente considerada como um modelo inicial de investigação.

Format

Data frame com 16 linhas e 4 variáveis:

  • conversao: conversão de n-heptano para acetileno (%)

  • temperatura: temperatura de reação (em °C)

  • razao: razão de H2 para n-heptano (razão molar)

  • tempo: tempo de contato (em segundos)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Tempo de Entrega de Refrigerantes

Description

Exemplo: Uma engarrafadora de refrigerantes está analisando as rotas de serviço das máquinas de venda automática em seu sistema de distribuição. A empresa está interessada em prever a quantidade de tempo necessária para a rota percorrida pelo motorista para atender as máquinas de venda automática em um ponto de venda. Esta atividade de serviço inclui estocar a máquina com produtos de bebidas e a realização de pequenas manutenções. O engenheiro industrial responsável pelo estudo sugeriu que duas variáveis mais importantes que afetam o tempo de entrega são o número de caixas de produto estocado e a distância percorrida pelo roteirista . Foram coletadas 25 observações sobre o tempo de entrega.

Format

Data frame com 25 linhas e 3 variáveis:

  • tempo: tempo de entrega (em minutos)

  • caixas: número de caixas a serem entregues

  • distancia: distância percorrida (em pés)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Tempo de estocagem de refrigerantes em prateleiras

Description

Exemplo 2.28: Banco de dados com o tempo necessário para um comerciante estocar uma prateleira de supermercado com um refrigerante bem como o número de caixas do produto estocado.

Format

Data frame com 15 linhas e duas variáveis:

  • tempo: tempo gasto para o estoque da mercadoria em uma prateleira.

  • caixas: número de caixas do produto estocado (covariável).

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Força de fibras de monofilamento

Description

Delineamento com um fator fixo e uma covariável conduzido para avaliar se existem diferenças na forças de fibras de monofilamentos produzidas por 3 máquinas.

Format

Data frame com 15 linhas e 3 variáveis:

  • força: força da fibra de monofilamento (variável resposta)

  • maquina: máquina utilizada na produção das fibras de monofilamento (variável categórica com três níveis; fator de interesse principal)

  • diametro: diâmetro da fibra de monofilamento (covariável; interesse secundário)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C. (2016). Design and Analysis of Experiments, 8ª. Edição, New York: Wiley.


Isolamento térmico de casa e consumo de gás

Description

Derek Whiteside, da Estação de Pesquisa de Edifícios do Reino Unido, registrou o consumo semanal de gás e a temperatura externa média em sua própria casa no sudeste da Inglaterra para duas estações de aquecimento, uma de 26 semanas antes e uma de 30 semanas após a instalação do isolamento térmico nas paredes da sua residência. O objetivo do exercício foi avaliar o efeito do isolamento térmico no consumo de gás.

Format

Data frame com 56 linhas e 3 variáveis:

  • isolamento: variável indicadora (antes/depois) da instalação do isolamento (covariável)

  • temperatura: temperatura externa medida em graus Celsius (covariável)

  • consumo: consumo semanal de gás em metros cúbicos (variável resposta)

Author(s)

Fábio N. Demarqui [email protected]

References

Adummy A (2026). “Not avalable.” Failed to insert reference with key = MASS from package = 'reglin'. Possible cause — missing REFERENCES.bib in package 'reglin' or 'reglin' not installed..


ggplot version of influence diagnostic plots for an lm object

Description

ggplot version of influence diagnostic plots for an lm object

Usage

gginfluence(
  object,
  measure = c("leverage", "dfbetas", "cooksd", "dffits", "covratio"),
  ...
)

Arguments

object

an object of class lm with the fitted linear model.

measure

the desired influence diagnostic measure; available options are:

  • leverage

  • dfbetas

  • cooksd

  • dffits

  • covratio

...

further arguments passed to other methods.

Author(s)

Fábio N. Demarqui


ggplot version of plot diagnostics for an lm object

Description

ggplot version of plot diagnostics for an lm object

Usage

ggresiduals(
  object,
  type = c("default", "crPlots", "avPlots", "covPlots"),
  which = 1:4,
  alpha = 0.05,
  ...
)

Arguments

object

an object of class lm with the fitted linear model.

type

the desired type of plot; available options are:

  • default: for default R residual plots

  • crPlots: for component + residuals plots

  • avPlots: for added variable plots

  • covPlots: for covariates vs stdresidual plots

which

only used for the default type of plot; a subset of the numbers 1:6, by default 1:4, referring to:

  1. Residuals vs Fitted

  2. Normal Q-Q" plot

  3. Scale-Location

  4. Cook's distance

  5. Residuals vs Leverage

  6. Cook's dist vs Lev./(1-Lev.)

alpha

significance level used to determined inconsistent points in plot 5; default value is alpha = 0.05.

...

further arguments passed to other methods.

Author(s)

Fábio N. Demarqui


Geração de energia

Description

Exemplo: Um engenheiro de pesquisa está investigando o uso de um moinho de vento para gerar eletricidade. Ele coletou dados sobre a tensão de saída de seu moinho de vento e a velocidade do vento correspondente.

Format

Data frame com 25 linhas e duas variáveis:

  • velocidade: velocidade do vento (covariável)

  • tensao: tensão de saída (variável resposta)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Longevidade de moscas-das-frutas

Description

Em um experimento 125 moscas-das-frutas que foram divididas aleatoriamente em 5 grupos de 25 cada. A resposta foi a longevidade da mosca-da-fruta em dias. Um grupo foi mantido solitário (A), enquanto outro foi mantido individualmente com uma fêmea virgem a cada dia (B). Outro grupo recebeu 8 fêmeas virgens por dia (C). Como controle adicional, o quarto (D) e quinto (E) grupos foram mantidos com uma ou oito fêmeas grávidas por dia. As moscas-das-frutas grávidas não acasalam. O comprimento do tórax de cada macho foi medido, pois isso era conhecido por afetar a longevidade. Uma observação no grupo D foi perdida.

Format

Data frame com 124 linhas e 3 variáveis:

  • torax: comprimento do tórax de cada macho (covariável)

  • longevidade: longevidade da mosca-da-fruta em dias (variável resposta)

  • grupo: grupos de interesse para comparação (covariável)

Author(s)

Fábio N. Demarqui [email protected]

References

Adummy A (2026). “Not avalable.” Failed to insert reference with key = faraway from package = 'reglin'. Possible cause — missing REFERENCES.bib in package 'reglin' or 'reglin' not installed..


Tamanho de ouriços

Description

Um experimento foi realizado com o objetivo de determinar como três regimes de alimentação diferentes (A, B e C) afetam o tamanho de ouriços-do-mar ao longo do tempo. O tamanho inicial dos ouriços-do-mar no início do experimento provavelmente afeta o tamanho que eles crescem à medida que são alimentados, e portanto foi considerado uma variável de perturbação.

Format

Data frame com 72 linhas e 3 variáveis:

  • regime: regime de alimentação: A, B ou C (covariável)

  • tamanho_inicial: tamanho do ouriço antes do início da dieta (covariável)

  • tamanho_final: tamanho do ouriço no final do experimento (variável resposta)

Author(s)

Fábio N. Demarqui [email protected]

Source

tidymodels


PRESS statistic

Description

Function to compute PRESS statistic for one or more models.

Usage

press(object, ...)

Arguments

object

one or more objects of class lm.

...

further arguments passed to or from other methods.

Value

the PRESS statistic when a single model is passed to the function; otherwise, a data.frame with the PRESS statistic values is returned.

Examples

library(reglin)
data(entregas)

fit0 <- lm(tempo ~ 1, data = entregas)
fit1 <- lm(tempo ~ caixas, data = entregas)
fit2 <- lm(tempo ~ distancia, data = entregas)
fit3 <- lm(tempo ~ caixas + distancia, data = entregas)
fit4 <- lm(tempo ~ caixas*distancia, data = entregas)

press(fit1)
press(fit1, fit2, fit3, fit4)

Pureza do oxigênio

Description

Exemplo: Um engenheiro está interessado em estudar a relação entre a pureza do oxigênio (y) produzido em um processo químico de destilação e o percentagem de hidrocarbonetos (x) presente no condensador principal de uma unidade de destilação.

Format

Data frame com 20 linhas e duas variáveis:

  • percentual: percentual de hidrocarbonetos presentes no condensador principal (covariável)

  • pureza: purezao do oxigênio (variável resposta)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Runger, G. C. (2015) Estatística Aplicada e Probabilidade para Engenheiros, 5ª. Edição, Rio de Janeiro: LTC.


Coefficient of determination (R2)

Description

Coefficient of determination (R2)

Usage

R2(object, ...)

Arguments

object

object of class lm, usually, a result of a call to lm.

...

other objects of class lm, usually, a result of a call to lm.

Value

the coefficient of determination associated with the fitted model.


Adjusted Coefficient of determination (R2adj)

Description

Adjusted Coefficient of determination (R2adj)

Usage

R2adj(object, ...)

Arguments

object

object of class lm, usually, a result of a call to lm.

...

other objects of class lm, usually, a result of a call to lm.

Value

the coefficient of determination associated with the fitted model.


Resistência de papel

Description

Exemplo: Dados relativos à resistência do papel kraft e ao percentual de madeira nobre no lote de celulose a partir do qual o papel foi produzido. O diagrama de dispersão desses dados, aliado ao conhecimento do processo de produção, sugere que um modelo quadrático pode descrever adequadamente a relação entre resistência à tração e concentração de madeira nobre.

Format

Data frame com 19 linhas e duas variáveis:

  • concentracao: percentual de madeira nobre no lote de celulose

  • resistencia: resistencia do papel

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Efeito de propaganda sobre as receitas de restaurantes

Description

Exemplo: Um estudo foi realizado para avaliar o impacto do gasto anual com propagana sobre o rendimento médio mensal da venda de alimentos de 30 restaurantes.

Format

Data frame com 3 linhas e 3 variáveis:

  • receita: receita média mensal do restaurante (variável resposta)

  • propaganda: gasto anual com propaganda (covariável)

  • id: indicadora de grupo de restaurantes

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


rlm: generation of data with a linear regression structure

Description

rlm: generation of data with a linear regression structure

Usage

rlm(formula, beta, sigma, data = NULL, ...)

Arguments

formula

a formula containing the linear predictor.

beta

vector of regression coefficients.

sigma

error standard deviation.

data

a data.frame containing the set of covariates entering the linear predictor.

...

further arguments passed to other methods.

Value

a numeric vector containing the generated response variable.


Generic S3 method se

Description

Generic S3 method se

Usage

se(object, ...)

Arguments

object

a fitted model object.

...

further arguments passed to or from other methods.

Value

the standard errors associated with a set of parameter estimators for a given model.


Estimated standard errors for the regression coefficients

Description

Estimated standard errors for the regression coefficients

Usage

## S3 method for class 'lm'
se(object, ...)

Arguments

object

an object of the class lm

...

further arguments passed to or from other methods

Value

the standard errors associated with the regression coefficients.


Variable standardization

Description

Implementation of the unit normal and unit length scaling methods to produce standardized regression coefficients.

Usage

standardization(x, type = c("normal", "length"))

Arguments

x

a vector containing the values to be scaled (unit normal scaling and unit length scales)

type

type of scaling to be applied.

Value

a vector with the standardized variable


ANOVA table for linear models

Description

ANOVA table for linear models

Usage

tab_anova(model)

Arguments

model

an object of class lm or aov with the fitted linear model.

Value

the ANOVA table decomposed into model and error sources of variation.


Queda de tensão da bateria em um motor de míssil guiado

Description

Exemplo: Dados referentes à queda de tensão da bateria em um motor de míssil guiado observada durante o voo do míssil. O diagrama de dispersão sugere que a queda de tensão se comporta de maneira diferente em diferentes segmentos de tempo e, portanto, modelaremos os dados com um spline cúbico usando dois nós em t1 = 6,5 e t2 = 13 segundos após o lançamento, respectivamente.

Format

Data frame com 41 linhas e duas variáveis:

  • tempo: tempo após o lançamento (em segundos)

  • tensao: queda de tensão (Volt)

Author(s)

Fábio N. Demarqui [email protected]

References

Montgomery, D. C., Peck, E. A., and Vining, G. G. (2012) Introduction to Linear Regression Analysis, 5th Edition, Boca Raton: Wiley.


Residuals Tests for Linear Regression Models

Description

Residuals Tests for Linear Regression Models

Usage

testResiduals(object, ...)

Arguments

object

an object of class lm with the fitted linear model.

...

further arguments passed to other methods.

Author(s)

Fábio N. Demarqui


PIB per capita e expectativa de vida de 211 países

Description

Conjunto de dados contendo o PIB per capita e a expectativa de vida de 211 países.

Format

Data frame com 211 linhas e duas variáveis:

  • pib: PIB per capita, ou Produto Interno Bruto por habitante; o PIB per capita é um indicador econômico que reflete a riqueza média produzida por cada pessoa em um determinado local, como um país ou região, e é calculado dividindo o Produto Interno Bruto total pelo número de habitantes.

  • expectativa: expectativa de vida (em anos)

Author(s)

Fábio N. Demarqui [email protected]

References

Izbicki, R. e Santos, T. M. dos. Aprendizado de máquina: uma abordagem estatística. 1ª edição. 2020. 272 páginas. ISBN: 978-65-00-02410-4.