Atv. Acadêmicas





APOSTILA
DE
 ESTATÍSTICA







ESTATÍSTICA

A Estatística é a aplicação de modelos matemáticos nos diversos campos de atuação. Ela é essencial ao planejamento, avaliação e interpretação de todos os dados obtidos em pesquisa em todas as áreas. É fundamental à epidemiologia, à ecologia, ao meio empresarial, à tecnologia e à medicina baseada em evidências, e também, para analisar seres vivos ou fenômenos, em seu todo ou em parte, nas suas mais diversas variáveis a serem estudadas, de acordo com as necessidades do profissional ou da situação.
Para o tratamento estatístico adequado a resultados confiáveis, o profissional deve estar plenamente ciente do fenômeno no qual está sendo estudado (por exemplo: pessoas com suas nacionalidades e hábitos e origem e número de um determinado grupo).
A análise estatística envolve habilidade numérica, portanto, operar com calculadora científica para os cálculos e Excel para construção de gráficos é de fundamental importância para o sucesso neste campo de trabalho, fazendo duas casas após a vírgula e sem aproximação.
Um outro conhecimento de grande importância é a operação matemática em nível percentual para que seja possível estabelecer analogias numéricas das mais diversas formas, fazendo assim, de forma dissertativa, uma análise comparativa dos dados.

Percentual
1) A representatividade percentual de um dado ou parte em relação ao todo, nada mais é que a relação entre estas partes. Por exemplo: num grupo de vinte pessoas, seis estão doentes, o que aponta um percentual de 30% de pessoas doentes, pois vale a relação (6/20)x100.
A multiplicação por 100 representa o tratamento percentual e é comum tecnicamente trabalhar sempre com duas casas após a vírgula, sem qualquer arredondamento.
2) o aumento e a redução percentual tem haver com o referencial e o procedimento técnico de cálculo é tomar a diferença e dividi-la pelo valor referencial (inicial) x 100.
Citamos como exemplo um ser humano que come por dia 400g de um determinado alimento e num período, passa a comer 680g do mesmo alimento. O aumento percentual é de 70% pois este resultado é fruto de: [(680 – 400) / 400] x 100. O mesmo procedimento reporta-se à redução, vejamos: um ser humano está comendo 680g de um determinado alimento, e num período passa a comer 400g o que indica que houve uma redução da ordem de 41,17% ou seja, este cálculo é fruto da expressão [(680 – 400) / 680] x 100.

Conceitos Preliminares

População: todos os componentes ou membros de um grupo;

Amostra: parte da população imposta pelo profissional; usada quando se trabalha com muitos membros, mas é sabido que a amostra reduz a precisão do tratamento estatístico;

Variável: objeto de estudo que pode ser quantitativa (numérico: idade) ou qualitativa (qualidade: cor da pele);

Dado da Variável: registro individual ou grupal da variável em estudo (3 anos, 4 anos, etc).

Coleta de Dados: mecanismo de registro que pode ser via de regra, através de medição, observação, questionário e entrevista.



Tratamento Estatístico

Quando se pretende estabelecer um tratamento estatístico, inicialmente coleta-se dados através de um mecanismo e registra-se de forma aleatória os dados. A partir daí, os dados são formatados em ordem seqüencial de grandeza, gerando assim o ROL.

Como exemplo:

  • Registro aleatório:           3 – 3 – 2 – 4 – 6 – 5 – 7 – 5 – 8 – 5
  • ROL:                                2 – 3 – 3 – 4 – 5 – 5 – 5 – 6 – 7 – 8



A partir desse procedimento, é conveniente e tecnicamente se faz, a colocação dos dados na “Tabela de Distribuição de Freqüência” (TDF) para dados individuais, que inicialmente é composta da seguinte forma em nível de colunas:

Dado Variável (X)
F
Fa
Fr
X2












(x) dado coletado da variável;
F Freqüência (nº de vezes que o dado aparece);
Fa Freqüência Acumulada (soma progressiva dos dados da coluna anterior; serve para identificar a posição do dado no Rol);
Fr  Freqüência Relativa (relação do dado com o todo (n) onde “n” indica o número total de dados, e é apresentada de forma percentual (%).
X2 – dado numérico para cálculos posteriores.

Demonstrando o preenchimento da TDF segundo o exemplo apresentado anteriormente, onde n = 10, teremos:

Dado Variável (x)
F
Fa
Fr
X2
2
1
1
10
4
3
2
3
20
18
4
1
4
10
16
5
3
7
30
75
6
1
8
10
36
7
1
9
10
49
8
1
10
10
64


  • n é o somatório da coluna da Freqüência Acumulada;
  • a Freqüência Relativa, o somatório deve ser igual a 100%; quando isto não acontece, deve-se acrescer um centésimo aos números, iniciando-se pelo menor e de forma progressiva, até atingir os 100%.



Dando seqüência ao trabalho estatístico, aqui denominado de tratamento estatístico, é necessário iniciar os cálculos das “Medidas de Tendência Central” (MTC) que são:

  • Moda (Mo) dado da variável estudada que possui a maior freqüência, ou seja, o que mais aparece (possui unidade); quando dois dados possuem freqüências maiores e iguais, estes são considerados e quando mais de dois dados estão nesta situação, o trabalho não possui Moda.

  • Mediana (Me) dado da variável que se posiciona-se de forma central, balanceando os demais dados que situam-se a esquerda e a direita desta; a mediana pode ser verificada pelo Rol ou na coluna da Fa (possui unidade).
O seu cálculo deve se ater à tecnicidade da estatística da seguinte forma:
- quando “n” é ímpar, divide-se por dois e acrescenta 0,5 para a identificação precisa da posição;
- quando n é par, divide-se por dois, registra o valor que ocupa esta posição e soma-se com o valor da posição seguinte e o resultado é a média aritmética dos dois.

  • Média (Ma) também denominada apenas por “Média”, é fruto do somatório de cada dado multiplicado por sua freqüência e finalmente dividindo-se pelo número total de dados “n” (possui unidade).


Tomando a tabela com os registros identificados para exemplo, e fazendo os números como sendo o tempo de trabalho em anos dos profissionais do grupo de dez, teremos:

  • Moda =        5 anos
  • Mediana =    5 anos
  • Média =       4,8 anos


Exercício 1
Deseja-se conhecer o perfil, no que se refere a idade (anos) e massa corporal (Kg) de cada elemento da turma presente em sala de aula, envolvendo uma amostra de 80% dos presentes na data da realização do trabalho estatístico, utilizando as MTC para efeito de cálculos.



Continuando os estudos, o conjunto de medidas que completam o tratamento estatístico de um determinado trabalho, é o das “Medidas de Dispersão” (MD), de vital importância para uma radiografia completa a respeito do fenômeno estudado. Elas são apresentadas da seguinte forma:


  • Variância (V): valor que identifica a variação dos dados coletados em relação à Média; não possui unidade e o seu cálculo resulta da expressão:

V = [∑x2 – (∑x)2 / n] / n-1


  • Desvio Padrão (Dp): valor que indica a regularidade dos dados coletados; “quanto menor o Desvio Padrão, maior a regularidade dos dados”; medida muito usada para proceder analogia entre dois ou mais grupos estudados; o seu valor é fruto da raiz quadrada da Variância e possui unidade.

Dp = Raiz quadrada da Variância


  • Coeficiente de Variação (CV): valor que indica percentualmente o grau de importância ou até mesmo a preocupação para com a Variável estudada de um determinado grupo; seu valor resulta da relação entre o Desvio Padrão e a Média.

CV = (Dp / Ma) x 100 %

Nota: Amplitude (A), é uma medida estatística e reporta-se aos dados de um trabalho estatístico, sendo resultado da diferença entre o maior valor e o menor valor dos dados obtidos da coleta dos dados para um trabalho estatístico.


Como aplicação, executando os cálculos tomando o exemplo base, construído anteriormente, é conveniente recuperar a tabela construída, onde uma nova coluna deverá aparecer para facilitar os cálculos, ficando assim:


Dado Variável (x)
F
Fa
Fr
X2
2
1
1
10
4
3
2
3
20
18
4
1
4
10
16
5
3
7
30
75
6
1
8
10
36
7
1
9
10
49
8
1
10
10
64
∑ = 48



∑ = 262


Aplicando os cálculos das MD, os resultados são:

  • V = [262 – 230,4] / 9 = 3,51

  • Dp = 1,87 anos

  • CV = (1,87 / 4,8) x 100 = 38,95%

  • A = 6 anos



  Exercício 2
Com referência ao Exercício 1, executar os cálculos estatísticos utilizando as Medidas de Dispersão (MD), para efeito de análise.


Tabela de Distribuição de Freqüência com Intervalos de Classe (TDF-IC)

Quando o estudo envolve muitos dados e estes possuem valores bem próximos, é conveniente estabelecer um intervalo onde os dados estejam contidos neste, fazendo com que o trabalho estatístico seja maximizado, embora este modelo estatístico seja menos eficaz do que o trabalho que utiliza dados individuais.

A dimensão do intervalo é de responsabilidade do profissional, mas é uma evidência técnica que, quanto menor for a dimensão do intervalo, maior será a precisão dos resultados obtidos.

Os intervalos deverão possuir a mesma dimensão sendo somente o último, denominado de “intervalo de fechamento”, podendo ser menor ou igual aos anteriores.
A TDF permanece idêntica à realizada com dados individuais, alterando-se na primeira coluna, onde aparecem os intervalos com simbologia específica. O “x” será a média simples entre os pontos extremos do intervalo.

A simbologia de Intervalo com exemplos numéricos é: 4 7
onde o 4 pertence e o 7 não pertence ao intervalo e x = 5,5

A simbologia de Intervalo com exemplos numéricos é: 2123
onde ambos ( 21 e 23) pertencem ao intervalo e x = 22.

Exercício 3
Um profissional está desenvolvendo um trabalho com um grupo de 90 trabalhadores, num determinado período, verificando os tamanhos dos saltos dos calçados. Verificou e registrou o seguinte:

1,8 – 1,2 – 1,6 – 1,8 – 1,9 – 2,0 – 1,3 – 1,4 – 1,6 – 1,8 – 1,7 – 1,6 – 1,4 – 1,3 – 1,8 - 1,4 – 1,6 – 1,8 – 2,0 – 1,2 – 2,2 – 2,4 – 1,8 – 1,6 – 2,2 – 1,2 – 1,4 – 1,7 – 2,5 – 2,4 - 1,4 – 1,6 – 1,6 – 1,8 – 1,9 – 2,0 – 2,3 – 2,4 – 1,6 – 1,8 – 1,7 – 1,6 – 2,4 – 1,3 – 1,8 - 1,2 – 2,2 – 2,6 – 1,4 – 1,6 – 2,1 – 2,3 – 2,4 – 1,6 – 1,8 – 1,7 – 1,6 – 1,4 – 1,3 – 1,7 - 1,6 – 2,2 – 1,6 – 1,8 – 1,9 – 2,1 – 2,3 – 2,4 – 1,6 – 1,8 – 1,6 – 1,6 – 2,4 – 1,4 – 1,5 - 1,5 – 1,4 – 1,3 – 1,8 – 1,9 – 2,2 – 2,9 – 1,4 – 2,6 – 1,8 – 1,7 – 1,6 – 1,4 – 1,3 – 2,8.
Solicita-se calcular as MTC e MD.


Exercício 3.1
Um profissional do meio ambiente está em atividade de pesquisa para o Estado onde se localiza sua empresa, e está verificando o tamanho das minhocas (em mm), que existem numa delimitada região, haja vista sua utilização pelos pescadores. Trabalhando com uma equipe de profissionais e adotando o método da medição, chegou aos resultados:

Exemplares
Tamanho
80
12
120
13
220
14
130
16
180
17
240
19
280
20
280
21
280
22
290
23
330
25
170
26
160
29
250
31
210
33
340
34
340
36
360
40
140
44
120
45
60
46
80
47
70
48
40
49
40
51
70
53


Montar a TDF com IC para os dados fornecidos e calcular todas as medidas de TC e de Dispersão, para que se possa fazer uma análise e conhecimento das minhocas daquela região delimitada, atendo-se à fiel observância quanto à questão do meio ambiente.



Nota Importante:
Todo o trabalho de cálculo desenvolvido por um profissional é denominado “Memorial Descritivo” e deve ficar em seu poder para possíveis checagens e/ou comprovações. O que realmente se entrega ou apenas se externa para o cliente solicitante, é o resultado em forma de gráfico e o Relatório de Análise Numérica.


Transporte de Variável Qualitativa para Tratamento Quantitativo

Algumas Variáveis qualitativas podem receber tratamento numérico e após este, serem tratadas como variáveis quantitativas, ampliando assim, o campo de atuação do profissional.

Por exemplo, podemos citar a condição da montagem do Questionário, onde o respondente diante de uma formulação estabelecida pelo profissional, responde segundo o seu grau de visão ou satisfação, balizada numa escala de 0 a 10 e para formulações que merecem “Sim e Não”, o zero significa “não” e o dez significa “sim”. Não esquecer de registrar no questionário a escala desejada.

Um exemplo de formulação constante no questionário é: “Seu grau de satisfação para com a limpeza do ambiente”, onde o respondente identifica o mesmo na escala de 0 a 10.

Exercícios

4) Um profissional deseja verificar junto aos moradores de um determinado bairro de uma cidade, seu grau de satisfação para com a limpeza das ruas do mesmo. Ele atribuiu (4) Muito Bom; (3) Bom; (2) Satisfatório e (1) Ruim. Coletados os dados, ele chegou à seguinte verificação dos dados: 30 responderam: Muito Bom; 44 responderam: Bom; 56 responderam: Satisfatório e 60 responderam: Ruim. Desenvolver o tratamento estatístico calculando as MTC e MD.

5) O mesmo enunciado do exercício anterior, mas as respostas foram balizadas na escala de 0 a 10 onde os resultados dos questionários apontaram: 20 responderam grau 3; 30 responderam grau 6; 40 responderam grau 7; 50 responderam grau 8 e 50 responderam grau 5. Desenvolver o tratamento estatístico.


5.1) Seis pessoas devidamente numeradas, foram selecionadas de acordo com a idade evolutiva, dos 20 anos aos 50 anos (tabela) e foi verificado para cada uma delas a sua massa corporal (kg) bem como o grau de satisfação para com o salário profissional estabelecido pelo CRBio, na expectativa de levantar estatisticamente o estado emocional e de vida do profissional. A tabela indica os resultados coletados através do processo da entrevista.

  • A pessoa nº 1 indicou os graus de satisfação para cada idade:
  • Bom – bom – bom – ruim – ruim – ruim – satisfatório.

  • A pessoa nº 2 indicou os graus de satisfação para cada idade:
  • Muito bom – bom – bom – ruim – satisfatório – ruim – ruim.

  • A pessoa nº 3 indicou os graus de satisfação para cada idade:
  • Muito bom – satisfatório – bom – ruim – satisfatório – satisfatório – ruim.

  • A pessoa nº 4 indicou os graus de satisfação para cada idade:
  • Bom – bom – bom – ruim – ruim – ruim – satisfatório.

  • A pessoa nº 5 indicou os graus de satisfação para cada idade:
  • Bom – muito bom – muito bom – ruim – satisfatório – ruim – bom.

  • A pessoa nº 6 indicou os graus de satisfação para cada idade:
  • Bom – muito bom – muito bom – ruim – satisfatório – ruim – satisfatório.

Indicadores:
Muito Bom = 5
Bom = 4
Satisfatório = 2
Ruim = 1

Pessoa nº
Idade (anos)

20
25
30
40
45
50

Massa Corporal (kg)
1
50
52
52
56
56
60
2
40
50
50
60
60
50
3
42
48
58
66
70
65
4
50
50
60
62
62
62
5
60
45
48
55
55
60
6
70
70
72
80
65
65

Tendo em vista que o estudado é a Massa corporal e o Grau de satisfação para com o salário, referente à cada pessoa. Determinar as Medidas de Tendência Central e de Dispersão para cada Variável.
Proceder as análises estatísticas.



Correlação

Quando para um determinado grupo que está sendo estudado, duas variáveis estão sendo analisadas, é conveniente estabelecer a verificação da existência de Correlação entre estas, consolidando o trabalho estatístico e permitindo o procedimento de análises profissionais para tomadas de decisões.

A verificação da existência de Correlação entre duas variáveis, tecnicamente se faz, identificando uma por X e a outra por Y. A variável X não necessita seguir o padrão de Rol e a Y acompanha o seu par (não separar o par de dados). Na inserção na TDF, os dados deverão estar individualizados.

A existência de Correlação é verificada através do Coeficiente de Correlação (CC) que possui fórmula específica e a existência será identificada quando o resultado variar entre mais e menos 1,0 exclusive, e diferente de zero.

CC =  [∑xy – (∑x. ∑y)/n] / [(∑x2 – (∑x)2/n).(∑y2 – (∑y)2/n)]1/2

Para a boa aplicação dessa fórmula, deve-se trabalhar com uma tabela que possa auxiliar na conquista dos elementos a serem inseridos na fórmula, que envolve:

X
Y
F
X2
Y2
X.Y

Exemplo:

Um profissional está analisando a idade (dias) e o nº de filhos (und.) de um grupo de seis pessoas, atuantes em um setor de uma determinada empresa e, após a coleta de dados, registrou:
Idade – X
Nº Filhos - Y
(x – y)

(25 – 2) (30 – 0) (30 – 2) (25 – 2) (25 – 2) (40 – 4)


X
Y
F
X2
Y2
XY
25
2
3
1875
12
150
30
0
1
900
0
0
30
2
1
900
4
60
40
4
1
1600
16
160
∑= 175
∑= 12
∑=6
∑= 5275
∑= 32
∑= 370

CC = 0,54 (existe correlação).

Exercício 5.2
Um profissional da área administrativa do setor re roupas resolveu analisar junto aos seus clientes, uma pesquisa para verificar concomitantemente o tamanho da camisa (nº) e o índice de freqüência (X) em sua loja. Analisou junto a 30 clientes e obteve o seguinte resultado:

(2 – 2) (3 – 1) (5 – 6) (4 – 4) (4 – 2)
(4 – 8) (2 – 3) (5 – 4) (4 – 5) (4 – 2)
(2 – 2) (3 – 1) (5 – 6) (4 – 4) (4 – 2)
(4 – 8) (2 – 3) (5 – 4) (4 – 5) (4 – 2)
(2 – 2) (3 – 1) (5 – 6) (4 – 4) (4 – 2)
(4 – 8) (2 – 3) (5 – 4) (4 – 5) (4 – 2)

a) Tratar estatisticamente cada variável;
b) Qual a situação estudada que merece maior atenção?
c) Qual variável estudada indica maior regularidade?
d) Verificar se existe Correlação entre as variáveis;




Gráficos

Os resultados devem ser apresentados em forma de gráficos e estes devem estar em harmonia com o Relatório de Análise Numérica. A escolha do gráfico e do que apresentar é de fundamental importância e vem ao encontro dos anseios e gostos do profissional ou do cliente que solicitou determinado trabalho.

O gráfico deve conter cabeçalho de conter informações técnicas e identificadoras a respeito do que se apresenta.

O eixo das abscissas (x) deve estar identificado e o eixo das ordenadas (y) deve seguir o mesmo princípio.

Um gráfico de excelência, deve ser construído utilizando-se recursos computacionais. Para isto, é conveniente usar os recursos do software “Excel”.

Cabe lembrar que usar cores em gráficos exigirá permanente coloração, pois caso seja xerocopiado de forma simples, a coloração transforma-se em preto e branco e a legenda constante no gráfico perde seu efeito.


Exercício 6
Um profissional está realizando um trabalho para um laboratório, onde ele está analisando dois grupos de frutas. O primeiro grupo é composto de 4 frutas e o grupo 2 é composto de 6 frutas, onde está sendo estudado sua idade (dias) e o seu diâmetro (mm).
Ele necessita estabelecer condições satisfatórias para uma análise estatística, e para tanto, deverá calcular:
a) As MTC
b) As MD
c) Esboço de gráfico representativo
d) Verificação da existência de Correlação.


Exercício 7
Apresentar os resultados dos Exercícios 2 e 3 em forma de gráfico, fazendo das informações identificadoras que devem estar contidas, totalmente fictícias (a critério do acadêmico). O trabalho deverá ser gravado em CD (único para a turma), constando identificação nominal em letras versais.
Este exercício é em dupla.




Teste do Qui-Quadrado (K2)

Muitas vezes o profissional toma decisões em relação à população ou a amostra e externa os resultados numéricos. Visto isto, é necessário aderir ao resultado apresentado, uma margem percentual de segurança.

A margem de segurança para mais e para menos, tornando o resultado apresentado mais confiável, é executado através do teste do qui-quadrado de forma reduzida, ou seja, calculando desta forma:

K2 = (A2 – n) / (n2 . A)

Onde A é a Amplitude; n é o número de dados analisados.

Cabe ressaltar que este teste de confiabilidade variável só tem expressividade quando não ultrapassa os 7% (sete pontos percentuais para mais e para manos). Caso ultrapasse este percentual, o trabalho pode estar comprometido e merece ser reavaliado.

Exercício 8
Para e exercício proposto de nº 1, verificar a margem percentual de segurança através do teste do qui-quadrado (K2).


Teste t

As vezes é preciso comparar duas populações, por exemplo, um pesquisador obteve, para um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos ou meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Outras vezes, é necessário comparar condições experimentais, por exemplo, para saber se um tratamento tem efeito, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (grupo tratado) enquanto o outro grupo não recebe o tratamento (grupo controle), onde o efeito do tratamento é dado pela comparação dos dois grupos.

. Primeiro estabelece-se o nível de significância α que será padronizado como 5%;

. Segundo, calculam-se as médias dos dois grupos X1 e X2 ;

. Em seguida, a Variância Ponderada, de cada grupo V1 e V2;

O cálculo da Variância ponderada geral é:

V = [(n1 – 1). V12) + (n2 -1).V22] / (n1 + n2 – 2)
n = número de dados do grupo.

. Finalmente o valor do teste t é definido por:

t = (X2 – X1) / [V.(1/n1 + 1/n2)]1/2
Exemplo aplicativo

Para verificar se duas dietas para emagrecer são igualmente eficientes, um profissional separou, ao acaso, um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para seu grupo. Decorrido certo tempo, o profissional obteve a perda de peso (Kg) de cada paciente de cada grupo, onde os dados são apresentados a seguir:

Perda de peso segundo a dieta

Dieta 1
Dieta 2
12
15
8
19
15
15
13
12
10
13
12
16
14
15
11

12
13


As médias são:
X1 = 12
X2 = 15

Significância é α = 5%

A Variância de cada grupo é:

V1 = [1476 – (120)2 / 10] / 9 = 4

V2 = [1605 – (105)2 / 7] / 6 = 5

A Variância Ponderada é V = (9 . 4 + 6 . 5) / (9+6) = 4,4

O valor de t = (15 – 12) / [4,4.(1/10 + 1/7)]1/2 = 2,90 que é menor que 5% dando confiabilidade ao estudo, e, concluindo que a perda de peso é maior quando submetidos à dieta 2,  observado pela média de perdas de peso mas com a devida confiabilidade dos cálculos.

Exercício 9
Verificar através da realização do teste t a confiabilidade referente ao exercício 1..


Relatório de Análise Numérica

No Relatório, que possui a identidade crítica e criativa do executor profissional, deve constar os seguintes fatos técnicos (digitado e impresso em papel A4 ou gravado em CD para entrega):

  • Parágrafo primeiro apresentando o Relatório, ou seja, identificando o autor, a que se reporta tal trabalho e como foram procedidos os trabalhos e cálculos;

  • Parágrafo seguinte registrando os resultados das Medidas calculadas;

  • Parágrafo adiante, registrando segundo seu critério, as diferenças ou relações percentuais entre os resultados das medidas de um grupo e quando houver mais de um grupo, estabelecer relações percentuais entre as medidas de ambos;

- quando solicitado, esboçar considerações dissertativas em níveis conclusivos, mediante os resultados obtidos.


Exercício 10
Delinear o Relatório de Análise Numérica pertinentes aos resultados encontrados nos exercícios 1 e 2 fazendo no mínimo 8 analogias percentuais.

Exercício 11
Um profissional desenvolveu um trabalho, referente aos membros da comunidade de um pequeno município chamado Vaca Dourada, de 30.000 habitantes, onde o objeto de estudo o número de vezes que as pessoas fizeram uso de medicamento contra gripe, no ano de 2005. Registrou-se o seguinte:

1180 pessoas não fizeram uso de medicamento;
1320 pessoas fizeram uso duas vezes;
1200 pessoas fizeram uso três vezes;
900 pessoas fizeram uso cinco vezes;
1800 pessoas fizeram uso sete vezes;

Pede-se:
a)   A Tabela de Distribuição de Freqüência;
b)   O percentual da amostra;
c)    As Medidas de Tendência Central;
d)   As Medidas de Dispersão;
e)   O Relatório de Análise Numérica.

Regressão

Muitas vezes interessa estudar o comportamento conjunto de duas variáveis, como mostra a Correlação, outras vezes, interessa estudar como uma variável varia em função da outra. Por exemplo, considerando a questão da idade e peso de animais, deverá existir interessa em estudar como o peso varia em função da idade.

Quando se estuda a variação de uma variável Y em função de uma variável X, diz-se que Y é a variável dependente e que X é a variável explanatória, indicando que o peso é a variável dependente da idade.

A Regressão fica bem entendida quando se esboça o gráfico de dispersão com os dados coordenados no plano cartesiano. O primeiro ponto será ligado ao último ponto do gráfico e uma reta será traçada. As variações tomadas como referencial a reta, definirão as variações existentes.

Quando se deseja ajustar a angulação da reta, independente do primeiro e do último pontos, o Coeficiente Angular deverá ser calculado, mas este procedimento está em extinção, haja vista que a alteração é insignificante.

Uma outra estratégia de traçado da reta referencial para visualização analítica das variações, porém com menor precisão mas aceitável estatisticamente, é a reta nascer da origem dos eixos, numa angulação de 45º. Observe que os traçados são executados sempre no gráfico de dispersão.

Profissionalmente, o gráfico de dispersão traçado, com os registros precisamente coordenados, permite prever o fenômeno, sem que haja a necessidade do traçado da reta de regressão, mas isto exige maestria na interpretação do gráfico.


Probabilidade

A probabilidade (P) é um ramo da ciência exata, que permite ao profissional, ter uma visão das possíveis ocorrências sobre o que está sendo analisado, haja vista que se trata de cálculos que objetivam espelhar os supostos fatos.

As inferências são de extrema importância para uma projetiva do fenômeno, que deve ser plenamente conhecido, objetivando tomadas de decisões, fruto dos resultados obtidos. A Probabilidade envolve aspectos diversos, mas para a plena atuação prática do profissional, deve-se saber que:


Probabilidade Simples

Ø  é a relação entre o que se deseja e o todo do fenômeno.
Ex: uma caixa possui três insetos de cores diferentes, a P de numa retirada sair um animal de uma determinada cor é 1/3.


Probabilidade Condicional

Ø  é probabilidade de um determinado evento, condicionado a parâmetros pré-estabelecidos.
Ex: Jogado um dado, a P de sair o nº 5 sabendo-se previamente que saiu número ímpar é 1/3.


Eventos Independentes

Ø  é a condição probabilística no qual um evento estudado nada tem haver com o evento concomitante.
Ex: Um dado e uma moeda são jogados ao mesmo tempo, a P de sair cara na moeda nada tem haver com a face do dado.


Teorema do Produto

Ø  é o estudo probabilístico no qual dois fenômenos estão implicitamente ligados e a tônica do estudo é analisar a ocorrência de um “e” do outro evento.
Ex: Numa caixa onde existem quatro animais, dois escuros e dois claros,quando de duas retiradas seguidas sem reposição, a P de saírem animais de cor escura é 1/4 x 1/3.


Teorema da Soma

Ø  é o estudo probabilístico no qual dois fenômenos estão implicitamente ligados e a tônica do estudo é analisar a ocorrência de um “ou” do outro evento.

Ex: Joga-se dois dados e verifica-se a P de sair uma face 2 ou uma face 5, então, a P é 1/6 + 1/6 = 2/3.



Exercícios

12) Um profissional está numa atividade laboratorial onde existem cinco insetos de mesma espécie dentro de uma caixa vedada. Dos cinco insetos, dois são de cor clara, dois são de cor escura e um de cor mesclada. O profissional, ao proceder  as retiradas da caixa, conforme enunciado a seguir, quer saber a probabilidade de:

a) numa segunda retirada o inseto ser de cor clara, sendo que na primeira foi de cor escura (sem reposição);

b) retirar o inseto de cor mesclada na terceira retirada, sendo que nas duas primeiras, saíram os de cor escura (sem reposição);

c) na primeira retirada, sair o inseto de cor mesclada;

d) em três retiradas, sair o inseto de cor mesclada, sendo que em cada retirada houve reposição;

e) na segunda retirada, com reposição, sair um de cor escura, dado que na primeira retirada é sabido que saiu de cor clara.

13) Uma carta é retirada ao acaso de um baralho. Qual a probabilidade de sair uma carta de ouros ou uma dama?

13.1) Duas cartas são retiradas simultaneamente de um baralho e deseja-se saber a Probabilidade de terem saído uma carta de ouros e uma de paus.

14) Um casal tem três filhos. Qual a probabilidade de:
a) o primogênito ser homem;
b) o segundo filho ser homem;
c) o terceiro filho ser homem, dado que o primeiro é homem;
d) os três filhos serem homens;
e) dois filhos serem do sexo feminino;
f) pelo menos um dos filhos ser do sexo feminino.

15) Um profissional de uma empresa, é brindado com um teste e com direito ao ganho do prêmio a ser retirado, pois o mesmo atuou de forma exemplar na preservação de nosso meio ambiente. Trata-se de um baú onde estão oito envelopes onde três contém notas de 5 reais, dois contém notas de 100 reais, um contém cheque de 1000 reais e dois contém cheque de 5000 reais. Qual a probabilidade de:

a) numa segunda retirada, sem reposição, sair o envelope contendo 5000 reais, sendo que na primeira retirada saiu o envelope contendo 1000 reais;

b) numa retirada de dois envelopes ao mesmo tempo, sair o envelope contendo 100 reais ou o contendo 5000 reais;

c) numa terceira retirada sair o envelope contendo 5 reais, sendo que na primeira saiu o de 1000 reais e foi reposto e na segunda saiu o de 5000 reais e não houve reposição.

Prof. Dr. Eric Ricardo Calhau de Castro
  • Graduado em Engenheira Civil – Eng. de Produção – Matemática - Administração
  • Pós-Doutor em Administração de Negócios
  • Doutor em Administração
  • Mestre em Administração Educacional Superior
  • Especialista em Docência Superior
e-mail: eric.fasf@uol.com.br
site: er261.sites.uol.com.br