terça-feira, 5 de outubro de 2010

Regressão

Regressão é uma técnica que permite explorar e inferir a relação de uma variável dependente (variável de resposta) com variáveis independentes específicas (variáveis explicatórias). A análise da regressão pode ser usada como um método descritivo da análise de dados (como, por exemplo, o ajustamento de curvas) sem serem necessárias quaisquer suposições acerca dos processos que permitiram gerar os dados. Regressão designa também uma equação matemática que descreva a relação entre duas ou mais variáveis.


Regressão linear

Em estatística ou Econometria, regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.
A regressão, em geral, trata da questão de se estimar um valor condicional esperado. A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear.

Exemplo de regressão linear.

Variância populacional e amostral

Na teoria da probabilidade e na estatística, a variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe em geral os seus valores se encontram do valor esperado.


Em estatística, o conceito de variância também pode ser usado para descrever um conjunto de observações. Quando o conjunto das observações é uma população, é chamada de variância da população. Se o conjunto das observações é (apenas) uma amostra estatística, chamamos-lhe de variância amostral (ou variância da amostra).
A variância da população yi onde i = 1, 2, ...., N é dada por
\sigma^2 = \frac{1}{N} \sum_{i=1}^N
 \left( y_i - \mu \right) ^ 2,
onde μ é a média da população. Na prática, quando lidando com grandes populações, é quase sempre impossível achar o valor exacto da variância da população, devido ao tempo, custo e outras restrições aos recursos.
Um método comum de estimar a variância da população é através da tomada de amostras. Quando estimando a variância da população usando n amostras aleatórias xi onde i = 1, 2, ..., n, a fórmula seguinte é um estimador não enviesado:
s^2 = \frac{1}{n-1} \sum_{i=1}^n
 \left( x_i - \overline{x} \right) ^ 2,
onde \overline{x} é a média da amostra.
Notar que o denominador n-1 acima contrasta com a equação para a variância da população. Uma fonte de confusão comum é que o termo variância da amostra e a notação s2 pode referir-se quer ao estimador não enviesado da variância da população acima como também àquilo que é em termos estritos, a variância da amostra, calculada usando n em vez de n-1.
Intuitivamente, o cálculo da variância pela divisão por n em vez de n-1 dá uma subestimativa da variância da população. Isto porque usamos a média da amostra \overline{x} como uma estimativa da média da população μ, o que não conhecemos. Na prática, porém, para grandes n, esta distinção é geralmente muito pequena.

Pouca vergonha!

Medidas de dispersão: variância e desvio-padrão

 Medidas de dispersãoUm aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a principal medida de dispersão.


 Variância Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um.

 


Desvio-padrão
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são: o desvio padrão será maior, quanta mais variabilidade houver entre os dados.

Será!

Mediana

mediana é uma medida de tendência central, um número que caracteriza as observações de uma determinada variável de tal forma que este número (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, população ou distribuição de probabilidade, da metade superior. Mais concretamente, 1/2 da população terá valores inferiores ou iguais à mediana e 1/2 da população terá valores superiores ou iguais à mediana.
A mediana pode ser calculada para um conjunto de observações ou para funções de distribuição de probabilidade.


Cálculo da mediana para dados ordenados:
No caso de dados ordenados de amostras de tamanho n, se n for ímpar, a mediana será o elemento central \frac{(n+1)}{2}. Se n for par, a mediana será o resultado da média simples entre os elementos \frac{n}{2} e \frac{n}{2}+1.

 Exemplos

Para a seguinte população:
1, 3, 5, 7, 9
A mediana é 5 (igual à média)
No entanto, para a população:
1, 2, 4, 10, 13
A mediana é 4 (enquanto a média é 6)
Para populações pares:
1, 2, 4, 7, 9, 10
A mediana é (4+7)/2, que é 5.5.

Cálculo da mediana para dados classificados

Quando se trata de um conjunto de dados classificados, o cálculo da mediana é feito através do histograma, ou através da função cumulativa de frequências relativas. A mediana é o ponto do eixo das abcissas correspondente a 50% da frequência relativa acumulada.
No caso de variáveis contínuas, a mediana é calculada pela solução da equação \int_{-\infty}^m f(x) dx  = \frac{1}{2}\, ou, equivalentemente, \int_{m}^{\infty} f(x) dx = \frac{1}{2}\,.
No caso de variáveis discretas, e quando as frequências estão calculadas por unidade, a mediana é o ponto do eixo das abcissas para o qual a frequência relativa acumulada é inferior ou igual a 50% e superior ou igual a 50% para o ponto imediatamente a seguir.

Moda em estatística

Em estatística descritiva, a moda é o valor que detém o maior número de observações, ou seja, o valor ou valores mais frequentes. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não ser bem definidas.
A moda de {maçã, banana, laranja, laranja, laranja, pêssego} é laranja.
A série {1, 3, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.
A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda. Bimodal: possui dois valores modais Amodal: não possui moda.

sexta-feira, 3 de setembro de 2010

Para refletir

Era uma vez, um sábio chinês e o seu discípulo. Nas suas andanças, avistaram uma quinta de extrema pobreza, onde vivia um homem, uma mulher, 3 filhos pequenos e uma vaquinha magra e cansada.

Com muita fome e sede, o sábio e seu discípulo pediram abrigo, sendo bem recebidos. A dada altura, o sábio perguntou como conseguiam sobreviver na pobreza e longe de tudo.
- O senhor vê aquela vaca? - disse o homem. Dela tiramos todo o nosso sustento. Ela nos dá leite que bebemos, e transformamos em queijo e coalhada. Quando existem sobras, vamos à cidade aqui perto, e trocamos por outros alimentos que precisamos. É assim que vivemos!
O sábio agradeceu por tudo, e partiu com o discípulo. Nem fizeram a primeira curva, e disse ao discípulo:
- Volte lá, leve a vaquinha ao precipício, ali em frente, e atire-a lá para baixo!
O discípulo nem estava acreditar no que estava a ouvir, e logo disse:
- Não posso fazer isso, mestre! Como pode ser tão ingrato? A vaquinha é tudo o que eles têm. Se a vaca morrer, eles morrem também!
O sábio, como convém aos sábios chineses, apenas respirou fundo e repetiu a ordem:
- Vá lá e empurre a vaquinha!
Indignado e contrariado, o discípulo assim o fez. A vaca, previsivelmente, estalou-se lá embaixo.
Alguns anos se passaram e o discípulo sempre com remorsos. Num certo dia, moído pela culpa, abandonou o sábio e decidiu voltar àquele lugar. Queria pedir desculpas, e ajudar essa família no que podia.
Ao fazer a curva da estrada, não acreditou no que seus olhos viram. No lugar da quintinha desmazelada havia um sítio maravilhoso, com árvores, piscina, carro importando, antena parabólica. Perto da churrasqueira, adolescentes, lindos, robustos comemorando com os pais a conquista do primeiro milhão. O coração do discípulo gelou. Decerto, vencidos pela fome, foram obrigados a vender o terreno e ir embora - pensou ele!
Devem estar mendigando na rua ou talvez já estejam mortos, pensou o discípulo.
Aproximou-se do caseiro e perguntou se ele sabia o paradeiro da família que havia morado lá.
- Claro que sei. Você está olhando para ela.
Incrédulo, o discípulo afastou o portão, deu alguns passos e reconheceu o mesmo homem de antes, só que mais forte, altivo, a mulher mais feliz e as crianças, jovens saudáveis. Espantado, dirigiu-se ao homem e disse:
- Mas o que aconteceu ? Estive aqui com o meu mestre há alguns anos atrás e era um lugar miserável, não havia nada. O que o senhor fez para melhorar de vida em tão pouco tempo ?
O homem olhou para o discípulo, sorriu e respondeu:
- Nós tínhamos uma vaquinha, de onde tirávamos todo o nosso sustento. Era tudo o que possuíamos, mas um dia ela caiu no precipício e morreu. Para sobreviver, tivemos que fazer outras coisas, desenvolver habilidades que nem sabíamos que tínhamos. E foi assim, buscando novas soluções, que hoje estamos muito melhor que antes.

Interessante como muitas vezes não conseguimos enxergar nem um palmo a frente do nariz...
Bom fim de semana aq todos!!!!!!!!!

terça-feira, 10 de agosto de 2010

Falando um pouco sobre médias

Média Aritmética


A média aritmética simples é a mais utilizada no nosso dia-a-dia. É obtida dividindo-se a soma das observações pelo número delas.
Exemplo:

• Um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A sua média será (5 + 7 + 9 + 10) / 4 = 7.75


Média Aritmética Ponderada:

Neste tipo de média aritmética, cada número que fará parte da média terá um peso. Este peso será multiplicado pelo número, que serão somados e dividos depois pela soma dos pesos. Veja o exemplo: 

• Um aluno fez um teste (peso 1) e uma prova (peso 2), tirando 10 no teste e 4 na prova. A sua média (ponderada) será (10 x 1 + 4 x 2) / (1 + 2). Teríamos então: (10 + 8) / 3. Logo, o resultado da média aritmética ponderada para este exemplo é: 6. Se o teste e a prova tivessem mesmo peso (e não importa qual o valor do peso, importa apenas a relação entre os pesos), a média ponderada aritmética seria sempre 7. Isto é, se o aluno fizesse um teste (peso 3) e uma prova (peso 3) obtendo respectivamente a mesma pontuação anterior (10 e 4), teríamos: (10 x 3 + 4 x 3) / (3 + 3). Continuando: (30 + 12) / 6. O resultado para pesos iguais será sempre: "7". Veja: (30 + 12) / 6 = 7.


Média Geométrica
Este tipo de média é calculada multiplicando-se todos os valores e extraindo-se a raiz de índice n deste produto.Digamos que tenhamos os números 4, 6 e 9, para obtermos o valor médio aritmético deste conjunto, multiplicamos os elementos e obtemos o produto 216. Pegamos então este produto e extraímos a sua raiz cúbica, chegando ao valor médio 6.
Extraímos a raiz cúbica, pois o conjunto é composto de 3 elementos. Se fossem n elementos, extrairíamos a raiz de índice n.


Média Harmônica
 

A média harmônica equivale ao inverso da média aritmética dos inversos de n valores.
• Média harmônica entre 2, 6 e 8. Primeiramente é necessário calcular a média aritmética dos inversos dos valores dados:








Depois, faz-se o inverso do resultado, tendo finalmente a média harmônica de 2, 6 e 8:


 
• Em todas as médias o resultado estará entre o maior e o menor número dado.

Para os mesmos valores, a média aritmética terá o maior valor, seguida da média geométrica e depois a média harmônica.


http://www.infoescola.com/matematica/medias-aritmetica-geometrica-harmonica/


Para descontrair.....

A a estatística das coisas.....

E o que vem a ser Estatística?

"Ciência que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar conjuntos de dados"
Ou seja, em outras palavras menos complicadas....é mais ou menos como você recolher informações sobre um determinado assunto, e depois de algumas etapas como, organizar, classificar, etc... essas informações transforma-las em algo que você possa comparar e analisar, por exemplo por meio de um gráfico.

Num primeiro momento nós teríamos a estatística descritiva que seria usada para descrever e estudar uma amostra.

Por exemplo:





Ou seja...talvez se ele conhecesse essa estatística não tivesse sido assaltado...rsrsrs

Mas enfim, eis aí um tipo de aplicação, poderia se pegar os dados que algum orgão de polícia tivesse sobre esses assaltos e transformaríamos em dados para que se podesse construir um gráfico por exemplo e teríamos essa porcentagem de quantos assaltos acontecem em média depois de datas comemorativas, como dia dos pais ou mães por exemplo.

segunda-feira, 9 de agosto de 2010

Que coisas?

O início.

Estatística das coisas...que coisas?

De tudo meu povo.....

A estatística das coisas, dos outros, da facul, do mundo e principalmente das aulas, conclusões e esquisitices do meu (louco) professor de que? Adivinha.....

Enfim, somos um grupo da Faculdade dos Guararapes, Jaboatão, turma 4NC do curso de ADM, e o nosso professor (O louco!!!) fez a pedida de um blog com nossa vista da cadeira de estatística e algumas percepções a mais, seja da cadeira, da vida e das coisas...

Enfim....Vamos lá!!!!!

Afinal....como diz ele...(O louco)...vamos viajar!!!!!