[Linux-bruxelles] Re: [Linux-bruxelles] [OT] formule de calcul de droites de régression

Marc Heerbrant mrheerbrant at compuserve.com
Sam 20 Juil 12:03:54 CEST 2002


Il y a apparemment plein d'outils statistiques créés pour LINUX. J'ai fait
un très court survol via Google: quelques infos ci-dessous.

Calcul statistique
Du côté statistique, à part le tableur StarCalc de StarOffice offrant toute
une gamme de fonctions statistique à la Excel, on retrouve des outils du
même genre que MathLab et SPSS.


RLab http://rlab.sourceforge.net/ (version courante 2.1) est un langage de
haut-niveau comparable à Matlab.
PSPP (version courante 0.2.0) http://www.gnu.org/software/pspp/pspp.htmlest
une version libre du célèbre outils statistique SPSS.
R http://www.ci.tuwien.ac.at/R/ (version courant 1.0) est la version libre
du langage S (http://lib.stat.cmu.edu/S/)
SciLab http://www-rocq.inria.fr/scilab/ (version courante 2.5) est outils
ressemblant à MatLab.

Comment se procurer Scilab ?Si vous avez un accès à Internet avec un débit
raisonnable, vous pouvez télécharger Scilab depuis son site à l'Inria :
http://www-rocq.inria.fr/scilab
Sachez que la version binaire, une fois installée fait environ 25 Mégas et
que la version compressée .tgz du source environ 7 Mégas (le rpm fait lui
environ 6 Mégas). Scilab est aussi distribué sur le CD-Rom des logiciels
libres à l'INRIA Rocquencourt. On peut obtenir gratuitement ce CD-Rom en
écrivant à :
        INRIA - SICS Diffusion
        Distribution de Scilab
     Domaine de Voluceau, B.P. 105
        78153 Le Chesnay CEDEX

Il vous faut alors fournir une enveloppe (appropriée à contenir un CD-ROM)
portant vos nom et adresse, et 4 timbres français au tarif lettre (ou un
coupon-réponse international).

Source:
http://www.saphir-control.fr/articles/lm12/linux-journal.html






Marc HEERBRANT
                E-mail : mrheerbrant at compuserve.com ou
marc_heerbrant at hotmail.com


----- Message d'origine -----
De : <jeanchristophe.beumier at wanadoo.be>
À : <linux-bruxelles at lists.bxlug.be>
Envoyé : vendredi 19 juillet 2002 23:16
Objet : Re: [Linux-bruxelles] [OT] formule de calcul de droites de
régression




(Corrige mais n'annule pas le précédent)

La droite de régression a pour formule:

y= moy(y) + covar(x,y)/var(x)*( x-moy(x) )

Je m'étais donc trompé dans la fraction.

pour ce qui suit,
moy(x) est la moyenne des x, (x barre)
var(x) est la variance (s carré indice x)
cov(x,y) est la covaraince en x-y (s indice xy)

Bon amusement.

Jean-Christophe


Surlignage jeanchristophe.beumier at wanadoo.be:

>
> Oui, à travers un nuage de points, il est possible de tracer une droite
qui
>
> minimise les distances de ces points à cette droite. C'est ce que l'on
> appelle
> la droite de régression. Je rentre chez moi vers minuit, et je recopierai
la
>
> formule avec les moyens du bord, parce qu'il est question de sigma (ce S
grec
>
> en forme de E), de variance et de covariance.
>
> Ca ressemble à: Y- moy(y) = Var(X)/covar(x,y) (X - moy(x) ) (attention:
pas
>
> sûr!)
>
> Evidemment, il faut savoir calculer la variance et la covariance.
>
> La variance d'une variable est la somme des carrés de la distance de
chaque
>
> valeur à la moyenne, divisé par le nombre d'observations.
>
> soit sigma (xi - moy(x) )^2 /n, xi prenant toutes les valeurs de la
> distribution (SuSE, RedHat, ou Debian? question de goût).
>
> Si tu as une distribution 4, 5, 6, 7 et 8
> la moyenne est (4+5+6+7+8)/5, ce qui fera 30/5 = 6
>
> La variance se calcule comme suit:
>
> ( (4-6)^2 + (5-6)^2 +(6-6)^2 + (7-6)^2 + (8-6)^2 )/5, soit
>
> (4 + 1 + 0 + 1 + 4) /5= 10/5 = 2 (ça tombe bien: c'est fait exprès)
>
>
> Si j'ai bon souvenir, la covariance, c'est quasi la même chose:
>
> sigma ( xi - moy(x) )* ( yi-moy(y) ) /n
>
> ou xi et yi balaient la série de coordonnées des points.
>
> Cette formule se simplifie en
>
> sigma (xi*yi)/n - moy(x)*moy(y).
>
>
> A tout à l'heure pour la formule finale.
>
>
> Jean-Christophe
>
>
>
>
> Surlignage Jerome Warnier <jwarnier at bxlug.be>:
>
> > Pour le TFE de Manu, elle a besoin de calculer la formule y = ax + b
> > d'une droite de régression déterminée depuis ses données.
> >
> > Il doit forcément y avoir un moyen mathématique de la calculer, mais
> > cela a dû se perdre dans les méandres (ô combien tordues!) de ma
mémoire.
> >
> > (Nous avons donc évidemment besoin de la pente de cette droite et de son
> > ordonnée à l'origine)
> >
> > Est-ce que quelqu'un pourrait nous aider à déterminer cette formule sur
> > base de ses données?
> >
> > Merci d'avance
> >
> >
> >
> > _______________________________________________
> > Linux-bruxelles mailing list
> > Linux-bruxelles at lists.bxlug.be
> > http://www.bxlug.be/mailman/listinfo/linux-bruxelles
> >
>
> _______________________________________________
> Linux-bruxelles mailing list
> Linux-bruxelles at lists.bxlug.be
> http://www.bxlug.be/mailman/listinfo/linux-bruxelles
>

_______________________________________________
Linux-bruxelles mailing list
Linux-bruxelles at lists.bxlug.be
http://www.bxlug.be/mailman/listinfo/linux-bruxelles





Plus d'informations sur la liste de diffusion Linux-bruxelles