Re: [Linux-bruxelles] vérification des sites

Gildas COTOMALE gildas.cotomale at gmail.com
Dim 13 Nov 19:08:44 CET 2005


Salut.

J'ai jetter un coup d'oeil à la structure de la table sql. Quelques
points m'interpellent :

* pourquoi limiter l'url à 250 caractères alors qu'on n'est même pas
sûr que les 255 soient suffisant...?
Jette un coup d'oeil à cette discution :
<http://lists.evolt.org/archive/Week-of-Mon-20010528/033585.html> (on
doit pouvoir accepter jusqu'à 255 octets et plus si on ne tient pas
compte de la rétro-compatibilité... <http://ez.no/bugs/view/7186>, )
references utiles:
<http://httpd.apache.org/docs-2.0/mod/core.html#limitrequestline
> et <http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html>

* tous tes "CHAR" gagneraient à être remplacé par des "VARCHAR" : pour
plus de 4 caractères, c'est plus efficace... et les CHARs n'ont pas de
sens ici puisque la longueur de l'URL et le nom du site varient de
l'un à l'autre...
references : <http://dev.mysql.com/doc/refman/5.0/en/char.html> ou
<http://dev.mysql.com/doc/refman/5.0/fr/char.html> et
<http://pgsql.digipedia.pl/pgsql/datatype-character.html>

* Une DTD comme <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"DTD/xhtml1-strict.dtd"> fait bien plus de 50 caractères :) Mais je ne
pense pas qu'on dépasse la centaine... (quoique, avec l'URI complet...
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> ...)
Bon, les valeurs utiles peuvent se trouver un peu partout :
<http://www.alistapart.com/stories/doctype/> et en particulier sur le
site du W3C.

* Pour les jeux de caractères, déclaré en même temps que le type MIME
du fichier, je ne crois pas qu'il faille compter plus d'une vingtaine
de caractères... Les RFCs à consulter sont indiqué sur le site de
ressources : <Content-Type: text/html; charset=EUC-JP> (mais j'aime
bien aussi <http://www.unicode.org/faq/unicode_web.html> )

* Pour la taille totale et la taille utile, si tu comptes en octets ou
en caractères, tu peux utiliser des INTs ou -au pire- BIGINTs. Sinon
tu as le choix entre DEC (pour un calcul précis avec une mantisse
connue et un nombre précis de décimales) et FLOAT (ou REAL)...

* Petites question avant de clore:
quelle est la dfférence entre "commentaire" (commentaire ?) et
"divers" (remarque ?) -tant qu'à faire, VARCHAR(255) si c'est court,
sinon TEXT...
"tidy" est-ce pour le nombre d'erreurs (INT) ou le message (TEXT) Tidy..?
"link" est-ce pour le nombre d'erreurs (INT) ou le message (TEXT) CheckLink..?

* Dans la version finale, il serait bien que les "url" soient UNIQUE
et si la base grossit (plus de 100, 300, ?), chose que nous espérons
tous, que les les noms de site et les nombre d'erreurs soint indexé
(je suppose que c'est là dessus qu'on fera le plus
d'interrogations...)


my 0.2c

--
Linux est convivial, il sait faire le choix entre ce qui est con et ce
qui est valable...




Plus d'informations sur la liste de diffusion Linux-bruxelles