N-PN White-Hat Project
validation d'une saisie utilisateur avec wildcard autorisé - Version imprimable

+- N-PN White-Hat Project (https://dev.n-pn.fr/forum)
+-- Forum : Questions (https://dev.n-pn.fr/forum/forumdisplay.php?fid=11)
+--- Forum : Question diverses (https://dev.n-pn.fr/forum/forumdisplay.php?fid=30)
+--- Sujet : validation d'une saisie utilisateur avec wildcard autorisé (/showthread.php?tid=3802)



validation d'une saisie utilisateur avec wildcard autorisé - gruik - 11-01-2015

dans un script je check un paramètre utilisateur, lequel paramètre est censé être une adresse IP plus ou moins complète avec éventuellement un (unique) wildcard
le wildcard c'est classiquement l'astérisque '*', et on ne cherche *pas* à vérifier que chaque nombre composant l'IP est dans l'intervalle qui convient [0-255], on se contente de valider que le nombre comporte au maximum 3 chiffres significatifs (donc [0-999])

du coup les saisies suivantes sont correctes :
Code :
1.1.1.1
1.1.1.*
712.999.*
*
*.5.18.3
*.817

tandis que les saisies suivantes sont invalides :
Code :
*.*
5.*.*.*
*.940.*
**
1.2.3.4.5
1.2.*.4  <-- le wildcard ne peut etre qu'au debut ou a la fin
1.2.3.
1.2

voila et je cherche à valider ça à travers une regex, évidement Big Grin


RE: validation d'une saisie utilisateur avec wildcard autorisé - Yttrium - 20-01-2015

Alors je ne sais pas si je vais t'aider avec ce que je vais dire, mais au pire, ça servira juste a rien Wink

Théoriquement tu peux faire une condition :

(?(?=regex)then|else)

Donc un truc du style (? (?=\*) *.[0-999].[0-999].[0-999] | [0-999].[0-999].[0-999].[*0-999])

Mais vu que je suis une bille en regex, je sais que la mienne ne fonctionne pas, mais l'idée est peut être intéressante ? ou totalement con x)


RE: validation d'une saisie utilisateur avec wildcard autorisé - gruik - 20-01-2015

oui en fait je pense qu'il faut découper en 3 cas distincts
- la chaine contient un wildcard au debut
- la chaine ne contient pas de wildcard
- la chaine contient un wildcard à la fin

chaque cas séparé effectivement par un |, ça fait un truc un peu à rallonge mais bon

la chaine contient un wildcard au début : ^\*(?:\.[0-9]{1,3}){0,3}$
la chaine ne contient pas de wildcard : ^[0-9]{1,3}(?:\.[0-9]{1,3}){3}$
la chaine contient un wildcard à la fin : ^(?:[0-9]{1,3}\.){0,3}\*$

donc la regex complète serait un truc du genre :
^\*(?:\.[0-9]{1,3}){0,3}$|^[0-9]{1,3}(?:\.[0-9]{1,3}){3}$|^(?:[0-9]{1,3}\.){0,3}\*$

la vérification :
Code BASH :
$ cat vrai
1.1.1.1
1.1.1.*
712.999.*
*
*.5.18.3
*.817
$ diff -s vrai <(grep -P '^\*(?:\.[0-9]{1,3}){0,3}$|^[0-9]{1,3}(?:\.[0-9]{1,3}){3}$|^(?:[0-9]{1,3}\.){0,3}\*$' vrai)
Les fichiers vrai et /dev/fd/63 sont identiques
$ cat faux
*.*
5.*.*.*
*.940.*
**
1.2.3.4.5
1.2.*.4
1.2.3.
1.2
$ grep -P '^\*(?:\.[0-9]{1,3}){0,3}$|^[0-9]{1,3}(?:\.[0-9]{1,3}){3}$|^(?:[0-9]{1,3}\.){0,3}\*$' faux || echo "no match"
no match



RE: validation d'une saisie utilisateur avec wildcard autorisé - b0fh - 20-01-2015

Hello,

Je te propose la regex suivante, de longueur a peu près comparable:

Code :
~$ grep -P '^\*(?:\.\d{1,3}){0,3}$|^\d{1,3}\.(?:\*|\d{1,3}\.(?:\*|\d{1,3}\.(?:\*|\d{1,3})))$' <<TEST
1.1.1.1
1.1.1.*
712.999.*
*
*.5.18.3    
*.817
*.*
5.*.*.*
*.940.*
**
1.2.3.4.5
1.2.*.4
1.2.3.
1.2
TEST

Donne

Code :
1.1.1.1
1.1.1.*
712.999.*
*
*.817

J'ai gagné un peu d'espace en remplaçant [0-9] par \d, j'en ai un peu perdu en fusionnant tes cas 2 et 3 et en développant les branches à la main. Ceci permet d'éviter trop de backtracking. Dans le cas le plus marqué, on observe un gain de 40% (mais sûrement beaucoup moins sur un cas moyen)

Code :
$ export RE_GRUIK='^\*(?:\.[0-9]{1,3}){0,3}$|^[0-9]{1,3}(?:\.[0-9]{1,3}){3}$|^(?:[0-9]{1,3}\.){0,3}\*$'
$ export RE_MAC='^\*(?:\.\d{1,3}){0,3}$|^\d{1,3}\.(?:\*|\d{1,3}\.(?:\*|\d{1,3}\.(?:\*|\d{1,3})))$'
$ yes '999.999.999.*' |head -n 6553600 >prout
$ time grep -P $RE_GRUIK prout >/dev/null

real    0m4.521s
user    0m4.497s
sys    0m0.024s
$ time grep -P $RE_MAC prout >/dev/null

real    0m2.567s
user    0m2.545s
sys    0m0.020s