2010-08-13 7 views
8

Data un'espressione regolare, mi piacerebbe generare dati casuali x numero di volte per testare qualcosa.Esiste una lib per generare dati in base a un regexp? (Python o altro)

ad es.

>>> print generate_date('\d{2,3}') 
13 
>>> print generate_date('\d{2,3}') 
422 

Ovviamente l'obiettivo è di fare qualcosa di un po 'più complicato di quello di numeri di telefono e indirizzi e-mail.

Esiste qualcosa del genere? Se lo fa, esiste per Python? Se no, qualche indizio/teoria che potrei usare per farlo?

risposta

7

Pyparsing include this regex inverter, che restituisce un generatore di tutte le permutazioni per semplici espressioni regolari. Ecco alcuni dei casi di test da quel modulo:

[A-C]{2}\d{2} 
@|TH[12] 
@(@|TH[12])? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))? 
(([ECMP]|HA|AK)[SD]|HS)T 
[A-CV]{2} 
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr] 
(a|b)|(x|y) 

Edit:

di fare la vostra selezione casuale, creare una lista (una volta!) Dei vostri permutazioni, e quindi chiamare random.choice sulla lista ogni volta che vuoi una stringa casuale che corrisponde alla regex, qualcosa del genere (non testata):

class RandomString(object): 
    def __init__(self, regex): 
     self.possible_strings = list(invRegex.invert(regex)) 
    def random_string(self): 
     return random.choice(self.possible_strings) 
+0

+1 È fantastico! – katrielalex

+0

Quasi quello che sto cercando. +1 –

+0

Ho anche impacchettato questo modulo come utility su UtilityMill: http://utilitymill.com/utility/Regex_inverter. Tutte le utilità di messaggistica unificata espongono le API XML e JSON, quindi è possibile richiamarle in remoto dal proprio codice e UtilityMill esegue l'elaborazione di inversione regex. – PaulMcG

2

There is a post sulla mailing list Python su un modulo che genera tutte le permutazioni di una regex. Non sono così sicuro di come potresti andare a randomizzarlo però. Continuerò a controllare.

+0

+1 perché lo hai cercato. –

+0

@ e-satis - L'ho trovato da qualche altra parte su SO :) – detly

1

Sarò probabilmente frustato per suggerire questo, ma perl ha un modulo che fa esattamente questo. Si potrebbe voler dare un'occhiata al codice come implementarlo in python:

http://p3rl.org/String::Random

+0

SO non ha ancora un pulsante [frusta], quindi sei al sicuro. – detly

+0

È interessante sapere che esiste, almeno perl. +1 –