2010-12-29 10 views
9

Come si dimostra che un RNG è migliore di un altro?Come dimostrare un generatore di numeri casuali è meglio di un altro?

Non intendo in termini di tempo di esecuzione, ma piuttosto la quantità di entropia "generata" - che inoltre introduce la nozione di periodicità (periodo basso = bassa entropia).

È possibile garantire un RNG ottimale? O è un obiettivo irraggiungibile? Per ottimale, voglio dire qualsiasi sequenza è ugualmente probabile e indipendente da risultati passati o futuri.

Mi interessa algoritmi, non dispositivi di campionamento cosmica di fondo o di altre fonti di "casualità" fisico (è casuale o semplicemente complessa?)

+1

Sono abbastanza sicuro che non ci sia modo di dimostrare la casualità "ottimale". – Gabe

+0

http://en.wikipedia.org/wiki/Statistical_randomness#Tests –

+2

NIST fornisce documentazione e software per testare la casualità degli RNG: http://csrc.nist.gov/groups/ST/toolkit/rng/index.html. Il documento è qui e descrive 15 diversi test RNG: http://csrc.nist.gov/groups/ST/toolkit/rng/documents/SP800-22rev1a.pdf – indiv

risposta

3

Il vecchio standard per i test usati essere i "test duri". http://en.wikipedia.org/wiki/Diehard_tests Questo è stato sostituito dai test NIST che DKnight ha rilevato: http://csrc.nist.gov/groups/ST/toolkit/rng/index.html. L'articolo wiki di Diehard offre una buona panoramica del tipo di cose che vengono guardate. Il bit NIST richiederà un po 'più di scavo.

Come si afferma, nessun pseudo RNG (algoritmo) può essere dimostrato ottimale. Hanno tutti un valore iniziale e dipendono dall'input per generare un valore. Se conosci il seme e lo stato, conosci il prossimo valore. Ad esempio, controlla http://en.wikipedia.org/wiki/Mersenne_twister. Mi piace soprattutto per il nome fantastico, ma l'articolo fa un buon lavoro spiegando i principi di un PRNG.

0

Generare sequenze di numeri e quindi provare a comprimerli. Quelli più casuali comprimono meno. La casualità pura è incomprimibile. Sarebbe interessante vedere i risultati e se ci saranno differenze.

+3

Dipenderebbe molto dall'algoritmo di compressione. Sospetto che la maggior parte degli algoritmi di compressione non siano abbastanza "intelligenti" da comprimere anche sequenze di numeri casuali. D'altra parte, è facile comprimere molte sequenze completamente casuali. Le cifre in pi sono considerate casuali, tuttavia è banale "comprimere" questa sequenza. – pafcu

+0

Vedere la risposta di @ marcog. Chi può dire che in 1.000.000 di tiri ottenendo 1.000.000 di 4 è meno casuale di qualsiasi altro risultato. Meno * probabili * risultati non significano meno * random * – asawyer

+2

@asawyer True. Ma suppongo che qualsiasi test di casualità ti dia un brutto risultato se presentato a 10^6 numeri uguali ...: D –

3

Esiste una definizione oggettiva dalla teoria della complessità computazionale: la complessità temporale asintotica richiesta per distinguere l'output dai dati casuali.

Un buon PRNG dovrebbe costringere un addetto a spendere molto più tempo all'aumentare della dimensione del seme o al crescere del livello di certezza richiesto. (Con semi di dimensione fissa suppongo che ci si guarda al tempo di funzionamento reale così come la complessità del programma.)

  • per il confronto di un PRNG contro un altro, quello con un/discriminante più veloce più piccolo è peggio.
  • Un'ipotesi comune, anche se non è stata dimostrata, è che alcuni PRNG sono indistinguibili dal tempo casuale in polinomio. Questo è un possibile significato per "ottimale".
  • I test statistici, come lo diehard tests, sono solo dei semplici riconoscitori.
1

Le basi sono in Knuth, The Art of Computer Programming Vol. 2, "Algoritmi seminali".L'idea è di escogitare test di casualità in cui ogni test cercherà di trovare aspetti non casuali di un PRNG. Si noti che ciò che potrebbe sembrare casuale per un essere umano non lo è. Ad esempio, tendiamo a dire che la sequenza "1,4,4,1" per esempio non è casuale, mentre può accadere perfettamente su una sequenza casuale più ampia.

Così l'approccio è più o meno:

  • Trova diversi test per casualità, questo è essenzialmente gruppi di test DieHard e NIST.
  • Eseguire detti test sul PRNG.
  • Se il PRNG fallisce uno o più test, può essere percepito come un PRNG più debole di quelli che sopravvivono.

Un bell'esempio di test è l'analisi dello spazio delle fasi. Ecco un link di esso eseguito alcuni anni fa su generatori di casualità TCP per diversi sistemi operativi:

http://lcamtuf.coredump.cx/oldtcp/tcpseq.html

Altri test classici sono chi-quadrato, Komolgorov-Smirnoff, ecc, tutto spiegato in Knuth. I buoni PRNG sopravvivono a qualsiasi attacco immaginabile contro di loro.