Come scegliere un oggetto in base alla sua probabilità?

27

Quindi, con ogni elemento memorizzare un numero che segna la sua relativa probabilità, ad esempio, se si dispone di 3 articoli si dovrebbe essere due volte più probabilità di essere selezionato come uno degli altri due allora la vostra lista avrà:

[{A,1},{B,1},{C,2}]

Quindi sommare i numeri della lista (cioè 4 nel nostro caso). Ora generare un numero casuale e scegliere quell'indice. int index = rand.nextInt (4); restituisce il numero tale che l'indice si trova nell'intervallo corretto.

codice Java:

class Item { 
    int relativeProb; 
    String name; 

    //Getters Setters and Constructor 
} 

... 

class RandomSelector { 
    List<Item> items = new List(); 
    Random rand = new Random(); 
    int totalSum = 0; 

    RandomSelector() { 
     for(Item item : items) { 
      totalSum = totalSum + item.relativeProb; 
     } 
    } 

    public Item getRandom() { 

     int index = rand.nextInt(totalSum); 
     int sum = 0; 
     int i=0; 
     while(sum < index) { 
      sum = sum + items.get(i++).relativeProb; 
     } 
     return items.get(Math.max(0,i-1)); 
    } 
}

fonte

2012-02-17 15:02:18

+1

grazie Usman. ma mi chiedo se dovrei prendere l'articolo i-esimo o (i-1) l'articolo? Voglio dire items.get (i-1) invece di items.get (i) – Ruzanna

+0

i-1 buon punto. –

+2

Qui 'p' è un numero casuale, quindi come possiamo dire che la maggior parte delle probabilità viene selezionata per prima .. ad esempio:' [{A, 10}, {B, 20}] 'quindi come possiamo dire che supponiamo in prima iterazione 'p = 2' quindi' 2 <= 10' è vero e il primo elemento '{A, 10}' viene selezionato per primo anche se il secondo elemento ha più probabilità – HybrisFreelance

18

finta che abbiamo la seguente lista

Item A 25% 
Item B 15% 
Item C 35% 
Item D 5% 
Item E 20%

nascondiamo che tutte le probabilità sono interi, e assegnare ogni voce di un "range" che calcolato come segue.

Start - Sum of probability of all items before 
End - Start + own probability

I nuovi numeri sono i seguenti

Item A 0 to 25 
Item B 26 to 40 
Item C 41 to 75 
Item D 76 to 80 
Item E 81 to 100

Ora scegliere un numero casuale da 0 a 100. Diciamo che si sceglie 32. 32 cadute nella gamma Voce di B.

mj

fonte

2012-02-17 15:02:29

+0

Più veloce della risposta di @ Brent per la selezione, ma ci vorrebbe troppa memoria se diciamo, gli intervalli erano da 0 a un milione. –

+0

Le probabilità non devono essere percentuali. Possiamo semplicemente scegliere un numero casuale compreso tra 0 e la somma dei numeri. – WVrock

10

si può provare il Roulette Wheel Selection.

Per prima cosa, aggiungi tutte le probabilità, quindi ridimensiona tutte le probabilità nella scala di 1, dividendo ciascuna per la somma. Supponiamo che le probabilità siano A(0.4), B(0.3), C(0.25) and D(0.05). Quindi puoi generare un numero a virgola mobile casuale nell'intervallo [0, 1]. Ora si può decidere in questo modo:

random number between 0.00 and 0.40 -> pick A 
       between 0.40 and 0.70 -> pick B 
       between 0.70 and 0.95 -> pick C 
       between 0.95 and 1.00 -> pick D

Si può anche farlo con numeri interi casuali - dici si genera un numero intero casuale compreso tra 0 e 99 (inclusi), allora si può fare decisione come sopra.

fonte

2012-02-17 15:05:54 0605002

+0

(+1) Mi dà fastidio che questo algoritmo sembra quasi sempre descritto in termini di GA (il tuo link su Wikipedia e vedi [qui] (http://www.cse.unr.edu/~banerjee/selection.htm) anche). L'algoritmo della ruota della roulette ponderata ha tutti i tipi di usi che non hanno nulla a che fare con GA (come questa stessa domanda). –

+0

Sì, è strano. Ho anche imparato il suo nome mentre studiavo GA, ma ho usato la tecnica molto prima per qualche altro motivo. – 0605002

60

Generare un numero casuale distribuito uniformemente.
Scorrere l'elenco fino a quando la probabilità cumulativa degli elementi visitati è maggiore del numero casuale

codice di esempio:

double p = Math.random(); 
double cumulativeProbability = 0.0; 
for (Item item : items) { 
    cumulativeProbability += item.probability(); 
    if (p <= cumulativeProbability) { 
     return item; 
    } 
}

fonte

2012-02-17 15:12:04

+0

bello e leggero – myro

+1

Qui 'p' è un numero casuale, quindi come possiamo dire che la maggior parte delle probabilità viene selezionata per prima .. ad esempio:' [{A, 10}, {B, 20}] 'così come puoi diciamo che supponiamo in prima iterazione 'p = 2' quindi' 2 <= 10' è vero e il primo oggetto '{A, 10}' viene selezionato per primo anche se il secondo elemento ha più probabilità – HybrisFreelance

+5

@ U2Risposta, Questo algoritmo richiede il probabilità da normalizzare (diviso per la somma di tutte le probabilità). In questo modo ti assicuri che Σp_i = 1 e poi un numero casuale compreso tra 0 e 1 farà il trucco. – aioobe

1

risposta di Brent è buona, ma non tiene conto della possibilità di erroneamente scegliere un oggetto con una probabilità pari a 0 nei casi in cui p = 0. È abbastanza facile da gestire controllando la probabilità (o forse non aggiungendo l'elemento in primo luogo):

double p = Math.random(); 
double cumulativeProbability = 0.0; 
for (Item item : items) { 
    cumulativeProbability += item.probability(); 
    if (p <= cumulativeProbability && item.probability() != 0) { 
     return item; 
    } 
}

fonte

2013-10-14 02:18:28

+1

Non penso che tu debba preoccuparti del caso in cui la probabilità dell'oggetto è zero. Dovresti aver già terminato il ciclo o continuare come se la probabilità cumulativa non fosse cambiata. – rrs

5

Il mio metodo è piuttosto semplice. Genera un numero casuale.Ora, poiché le probabilità dei tuoi oggetti sono note, è sufficiente scorrere l'elenco ordinato di probabilità e selezionare l'elemento la cui probabilità è minore del numero generato casualmente.

Per ulteriori dettagli, leggere la risposta here.

fonte

2014-06-03 12:28:08 HackCode

6

Algoritmo descritto in Ushman's, Brent's e le risposte di @ kaushaya sono implementate nella libreria Apache commons-math.

Date un'occhiata a EnumeratedDistribution classe (codice Groovy segue):

def probabilities = [ 
    new Pair<String, Double>("one", 25), 
    new Pair<String, Double>("two", 30), 
    new Pair<String, Double>("three", 45)] 
def distribution = new EnumeratedDistribution<String>(probabilities) 
println distribution.sample() // here you get one of your values

noti che somma delle probabilità non ha bisogno di essere uguale a 1 o 100 - sarà normalizzato automaticamente.

fonte

2014-07-10 12:35:18 Dmitry

+0

Chi è @kaushaya? Potrebbe essere cambiato il nome. Quindi è meglio collegare ipertestuali alle rispettive risposte. –

4

Un modo lento ma semplice per farlo è quello di fare in modo che ogni membro scelga un numero casuale in base alla sua probabilità e scelga quello con il valore più alto.

Analogia:

Immagina 1 di 3 persone hanno bisogno di essere scelto, ma hanno diverse probabilità. Gli dai la morte con diverse facce. I dadi della prima persona hanno 4 facce, 2 della 2a persona e 8 della terza persona. Lanciano il loro dado e quello con il maggior numero vince.

Diciamo che abbiamo il seguente elenco:

[{A,50},{B,100},{C,200}]

Pseudocodice:

A.value = random(0 to 50); 
B.value = random(0 to 100); 
C.value = random (0 to 200);

Prendiamo quella con il valore più alto.

Questo metodo sopra non mappa esattamente le probabilità. Ad esempio 100 non avrà il doppio di possibilità di 50. Ma possiamo farlo in un secondo modificando leggermente il metodo.

Metodo 2

Invece di scegliere un numero da 0 a peso possiamo limitare dal limite superiore della variabile precedente aggiunta della variabile corrente.

[{A,50},{B,100},{C,200}]

pseudocodice:

A.lowLimit= 0; A.topLimit=50; 
B.lowLimit= A.topLimit+1; B.topLimit= B.lowLimit+100 
C.lowLimit= B.topLimit+1; C.topLimit= C.lowLimit+200

risultante limiti

A.limits = 0,50 
B.limits = 51,151 
C.limits = 152,352

Poi scegliere un numero casuali da 0 a 352 e confrontarlo con limiti di ciascuna variabile di vedere se il numero casuale è nei suoi limiti.

Credo che questo tweak abbia prestazioni migliori poiché esiste solo una generazione casuale.

C'è un metodo simile in altre risposte, ma questo metodo non richiede che il totale sia 100 o 1.00.

fonte

2014-11-15 16:56:33 WVrock

+0

Perché questo down è stato votato? Gradirei una spiegazione. – WVrock

+0

Ingegnoso! Mi piace. – Siddhartha

+0

Il tuo metodo non si associa alle probabilità con la stessa facilità con cui sembra. Supponiamo di volere due scelte, A e B. A ha 2/5 = 0 a 40, B ha 3/5 = 0 a 60. Se simuliamo questo con il tuo metodo, 1/3 del tempo B selezionerà tra 41 e 60, garantendo il successo.Poi gli altri 2/3 del tempo, B sarà da 0 a 40 e A sarà da 0 a 40, dando loro anche quote, in modo che 1/2 dei 2/3 del tempo, B vincerà. Questo è 1/3 + 1/3 = 2/3, che è diverso dal 3/5 previsto che B vince. –

-3

È possibile utilizzare il codice di Julia:

function selrnd(a::Vector{Int}) 
    c = a[:] 
    sumc = c[1] 
    for i=2:length(c) 
     sumc += c[i] 
     c[i] += c[i-1] 
    end 
    r = rand()*sumc 
    for i=1:length(c) 
     if r <= c[i] 
      return i 
     end 
    end 
end

Questa funzione restituisce l'indice di un elemento in modo efficiente.

fonte

2015-08-06 13:02:10

Come scegliere un oggetto in base alla sua probabilità?

risposta

Problemi correlati