Sto cercando qui alcune indicazioni esperte su quale sia l'approccio migliore per risolvere un problema. Ho studiato alcuni sistemi di apprendimento automatico, reti neurali e cose del genere. Ho studiato weka, una sorta di soluzione baesiana .. R .. molte cose diverse. Non sono sicuro di come procedere, comunque. Ecco il mio problemaIl miglior approccio a quello che ritengo sia un problema di apprendimento automatico
Ho o avrà una vasta collezione di eventi .. alla fine circa 100.000 circa. Ogni evento consiste di diverse variabili indipendenti (30-50) e 1 variabile dipendente a cui tengo. Alcune variabili indipendenti sono più importanti di altre nel determinare il valore della variabile dipendente. E questi eventi sono rilevanti nel tempo. Le cose che accadono oggi sono più importanti degli eventi accaduti 10 anni fa.
Mi piacerebbe essere in grado di alimentare un qualche tipo di motore di apprendimento un evento, e farlo predire la variabile dipendente. Quindi, conoscendo la vera risposta per la variabile dipendente per questo evento (e per tutti gli eventi precedenti), mi piacerebbe che si formassero ulteriori ipotesi.
Una volta che ho un'idea di quale direzione di programmazione andare, posso fare la ricerca e capire come trasformare la mia idea in codice. Ma il mio background è in programmazione parallela e non roba del genere, quindi mi piacerebbe avere alcuni suggerimenti e indicazioni su questo.
Grazie!
Modifica: ecco alcuni dettagli in più sul problema che sto cercando di risolvere: si tratta di un problema di prezzo. Diciamo che voglio fare previsioni sui prezzi di un fumetto a caso. Il prezzo è l'unica cosa a cui tengo. Ma ci sono molte variabili indipendenti che si potrebbero creare. È un fumetto di Superman o un fumetto di Hello Kitty. Quanti anni ha? Qual è la condizione? ecc. ecc. Dopo essermi allenato per un po ', voglio essere in grado di dargli informazioni su un libro di fumetti che potrei prendere in considerazione, e di darmi un ragionevole valore atteso per il fumetto. OK. Quindi i fumetti potrebbero essere un falso esempio. Ma hai un'idea generale. Finora, dalle risposte, sto facendo qualche ricerca su Support vector machines e Naive Bayes. Grazie per tutto il tuo aiuto finora.
Penso che il tag "classificazione" e "regressione" si escludano a vicenda. È o "classificazione", o è "regressione". Non può essere entrambi. –