2012-05-16 10 views
18

Vorrei iniziare a sperimentare algoritmi che riconoscono i pattern nei dati. Mi occupo di molti tipi di sequenze (pixel dell'immagine, immissione di testo, spostamento dell'utente) e sarebbe divertente utilizzare Pattern Recognition per cercare di estrarre dati significativi da set di dati diversi. Come la maggior parte del web, i miei dati sono per lo più basati su testo o integer.Algoritmi di riconoscimento dei pattern in Node.js o PHP?

Sono le loro classi che forniscono il framework di base per verificare/creare pattern per PHP o Nodejs?

+3

PHP/JS è lo strumento giusto per questo? – webbiedave

+3

@webbiedave, dal momento che ho già applicazioni PHP e node.js che operano su questi dati. È lo strumento * abbastanza giusto * per il lavoro leggero. Forse C sarebbe meglio, ma le mie applicazioni non sono in C. – Xeoncross

+0

Penso anche che entrambi i linguaggi potrebbero essere completamente succhiati a causa del modello senza thread. Per esempio, userei qualcosa come Java per questo. Inoltre penso che questo sia un problema piuttosto difficile e probabilmente non risolto ancora ..? – Alfred

risposta

11

Non ho mai trovato una singola libreria che racchiuda diversi modelli di analisi. Si possono trovare soluzioni specifiche facilmente però.

analisi N-Gram, ad esempio può essere fatto con questa estensione PHP: http://pecl.php.net/package/TextCat

Ci sono diverse implementazioni Bayes così, anche i tutorial.

Non ho mai trovato le reti Kohonen o le mappe auto-organizzate implementate in PHP, ma i percettori multistrato sono banali. IA può fare analisi del modello molto bene.

Ci sono progetti che collegano PHP a OpenCV (una libreria per l'analisi di immagini/video in tempo reale). Attualmente, l'unica implementazione che conosco è quella di rilevare volti umani in immagini. La fonte è aperta https://github.com/infusion/PHP-Facedetect, quindi dovrebbe essere facile legare l'altro valore di OpenCV (OpenCV può fare un sacco di cose con le immagini).

PHP stesso viene interpretato, la maggior parte delle soluzioni pesanti per l'analisi del modello non funzionerà correttamente con questa limitazione. Questo è il motivo per cui la maggior parte delle soluzioni per questo in PHP sono scritte in C come estensione.

+0

Questi due progetti sono un buon inizio, ma sto cercando esempi più avanzati/completi che includano altre forme di elaborazione del testo oltre a un [filtro bigramiano di base] (https://gitorious.org/textus/php-language-detection) (textcat). – Xeoncross

+0

Sono d'accordo con l'ultima affermazione. Se stai cercando di eseguire calcoli pesanti con PHP, potresti voler iniziare a studiare come farlo in C e quindi creare un'estensione personalizzata. – afuzzyllama

3

Per la macchina di apprendimento si potrebbe considerare l'utilizzo di un linguaggio che è più 'a casa', come sarebbe più facile per esprimere il modello ..

Per esempio il codice sorgente per il nuovo 'Machine Learning per gli hacker' libro, scritto in R può essere trovato in Github https://github.com/johnmyleswhite/ML_for_Hackers

E poi, c'è anche l'API previsione di Google, che è buono per la sperimentazione https://developers.google.com/prediction/docs/developer-guide

0

mi rendo conto che è una vecchia questione, ma dal momento che è venuto a la parte superiore di una query di Google, t ho pensato che dovrebbe contenere un riferimento ai binding dei nodi per opencv, node-opencv.