2010-08-18 4 views
23

Un recente annuncio di Google sullo Google Prediction API sembrava molto interessante. Potrebbe essere utile per un progetto che sta arrivando, e probabilmente farebbe un lavoro migliore di un codice personalizzato che stavo considerando.Open Alternative a Google Prediction API

Tuttavia, è presente un blocco del fornitore. Google conserva il modello addestrato e in seguito potrebbe scegliere di sovraccaricarmi per questo. Mi è venuto in mente che probabilmente esistono equivalenti open source, se fossi disposto a ospitare il training da solo (io sono) e vivo senza la loro capacità di gettare l'hardware sul problema in un attimo.

L'ultima volta che ho guardato il codice di addestramento del computer di terze parti era molti anni fa, e c'erano molti dettagli che dovevano essere attentamente considerati e personalizzati per il tuo progetto. Google sembra aver nascosto quelle decisioni e si prende cura di loro per te. Per me, questo è ancora indistinguibile dalla magia, ma mi piacerebbe sapere se gli altri possono fare lo stesso.

Quindi la mia domanda è:

Quali alternative a Google Prediction API esiste che:

  • dati classificarli con apprendimento automatico supervisionato,
  • può essere facilmente configurato (o non hanno bisogno di configurazione) per diversi tipi e scale di set di dati?
  • sono open-source e self-hosted (o per lo meno, si forniscono con un uso royalty free del modello, senza una dipendenza da una terza parte)

risposta

15

Forse Apache Mahout?

+0

Sembra una buona soluzione. Ancora primi giorni (per loro stessa ammissione, v0.3). Stanno affrontando una gamma più ampia di problemi rispetto alla semplice classificazione. – Oddthinking

+0

Sì, ma sembra promettente in quanto sono mirati per l'elaborazione di dati su larga scala. – tszming

1

Io non sono sicuro se è rilevante, ma directededge cuciture di fare esattamente questo :)

+0

Sembrano fornire un servizio, come Google. Non è auto-ospitato, quindi questa non è una risposta. – Oddthinking

+0

No prob ^^ quindi hai provato mahout sul tuo sistema? – tUrG0n

+1

Il progetto è stato messo su un back-burner. Forse tra un altro anno o due - che probabilmente è quando Mahout raggiungerà 1.0! !:-) – Oddthinking

3

sono state cercando di recente a strumenti come Google Prediction API, uno dei primi che mi sono messo a era Weka strumento di apprendimento automatico che potrebbe valere la pena di dare un'occhiata a chiunque stia cercando.

11

PredictionIO è un server di apprendimento automatico open source per gli sviluppatori di software per creare funzionalità predittive, come personalizzazione, raccomandazione e rilevamento di contenuti.

+2

Eccellente. È costruito sulla libreria Apache Mahout (almeno per gli algoritmi predefiniti). Non sembra supportare la classificazione generale, solo la previsione delle preferenze dell'utente. – Oddthinking

+0

Sembra abbastanza buono. Ho bloccato l'installazione delle sue dipendenze: / –

1

C'è un buon servizio gratuito per l'uso Yandex Predictor con quota di richiesta di 100000/giorno. Funziona solo per il testo, supporta diverse lingue e correzioni ortografiche.

È necessario ottenere la chiave API gratuita, quindi è possibile utilizzare l'API RESTful semplice. Api supporta JSON, XML e JSONP come output.

Purtroppo non riesco a trovare la documentazione in inglese. Puoi utilizzare Google Traduttore.

Posso tradurre documenti se c'è qualche richiesta.