Ho un'applicazione web scritta in Flask. Come suggerito da tutti, non posso usare Flask in produzione. Così ho pensato a Gunicorn con Flask.Come eseguire Flask con Gunicorn in modalità multithreading
Nell'applicazione Flask sto caricando alcuni modelli di Machine Learning. Questi sono di dimensioni 8 GB collettivamente. La concorrenza della mia applicazione Web può andare fino a 1000 richieste. E la RAM della macchina è 15GB.
Quindi qual è il modo migliore per eseguire questa applicazione?
Con più worker si sta verificando un'eccezione di memoria in quanto le dimensioni dei modelli sono grandi. Penso che con ogni lavoratore caricherà tutti i modelli in uno spazio di memoria diverso. – neel
È necessario utilizzare async worker come gevent per consentire la concorrenza con un worker: 'gunicorn -k gevent --worker-connections 1000'. – molivier
È anche possibile aggiungere '--threads' per eseguire ogni worker con il numero di thread specificato. Vedi Modifica. L'opzione – molivier