7

Ho circa 300 milioni di file di testo, da 50kb a 100kb che ho bisogno di leggere e servono su una pagina web.Prestazioni BLOB Azure e Tabella Azure

Osservazione:

su Azure Table, avrei bisogno di dividere alcuni dei file di testo, per assicurarsi che non superi il massimo di 64kb per colonna.

In BLOB di Azure, non avrei il problema di dividere, ma avrei bisogno di memorizzare un riferimento ad essi nella Tabella di Azure SQL/Azure.

OK, l'introduzione è terminata! Ora, sulla mia app Web Azure:

  1. Sarebbe più veloce leggere il file di testo da BLOB di Azure o dalla tabella di Azure?
  2. La tabella di Azure potrebbe elaborare più richieste?
+0

Ho eseguito alcuni test e, con mia sorpresa, la lettura del file dal BLOB è più veloce che da tabella. Inoltre, sono d'accordo, per la ricerca, ho intenzione di utilizzare Azure Search. –

risposta

4

Sono d'accordo con Andrei M. La soluzione migliore è lo storage blob con un servizio di tabella o anche un database sql per memorizzare il riferimento.

Solo un'altra cosa, se si pianifica di cercare il contenuto in questi file, nessuno dei servizi di tabella/blob andrà bene per quello. In questo caso, ti consiglio di configurare una VM con ricerca elastica/solr e indicizzare tali contenuti.

PS: c'è anche Ricerca Azzurra, per quello, puoi provare anche tu.

+1

Ora è possibile cercare in blob. https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage Indicizzazione di documenti nell'archivio BLOB di Azure con ricerca di Azure L'indicizzatore di blob può estrarre il testo dal seguenti formati di documenti: PDF formati di Microsoft Office: DOCX/DOC, XLSX/XLS, PPTX/PPT, MSG (messaggi di posta elettronica di Outlook) HTML XML ZIP EML file di testo normale JSON (vedere la funzione di indicizzazione JSON blob anteprima) CSV (vedere Indicizzazione della funzione di anteprima dei blob CSV) –

5

La memoria BLOB è migliore della memoria tabella se si desidera lavorare con i file. Sicuramente non vorrei trattare con blocchi di file in una tabella. Se è necessario mantenere i riferimenti ai BLOB, come combinare due opzioni e utilizzare la memoria della tabella per i riferimenti? Penso che questo sarebbe il migliore in termini di prestazioni :).

+0

Le query punto (con chiave di partizione e chiave di riga) sono molto veloci con l'archiviazione della tabella. Dovresti fare dei test perfetti, ma questo rende la risposta di Andrei ancor più vera. –

+0

Anche lavorando con le stringhe, BLOB è più veloce. Ho provato Recupera 2kb da un file in un BLOB o dalla memoria della tabella? Blob vince 9 ou di 10 –