Principalmente è la dimensione del tavolo.
Suppongo qui che utilizzerete il plugin Oracle innoDB per mysql come motore. Se non lo fai, probabilmente significa che stai utilizzando un motore commerciale come infiniDB, InfoBright per Tokutek, nel qual caso le tue domande dovrebbero essere inviate a loro.
InnoDB diventa un po 'sgradevole con tavoli molto grandi. Si consiglia di suddividere le tabelle se possibile con istanze molto grandi. In sostanza, se gli indici (usati di frequente) non si adattano tutti alla ram, gli inserimenti saranno molto lenti in quanto devono toccare molte pagine non nella ram. Questo non può essere risolto.
È possibile utilizzare la funzione di partizionamento MySQL 5.1 se fa ciò che si desidera, o partizionare le tabelle a livello di applicazione, in caso contrario. Se riesci a far rientrare gli indici dei tuoi tavoli nella ram e carichi solo un tavolo alla volta, allora sei un vincitore.
È possibile utilizzare la compressione del plug-in per fare in modo che la RAM passi un po 'oltre (poiché le pagine sono compresse sia su RAM che su disco) ma non può battere la limtation fondamentale.
Se gli indici della tabella non tutti (o almeno MOSTAMENTE - se si hanno alcuni indici che sono NULL nel 99,99% dei casi che si potrebbero ottenere senza quelli) si inseriscono nella ram, la velocità di inserimento risulterà tale.
La dimensione del database non è un grosso problema, a condizione che le tabelle si adattino individualmente nella ram mentre si esegue il caricamento in serie (e, naturalmente, si carica solo una alla volta).
Queste limitazioni si verificano realmente con la maggior parte dei database basati su riga. Se hai bisogno di più, prendi in considerazione un database di colonne.
Infobright e Infinidb utilizzano entrambi un nucleo basato su mysql e sono basati su colonne che possono gestire tabelle molto grandi.
Anche Tokutek è molto interessante: è possibile contattarli per una valutazione.
Quando si valuta l'idoneità del motore, assicurarsi di caricarlo con dati molto grandi sull'hardware di produzione. Non ha senso testarlo con un database (ad esempio) 10G, che non dimostrerà nulla.
abbastanza interessante "google" non esiste come "bigge di google". Google utilizza molti tecnoliges in molte cose. Secondo la tua intelligenza, sono sicuro che Google sta "solo ascoltando MS Access" (QUALCUNO sono sicuro di trovare un database di accesso in un'azienda delle dimensioni di Google). – TomTom