2014-06-30 8 views
6

Sto memorizzando i dati degli eventi in BigQuery, suddivisi per giorno - una tabella al giorno. La seguente query non è riuscita:Ottenere "Query troppo grande" in BigQuery

select count(distinct event) 
from TABLE_DATE_RANGE(my_dataset.my_dataset_events_, SEC_TO_TIMESTAMP(1391212800), SEC_TO_TIMESTAMP(1393631999)) 

Ogni tabella ha dimensioni di circa 8 GB.

Qualcun altro ha riscontrato questo errore? Sembra che sia limitato dalle dimensioni della tabella, perché in questa query l'ho limitato solo a una colonna. Quando uso un intervallo temporale più piccolo, funziona ... ma l'intero punto di utilizzo di BigQuery era il suo supporto per dataset di grandi dimensioni.

+1

moderatori, si prega di votare per riaprire domanda, dal momento che non è una domanda duplicata (errore diverso) –

+0

Cool, in attesa di un grande feedback. – Pentium10

+0

comunque provare:. select count (evento) da TABLE_DATE_RANGE (my_dataset.my_dataset_events_, SEC_TO_TIMESTAMP (1391,2128 milioni), SEC_TO_TIMESTAMP (1.393.631,999 mila) Gruppo di ogni evento da – encc

risposta

4

"Query troppo grande" significa in questo caso che TABLE_RANGE viene espanso internamente a troppe tabelle, generando una query interna troppo grande per essere elaborata.

Questo ha 2 soluzioni:

  • Query meno tavoli (si potrebbe aggregare queste tabelle in un uno più grande?).
  • Attendi fino a quando il team BQ risolve internamente questo problema. Invece di utilizzare una soluzione alternativa, dovresti essere in grado di eseguire questa query invariata. Solo non oggi :).
+0

Sapete se questo problema è stato risolto dal team di BQ ora per favore? (Mi aspetto tabelle giornaliere con 30.000.000 di record, le dimensioni saranno almeno 5 GB). – ggo

+1

La dimensione delle tabelle non è un problema. Il problema è interrogare troppe tabelle, non c'è bisogno di preoccuparsi delle dimensioni della tabella! –

+0

Ok grazie mille, sai se esiste un limite noto per il numero di tabelle? Eg: se volessi generare un report per uno anno di dati, sarebbero coinvolte almeno 365 tabelle: le tabelle 365+ coinvolte nella stessa query non sono realistiche? la soluzione sarà limitata ai rapporti mensili, quindi 31 tavoli saranno coinvolti al massimo, ma alcune persone potrebbero avere esigenze specifiche ..) – ggo