In seguito a questo articolo di wikipedia SQL join volevo avere una visione chiara su come potremmo aver aderito con data.table. Durante il processo potremmo aver scoperto un bug quando ci si è uniti a NA. Prendendo l'esempio wiki:data.table inner/outer join with NA nella colonna join di tipo double bug?
R) X = data.table(name=c("Raf","Jon","Ste","Rob","Smi","Joh"),depID=c(31,33,33,34,34,NA),key="depID")
R) Y = data.table(depID=c(31,33,34,35),depName=c("Sal","Eng","Cle","Mar"),key="depID")
R) X
name depID
1: Joh NA
2: Raf 31
3: Jon 33
4: Ste 33
5: Rob 34
6: Smi 34
R) Y
depID depName
1: 31 Sal
2: 33 Eng
3: 34 Cle
4: 35 Mar
LEFT OUTER JOIN
R) merge.data.frame(X,Y,all.x=TRUE)
depID name depName
1 31 Raf Sal
2 33 Jon Eng
3 33 Ste Eng
4 34 Rob Cle
5 34 Smi Cle
6 NA Joh <NA>
merge.data.table
no uscita lo stesso risultato e mostrare quello che penso è un bug su lign 2.
R) merge(X,Y,all.x=TRUE)
depID name depName
1: NA Joh Eng
2: 31 Raf NA
3: 33 Jon Eng
4: 33 Ste Eng
5: 34 Rob Cle
6: 34 Smi Cle
R) Y[X] #same -> :(
depID depName name
1: NA Eng Joh
2: 31 NA Raf
3: 33 Eng Jon
4: 33 Eng Ste
5: 34 Cle Rob
6: 34 Cle Smi
RIGHT OUTER JOIN Sembra che lo stesso
R) merge.data.frame(X,Y,all.y=TRUE)
depID name depName
1 31 Raf Sal
2 33 Jon Eng
3 33 Ste Eng
4 34 Rob Cle
5 34 Smi Cle
6 35 <NA> Mar
R) merge(X,Y,all.y=TRUE)
depID name depName
1: NA Joh Eng
2: 31 NA Sal
3: 33 Jon Eng
4: 33 Ste Eng
5: 34 Rob Cle
6: 34 Smi Cle
7: 35 NA Mar
INTERNO (naturale) ENTRA
R) merge.data.frame(X,Y)
depID name depName
1 31 Raf Sal
2 33 Jon Eng
3 33 Ste Eng
4 34 Rob Cle
5 34 Smi Cle
R) merge(X,Y)
depID name depName
1: NA Joh Eng
2: 33 Jon Eng
3: 33 Ste Eng
4: 34 Rob Cle
5: 34 Smi Cle
Come è stato riportato in una precedente risposta, cancellato (che era davvero un commento), l'unione funziona correttamente se le colonne depID sono numeri interi. –
@MatthewLundberg Interessante, grazie. Perché è stato cancellato, sembra utile! Questo spiegherebbe perché i test non l'hanno colto - probabilmente avrei solo pensato di testare NA con interi pensando che NA come doppio non avrebbe fatto la differenza. –
Non posso rispondere, ma non sapevo se avresti provato l'unione con interi senza il suggerimento. Il rispondente ha affermato che il personaggio ha funzionato anche, ma non ho verificato. –