diversi operatori

LIKE e = sono diversi operatori. La maggior parte delle risposte qui si concentra sul supporto con caratteri jolly, che non è l'unica differenza tra questi operatori!

= è un operatore di confronto che opera su numeri e stringhe. Quando si confrontano le stringhe, l'operatore di confronto confronta intere stringhe.

LIKE è un operatore di stringa che confronta il carattere per il carattere.

Per complicare le cose, entrambi gli operatori utilizzano uno collation che può avere effetti importanti sul risultato del confronto.

Motivating Esempio

di prima identificare un esempio in cui questi operatori producono risultati ovviamente diversi Let. Permettetemi di citare dal manuale di MySQL:

Per lo standard SQL, COME eseguito l'adattamento in base al carattere, quindi può produrre risultati diversi da parte dell'operatore = confronto:

mysql> SELECT 'ä' LIKE 'ae' COLLATE latin1_german2_ci; 
+-----------------------------------------+ 
| 'ä' LIKE 'ae' COLLATE latin1_german2_ci | 
+-----------------------------------------+ 
|          0 | 
+-----------------------------------------+ 
mysql> SELECT 'ä' = 'ae' COLLATE latin1_german2_ci; 
+--------------------------------------+ 
| 'ä' = 'ae' COLLATE latin1_german2_ci | 
+--------------------------------------+ 
|         1 | 
+--------------------------------------+

Si noti che questa pagina del manuale MySQL si chiama . Le funzioni di confronto delle stringhe e = non sono discusse, il che implica che = non è strettamente una funzione di confronto delle stringhe.

Come funziona `=`?

Il SQL Standard § 8.2 descrive come = confronta le stringhe:

Il confronto di due stringhe di caratteri è determinato come segue:

a) Se la lunghezza in caratteri di X non è uguale alla lunghezza in caratteri di Y, quindi la stringa più breve è efficacemente sostituita, a fini di confronto, con una copia di stessa estesa alla lunghezza della stringa più lunga mediante concatenazione a destra di uno o più pad caratteri, in cui il carattere pad viene scelto in base a CS. Se CS ha l'attributo NO PAD, il carattere pad è un carattere dipendente dall'implementazione diverso da qualsiasi carattere nel set di caratteri di X e Y che raccoglie meno di qualsiasi stringa in CS. Altrimenti, il carattere del pad è un .

b) Il risultato del confronto di X e Y è data dalla sequenza di confronto CS.

c) A seconda della sequenza di collazione, due stringhe possono risultano uguali anche se sono di lunghezze differenti o contengono diverse sequenze di caratteri. Quando le operazioni MAX, MIN, DISTINCT fanno riferimento a una colonna di raggruppamento e gli operatori UNION, EXCEPT e INTERSECT si riferiscono alle stringhe di carattere , il valore specifico selezionato da queste operazioni da un insieme di tali valori uguali è l'implementazione- dipendente.

(corsivo è mio.)

Cosa significa? Significa che quando si confrontano le stringhe, l'operatore = è solo un involucro sottile attorno alle regole di confronto correnti. Un confronto è una libreria che ha varie regole per confrontare le stringhe. Ecco un esempio di a binary collation from MySQL:

static int my_strnncoll_binary(const CHARSET_INFO *cs __attribute__((unused)), 
           const uchar *s, size_t slen, 
           const uchar *t, size_t tlen, 
           my_bool t_is_prefix) 
{ 
    size_t len= MY_MIN(slen,tlen); 
    int cmp= memcmp(s,t,len); 
    return cmp ? cmp : (int)((t_is_prefix ? len : slen) - tlen); 
}

Questo particolare collazione accade per confrontare byte per byte (che è il motivo per cui si chiama "binario" - non dà alcun significato speciale per le stringhe). Altre regole di confronto possono fornire confronti più avanzati.

Ad esempio, ecco uno UTF-8 collation che supporta confronti senza distinzione tra maiuscole e minuscole. Il codice è troppo lungo da incollare qui, ma vai a quel link e leggi il corpo di my_strnncollsp_utf8mb4(). Questo confronto può elaborare più byte alla volta e può applicare varie trasformazioni (come il confronto senza distinzione tra maiuscole e minuscole). L'operatore = è completamente astratto dai capricci della collazione.

Come funziona `LIKE`?

Il SQL Standard § 8.5 descrive come LIKE confronta le stringhe:

Il <predicato>

M LIKE P

vale se esiste una partizione di M in sottostringhe tale che:

i) Una sottostringa di M è una sequenza di 0 o mo re contigua < rappresentazione di carattere > s di M ed ogni < carattere rappresentazione > di M fa parte di esattamente un sottostringa.

ii) Se la i-esima sottostringa specificatore di P è un arbitrario specificatore carattere, la stringa i-esima di M è un singolo < rappresentazione di carattere >.

iii) Se la i-esima sottostringa specificatore di P è un arbitrario stringa specificatore, allora la stringa i-esima di M è qualsiasi sequenza di 0 o più < rappresentazione di carattere > s.

iv) Se la i-esima sottostringa specificatore di P è né un arbitrario specificatore carattere né uno specificatore stringa arbitraria, quindi la stringa i-esima di M è uguale a quella stringa specificatore secondo la sequenza di collazione di > come il predicato >, senza l'aggiunta di <spazio> caratteri a M, e ha la stessa lunghezza di quella sottostringa identificatore .

v) Il numero di sottostringhe di M è uguale al numero di specificatori di sottostringa di P.

(enfasi aggiunta).

Questo è abbastanza prolisso, quindi cerchiamo di scomposizione. Gli articoli ii e iii si riferiscono ai caratteri jolly _ e %, rispettivamente. Se P non contiene caratteri jolly, verrà applicato solo l'articolo iv. Questo è il caso di interesse posto dal PO.

In questo caso, confronta ciascuna "sottostringa" (singoli caratteri) in M in corrispondenza di ciascuna sottostringa in P utilizzando le regole di confronto correnti.

Conclusioni

La linea di fondo è che quando si confrontano le stringhe, = confronta l'intera stringa, mentre LIKE confronta un carattere alla volta. Entrambi i confronti utilizzano le regole di confronto correnti. Questa differenza porta a risultati diversi in alcuni casi, come evidenziato nel primo esempio in questo post.

Quale dovresti usare? Nessuno può dirti questo: devi usare quello corretto per il tuo caso d'uso. Non ottimizzare preventivamente passando da operatori di confronto.

Uguale a (=) rispetto a LIKE

risposta

diversi operatori

Motivating Esempio

Come funziona =?

Come funziona LIKE?

Conclusioni

Problemi correlati

Come funziona `=`?

Come funziona `LIKE`?