Come controllare se una tabella di MySQL è codificata in UTF8

Molto semplicemente eseguendo (cambiando ovviamente dbname e tablename) questa query potete capire la codifica:

select c.character_set_name
from information_schema.tables as t,
     information_schema.collation_character_set_applicability as c
where c.collation_name = t.table_collation
  and t.table_schema = "dbname"
  and t.table_name = "tablename";

Tabella in utf8

Se vi rendete conto che non è in utf8, vi basta eseguire (prima fate un backup):

ALTER DATABASE databasename CHARACTER SET utf8 COLLATE utf8_unicode_ci;
ALTER TABLE tablename CONVERT TO CHARACTER SET utf8 COLLATE utf8_unicode_ci;

Altrimenti se la volete in utf8mb4:

ALTER TABLE tablename CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
ALTER DATABASE databasename CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Altri suggerimenti su come fare conversioni potete trovarne qui, oppure qui.

Come convertire un database di MySQL da utf8 a utf8mb4

Se avete finalmente reso compatibile il vostro database a utf8mb4 e lo avete anche configurato correttamente, che ne dite di convertirlo anche? Comprese le tabelle e colonne?

Ovviamente prima fatevi un bel backup di tutto quanto… ora andiamo alla conversione!

Per ogni database (cambiate dbname):

ALTER DATABASE dbname CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;

Per ogni tabella (cambiate tablename):

ALTER TABLE tablename CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Per ogni colonna (cambiate nome e grandezza delle colonne):

ALTER TABLE tablename CHANGE column_name column_name VARCHAR(300) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Voilà, ora dovreste essere fully compatible con utf8mb4.

Come configurare MySQL con utf8 o utf8mb4 correttamente

Se utilizzate un database a utf8mb4 (come vi ho spiegato qui) ma nel client, come ad esempio PhpStorm o altri servizi simili, non vi funziona correttamente la codifica dei caratteri… probabilmente è perché la versione in locale che viene scaricata per gestire tutti gli schemes non è correttamente funzionante.

Potete verificarlo facendo:

show variables like "%collation%";
show variables like '%character%';

Oppure con:

SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';

Database configurato correttamente a utf8mb4

E se per caso character_set_database o collation_database non risulta utf8, eseguite (modificando il dbname):

ALTER DATABASE dbname CHARACTER SET utf8 COLLATE utf8_general_ci;

Se invece volete utf8mb4 come vi avevo indicato nella guida precedente, vi basterà eseguire:

ALTER DATABASE dbname CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Ora rieseguendo la query precedente dovreste avere tutto correttamente configurato.

Come rendere MySQL compatibile con utf8mb4

Di default MySQL supporta utf8 solo a 3 byte, in realtà per avere massima compatibilità con tutte le tipologie di caratteri (quali ad esempio emojis e altri caratteri non latini) bisogna utilizzare utf8mb4 invece di utf8 normale.

E per farlo dovete semplicemente incollare queste righe all’interno del file di configurazione, che potete trovare qui:

sudo nano /etc/mysql/mysql.cnf oppure dentro /etc/my.cnf.

Al fondo inserite:

[client]
default-character-set = utf8mb4

[mysql]
default-character-set = utf8mb4

[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

Poi riavviate il servizio semplicemente con sudo service mysql restart.