Ripuliamo la nostra stringa UTF-8

Come da titolo, quante volte ci siamo ritrovati a dover combattere con i charset?

Chi utilizza sistemi di import, spesso si è scervellato al fine di eliminare quei caratteri che magari, creavano problemi con webservice esterni o dovuti da copia/incolla che spesso gli utenti dei siti fanno.

In nostro soccorso arrivano due semplicissime righe di codice, che hanno il compito di ripulire la nostra stringa (descrizione o qualsiasi cosa essa sia):

$charset = "UTF-8";
$sChunk = mb_convert_encoding($sChunk, $charset, $charset);
$sChunk = preg_replace('/[^\x9\xA\xD\x20-\x{D7FF}\x{E000}-\x{FFFD}\x{10000}-\x{10FFFF}]+/u','',$sChunk);

Grazie e al prossimo snippet 🙂

PS. non siate avari con i +1

Leave a Reply

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.