Kirjautuminen

Haku

Tehtävät

Keskustelu: Nettisivujen teko: Japaninkieliset sivut ja tietokanta

manninen [04.11.2016 15:19:26]

#

Hei!

Onko hyvä ottaa huomioon mitä jos tekee verkkosivuja japaniksi ja oletettavasti tieto tallennetaan japanin kielellä tietokantaan.

groovyb [04.11.2016 15:55:16]

#

UTF-8 käyttöön sekä sivuilla että kannassa, se riittänee.

The Alchemist [04.11.2016 17:23:24]

#

Kielenä tämä tyyppi käyttää aina php:tä, joten silloin tulee myös muistaa käyttää mb-versioita merkkijonoja käsittelevistä funktioista. Sama pätee toki myös suomen kielen kanssa, mutta multibyte-merkkien vähyydestä johtuen ongelmiin ei välttämättä aina törmää... Mutta japanin kanssa asia tulee olemaan aivan eri.

Metabolix [04.11.2016 18:52:23]

#

The Alchemist kirjoitti:

Tulee myös muistaa käyttää mb-versioita merkkijonoja käsittelevistä funktioista.

Koska UTF-8 on fiksusti suunniteltu, voi käyttää tavallisia funktioita useimpiin tapauksiin eli aina silloin, kun ei kiinnosta merkkien lukumäärä. Esimerkiksi explode, strstr, strpos+substr-yhdistelmä ja monet muut asiat toimivat aivan oikein. Oikeastaan on harvinaista, että merkkien lukumäärällä olisi merkitystä, ja silloin myös mb-funktiot toimivat sikäli väärin, että nekään eivät laske näkyviä merkkejä vaan koodipisteitä, jolloin yhdistyvät merkit voivat hajota.

echo mb_strlen("ö"), "\n"; // 2; o ja irtopisteet
echo mb_strlen("ö"), "\n"; // 1; ö valmiina
echo "a", mb_substr("ö", 1, 1), "\n"; // a, koska ö on vain yksi merkki
echo "a", mb_substr("ö", 1, 1), "\n"; // ä, koska ö:stä jäävät irtopisteet

Mango [06.11.2016 10:56:06]

#

Jos kantana on MySQL niin silloin pitää charsetiksi asettaa "utf8mb4", pelkkä "utf8" on alias "utf8mb3":lle joka taltioi maksimissaan kolmen tavun UTF-8 merkkejä. Ainakin osa aasialaisten kielten merkeistä koodataan neljällä tavulla.

http://dev.mysql.com/doc/refman/5.7/en/charset-unicode-utf8mb4.html

manninen [15.11.2016 21:15:46]

#

Kiitän tiedoista.

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta