Meta Charset Tag sa HTML5

Pagtatakda ng Character Encoding sa HTML5

Bago ang pagpapakilala ng HTML5, ang pagtatakda ng character na encoding sa isang dokumento na may isang elementrequiredyou upang isulat ang medyo masalimuot na linya na nakikita sa ibaba. Ito ang mga elemento ng Meta Charset kung gumagamit ka ng HTML4 sa iyong web page:

Ano ang mahalaga upang mapansin sa codeare na ito ang mga panipi na nakikita mo sa paligid ng katangian ng nilalaman : content = " text / html; charset = iso-8859-1 " . Tulad ng lahat ng mga katangian ng HTML, ang mga panipi na ito ay tumutukoy sa halaga ng katangian, na nagpapahiwatig na ang buong string na teksto / html; charset = iso-8959-1 ay ang nilalaman ng sangkap na ito. Ito ay tamang HTML at ito ay kung paano ang string na ito ay sinadya upang maisulat. Mahirap din itong mahaba at pangit! Hindi rin ito isang bagay na malamang na matandaan mo sa tuktok ng iyong ulo! Sa karamihan ng mga kaso, ang mga web developer ay kailangang kopyahin at i-paste ang code na ito mula sa isang site sa anumang bago na sila ay pagbuo dahil ang pagsulat na ito mula sa simula ay humihingi ng maraming.

Kinakailangan ng HTML5 ang Extra & # 34; Stuff & # 34;

Ang HTML5 ay hindi lamang nagdagdag ng ilang mga bagong elemento sa wika, ngunit ito rin ay pinadali ng marami sa syntax ng HTML, kabilang ang elemento ng Meta Charset. Gamit ang HTML5, maaari mong idagdag ang iyong encoding ng character na mas madaling matandaan ang syntax para sa elemento ng META na nakikita mo sa ibaba:

Ihambing ang pinasimple na syntax sa aming isinulat sa pagsisimula ng artikulong ito, ang lumang syntax na ginagamit para sa HTML4, at makikita mo kung gaano mas madaling isulat at tandaan ang bersyon ng HTML5 talaga. Sa halip na kailangan mong kopyahin at i-paste ito mula sa isang umiiral na site sa anumang bago na ikaw ay nagtatrabaho sa, ito ay ganap na isang bagay na, bilang isang front-end na web developer, maaari mong matandaan. Ang pagtitipid na ito ng maraming oras ay hindi magkano, ngunit kapag isinasaalang-alang mo ang iba pang mga lugar ng syntax na HTML5 pinasimple, ang pagtitipid ay nagdaragdag!

Palaging Isama ang Pag-encode ng Character

Dapat mong palaging isama ang encoding ng character para sa iyong mga web page, kahit na hindi mo kailanman nilayon ang paggamit ng anumang mga espesyal na character . Kung hindi ka nagsasama ng isang encoding ng character, ang iyong site ay nagiging mahina sa pag-atake ng cross site scripting gamit ang UTF-7.

Sa sitwasyong ito, nakikita ng anattacker na ang iyong site ay walang tinukoy na encoding ng character, kaya pinapansin nito ang browser sa pag-iisip na ang pag-encode ng character ng pahina ay talagang UTF-7. Susunod, ang taga-atake ay nag-udyok ng mga naka-encode na mga script ng UTF sa web page at ang iyong site ay na-hack. Ito ay maliwanag na may problema sa lahat ng kasangkot, mula sa iyong kumpanya sa iyong mga bisita. Ang mabuting balita ay na ito ay isang simpleng problema upang maiwasan - lamang tiyaking idagdag ang encoding ng character sa lahat ng iyong mga webpage.

Kung saan Magdaragdag ng Character Encoding

Ang encoding ng character para sa isang webpage ay dapat na ang unang linya ng elemento ng ng iyong HTML. Tinitiyak nito na alam ng browser kung ano ang encoding ng character bago gawin ang anumang bagay sa pahina bukod sa upang matukoy ang doctype at kilalanin na ito ay isang Pahina ng HTML. Dapat basahin ng iyong HTML:

...

Paggamit ng mga HTTP Header para sa Extra Security

Maaari mo ring tukuyin ang encoding ng character sa mga header ng HTTP. Ito ay mas ligtas kaysa sa pagdaragdag nito sa pahina ng HTML, ngunit nais mong magkaroon ng access sa mga configuration ng server o .htaccess file, na nangangahulugan na maaaring kailanganin mong magtrabaho sa hosting provider ng iyong website upang makakuha ng ganitong uri ng pag-access o ipagawa ang mga ito ang mga pagbabago para sa iyo. Ang pag-access ay talagang hamon dito. Ang pagbabago mismo ay simple, kaya ang anumang hosting provider ay dapat na gumawa ng pagbabago na ito para sa iyong may kamag-anak kadalian.

Kung gumagamit ka ngApache, maaari mong itakda ang default na hanay ng character para sa iyong buong site sa pamamagitan ng pagdaragdag ng: AddDefaultCharset UTF-8 sa iyong root .htaccess file. Ang set ng default na character ng Apache ay ISO-8859-1 .