e-gradiva     HTML CSS JavaScript Načrtovanje    
  logotip  
SERŠ Maribor Iskanje Primeri

Kodne tabele

Nekateri znaki v HTML imajo torej poseben pomen. Ti znaki so < (manjši), > (večji), " (dvojni narekovaj) in & (in). če jih želimo uporabiti v besedilu, moramo uporabiti njihova imena, določena s standardom SGML, na primer takole: &lt;, &gt;, &quot; in &amp;.

Znakovna referenca so številke ali simbolična imena za znake, ki se vključujejo v dokumente HTML. Uporabljajo se za redko uporabljene znake, ki bi jih avtor strani težko vnesel. Znakovna entiteta se prične z znakom &, oznako in se zaključi s podpičjem ;.

Nekaj primerov:

Vsak dokument SGML (in tudi vsak dokument HTML) je zaporedje znakov nekega nabora. Računalniški sistem prepozna vsak znak po njegovem položaju. Na primer v naboru ASCII, so kode posicij 65, 66, and 67 obravnajajo in prikažejo kot znaki 'A', 'B', and 'C'.

Znakovni nabor ASCII ni popoln za prikaz velikih števila informacijskih sistemov kot je na primer svetovni splet. Tako HTML uporablja več zbirk znakovnih naborov, ki jih imenuje Universal Character Set (UCS) (določeni so s standardom [ISO10646]). Ta standard določa repertoar tisočerih znakov, ki so uporabljeni za komunikacijo po celem svetu.

Nabor znakov, ki je določen v [ISO10646] je od znanka do znaka ekvivalenten Unicode ([UNICODE]). Oba standarda je osvežujeta od časa do časa z novimi znaki.

Dokumentov nabor znakov ne zadostuje brskalnikom za pravilno interpretacijo dokumentov HTML. Znaki se v omrežni komunikaciji prenašajo kot zaporedje bitov. Brskalnik mora vedeti točno kateri način kodiranja je bil uporabljen, da lahko pretvori zaporedje bitov z znake.

Kodiranje znakov

Specifikacija, ki določa kodiranje znakov je poznana z različnimi imeni na različnih področjih (kar pogosto povzroča zmedo).

Atribut charset določa nabor znakov za kodiranje, ki jih zna postopek pretvarjanja spremeniti iz zaporedja bitov v zaporedje znakov. Ta postopek je podoben kot pri predstavitvi spletnih strani: strežnik pošlje brskalniku zaporedje bitov in ta jih mora predstaviti kot zaporedje znakov. Način pretvarjanja je odvisen od metode kodiranja, od enostavnega preklapljanja do posebnih algoritmov.

Določanje znakov za kodiranje

Kako strežnik ve katero kodiranje je uporabljeno za dokument, ki ga nudi? Nekateri strežniki preverijo nekaj prvih bytov v dokumentu, preverijo zbirko poznanih načinov kodiranja. Mnogo modernih spletnih strežnikov ponuja spletnim mojstrom več nadzora nad določanjem znakovnih naborov.

Kako brskalnik ve, katere vrste kodiranje je bilo uporabljeno? Strežnik lahko pošlje to informacijo. Zelo pogosto je podatke o kodiranju v privesku meta, ki se nahaja v glavi dokumenta html. V atributu Content-Type je navedena vrsta kodiranja, npr.:

<meta http-equiv="content-type" content="text/html; charset=charset=EUC-JP" />

S korensko značko dokumenta html je mogoče določiti jezik in s tem posledično tudi vrsto kodiranja.

<html lang="si" xml:lang="si" xmlns="http://www.w3.org/1999/xhtml">

Kodiranje je lahko določeno tudi z deklaracijo XML. Ker je dokument XHTML tudi dokument XML, se lahko zapiše v prvo vrstico dokumenta:

<?xml version="1.0" encoding="si" ?>

V brskalnikih je mogoče tudi nastaviti vrsto kodiranja.

Pogled
      -> Kodiranje

ali

View
      -> Encoding

Najvišja prioriteta je uporabnikova nastavitev.

Oglej si še nekaj znakov

SERŠ Maribor : Strokovna gimnazija : 2004 :