Tietojen muuntaminen lomakkeesta toiseen tunnetaan koodauksena. Sitä käytetään tietojen muuntamiseen niin, että eri järjestelmät voivat tukea ja käyttää tietoja. Koodaus toimii samalla tavalla kuin lämpötilan muuntaminen celsiusasteesta Fahrenheitiksi, koska se vain muunnetaan toiseen muotoon, mutta alkuperäinen arvo pysyy aina samana. Koodausta käytetään pääasiassa kahdella alalla:
Huomautus: Koodaus eroaa salauksesta, koska sen päätarkoitus ei ole piilottaa tietoja vaan muuntaa ne muotoon, jotta sitä voidaan käyttää oikein.
Tässä aiheessa aiomme keskustella erityyppisistä koodaustekniikoista, joita käytetään tietojenkäsittelyssä.
Koodaustekniikan tyyppi
Merkkien koodaus
Merkkikoodaus koodaa merkit tavuiksi . Se kertoo tietokoneille kuinka nollat ja ykköset tulkitaan oikeiksi merkeiksi, numeroiksi ja symboleiksi. Tietokone ymmärtää vain binääridataa; siksi nämä merkit on muutettava numeerisiksi koodeiksi. Tämän saavuttamiseksi jokainen merkki muunnetaan binäärikoodiksi, ja tätä varten tekstidokumentit tallennetaan koodaustyypeillä. Se voidaan tehdä yhdistämällä numerot merkkien kanssa. Jos emme käytä merkkikoodausta, verkkosivustomme ei näytä merkkejä ja tekstiä oikeassa muodossa. Näin ollen se heikentää luettavuutta, eikä kone pystyisi käsittelemään tietoja oikein. Lisäksi merkkikoodaus varmistaa, että jokaisella merkillä on oikea esitys tietokone- tai binäärimuodossa.
On olemassa erilaisia merkkikoodaustekniikoita, jotka on esitetty alla:
HTML-koodaus
HTML-koodausta käytetään näyttämään HTML-sivu oikeassa muodossa. Koodauksen avulla verkkoselain saa tietää, mitä merkistöä käytetään.
HTML:ssä HTML-merkinnöissä käytetään erilaisia merkkejä, kuten . Jotta voimme koodata nämä merkit sisällöksi, meidän on käytettävä koodausta.
URL-koodaus
URL (Uniform Resource locator) Koodausta käytetään muuntaa merkit sellaiseen muotoon, että ne voidaan lähettää Internetin kautta . Se tunnetaan myös prosenttikoodauksena. URL-koodaus suoritetaan URL-osoitteen lähettämiseksi Internetiin ASCII-merkistöä käyttäen. Ei-ASCII-merkit korvataan prosentilla, jota seuraa heksadesimaaliluku.
UNICODE-koodaus
Unicode on koodausstandardi yleiselle merkistölle. Se mahdollistaa tekstin koodauksen, edustamisen ja käsittelyn useimmilla maailmanlaajuisesti saatavilla olevilla kielillä tai kirjoitusjärjestelmillä. Se tarjoaa koodipisteen tai numeron jokaiselle merkille kaikilla tuetuilla kielillä. Se voi edustaa suunnilleen kaikkia mahdollisia merkkejä kaikilla kielillä. Tietty bittisekvenssi tunnetaan koodausyksikkönä.
UNICODE-standardi voi käyttää 8, 16 tai 32 bittiä edustamaan merkkejä.
Unicode-standardi määrittelee Unicode Transformation Format (UTF) -muodon koodipisteiden koodaamiseksi.
UNICODE-koodausstandardissa on seuraavat UTF-järjestelmät:
UTF8:n määrittelee UNICODE-standardi, joka on elektroniikkaviestinnässä käytettävä muuttuvaleveinen merkkikoodaus. UTF-8 pystyy koodaamaan kaikki 1 112 064 kelvollista merkkikoodipistettä Unicodessa käyttämällä yhdestä neljään yksitavuista (8-bittistä) koodiyksikköä.
UTF16-koodaus edustaa merkin koodipisteitä käyttämällä yhtä kahdesta 16-bittisestä kokonaisluvusta.
UTF32-koodaus esittää jokaisen koodipisteen 32-bittisinä kokonaislukuina.
Base64-koodaus
Base64-koodausta käytetään binääritietojen koodaamiseen vastaaviksi ASCII-merkeiksi. Base64-koodausta käytetään Mail-järjestelmässä, koska sähköpostijärjestelmät, kuten SMTP, eivät voi toimia binääritietojen kanssa, koska ne hyväksyvät vain ASCII-tekstidatan. Sitä käytetään myös yksinkertaisessa HTTP-todennuksen yhteydessä valtuustietojen koodaamiseen. Lisäksi sitä käytetään myös binääritietojen siirtämiseen evästeisiin ja muihin parametreihin, jotta tiedoista tulee lukukelvottomia peukaloinnin estämiseksi. Jos kuva tai muu tiedosto siirretään ilman Base64-koodausta, se vioittuu, koska postijärjestelmä ei pysty käsittelemään binaaridataa.
Base64 edustaa dataa 3 tavun lohkoissa, joissa jokainen tavu sisältää 8 bittiä; joten se edustaa 24 bittiä. Nämä 24 bittiä on jaettu neljään 6 bitin ryhmään. Jokainen näistä ryhmistä tai paloista muunnetaan vastaavaksi Base64-arvoksi.
ASCII-koodaus
American Standard Code for Information Interchange (ASCII) on eräänlainen merkkikoodaus. Se oli ensimmäinen merkkikoodausstandardi, joka julkaistiin vuonna 1963.
ASCII-koodia käytetään esittämään englanninkielisiä merkkejä numeroina, joissa jokaiselle kirjaimelle on määritetty numero alkaen 0-127. Useimmat nykyaikaiset merkkikoodausjärjestelmät perustuvat ASCII-järjestelmään, vaikka ne tukevat monia lisämerkkejä. Se on yksitavuinen koodaus, joka käyttää vain alinta 7 bittiä. ASCII-tiedostossa jokainen aakkosellinen, numeerinen tai erikoismerkki esitetään 7-bittisellä binääriluvulla. Jokaisella näppäimistön merkillä on vastaava ASCII-arvo.
Kuvan ja äänen ja videon koodaus
Kuva- ja ääni- ja videokoodaus suoritetaan tallennustilan säästämiseksi. Mediatiedostot, kuten kuva, ääni ja video, on koodattu, jotta ne voidaan tallentaa tehokkaampaan ja pakatussa muodossa.
Nämä koodatut tiedostot sisältävät saman sisällön yleensä samanlaatuisina, mutta pakatussa koossa, jotta ne voidaan tallentaa pienempään tilaan, siirtää helposti postitse tai ladata järjestelmään.
Voimme ymmärtää sen . WAV-äänitiedosto muunnetaan .MP3-tiedostoksi koon pienentämiseksi 1/10thalkuperäiseen kokoonsa.