logo

Mikä on Redshift?

  • Redshift on nopea ja tehokas, täysin hallittu, petatavun mittakaavainen tietovarastopalvelu pilvessä.
  • Asiakkaat voivat käyttää Redshiftiä vain 0,25 dollarilla tunnissa ilman sitoumuksia tai etukäteiskustannuksia ja skaalata petabyyttiin tai enemmän hintaan 1 000 dollaria per teratavu vuodessa.

OLAP

OLAP on Online Analytics Processing System käyttämä Punasiirtymä .

Esimerkki OLAP-tapahtumasta:

Oletetaan, että haluamme laskea digitaalisen radiotuotteen nettovoiton EMEA- ja Tyynenmeren alueella. Tämä vaatii suuren määrän ennätyksiä. Nettovoiton laskemiseen tarvitaan seuraavat tietueet:

  • EMEA-alueella myytyjen radioiden summa.
  • Tyynenmeren alueella myyty radioiden summa.
  • Radion yksikköhinta kullakin alueella.
  • Jokaisen radion myyntihinta
  • Myyntihinta - yksikköhinta

Monimutkaiset kyselyt vaaditaan yllä olevien tietueiden hakemiseen. Data Warehousing -tietokannat käyttävät erityyppistä arkkitehtuuria sekä tietokantanäkökulmasta että infrastruktuurikerroksen näkökulmasta.

Punasiirtymän asetukset

Punasiirtymä

Redshift koostuu kahden tyyppisistä solmuista:

    Yksi solmu Monisolmu

Yksi solmu: Yksi solmu tallentaa jopa 160 Gt.

Monisolmu: Monisolmu on solmu, joka koostuu useammasta kuin yhdestä solmusta. Sitä on kahta tyyppiä:

    Johtajasolmu
    Se hallitsee asiakasyhteyksiä ja vastaanottaa kyselyitä. Johtava solmu vastaanottaa kyselyt asiakassovelluksista, jäsentää kyselyt ja kehittää suoritussuunnitelmat. Se koordinoi näiden suunnitelmien rinnakkaissuorituksen laskentasolmun kanssa ja yhdistää kaikkien solmujen välitulokset ja palauttaa sitten lopputuloksen asiakassovellukseen.Laske solmu
    Laskentasolmu suorittaa suoritussuunnitelmat, ja sitten välitulokset lähetetään johtosolmulle koottavaksi ennen kuin ne lähetetään takaisin asiakassovellukseen. Siinä voi olla jopa 128 laskentasolmua.

Ymmärretään johtosolmun käsite ja lasketaan solmut esimerkin kautta.

Punasiirtymä

Redshift-varasto on kokoelma laskentaresursseja, jotka tunnetaan solmuina, ja nämä solmut on järjestetty klusteriksi kutsuttuun ryhmään. Jokainen klusteri toimii Redshift Enginessä, joka sisältää yhden tai useamman tietokannan.

Kun käynnistät Redshift-instanssin, se alkaa yhdellä 160 Gt:n solmulla. Kun haluat kasvaa, voit lisätä muita solmuja hyödyntääksesi rinnakkaiskäsittelyä. Sinulla on johtajasolmu, joka hallitsee useita solmuja. Leader-solmu hoitaa asiakasyhteyden sekä laskentasolmut. Se tallentaa tiedot laskentasolmuihin ja suorittaa kyselyn.

Miksi Redshift on 10 kertaa nopeampi

Punasiirtymä on 10 kertaa nopeampi seuraavista syistä:

    Saraketietojen tallennus
    Sen sijaan, että Amazon Redshift tallentaisi tiedot rivien sarjana, se järjestää tiedot sarakkeiden mukaan. Rivipohjaiset järjestelmät ovat ihanteellisia tapahtumien käsittelyyn, kun taas sarakepohjaiset järjestelmät ovat ihanteellisia tietovarastointiin ja analytiikkaan, joissa kyselyihin liittyy usein suurille tietojoukoille suoritettuja aggregaatteja. Koska vain kyselyihin osallistuvat sarakkeet käsitellään ja saraketiedot tallennetaan tallennusvälineeseen peräkkäin, sarakepohjaiset järjestelmät vaativat vähemmän I/O:ita, mikä parantaa kyselyn suorituskykyä.Edistynyt pakkaus
    Saraketietovarastot voidaan pakata paljon enemmän kuin rivipohjaisia ​​tietovarastoja, koska samanlaiset tiedot tallennetaan peräkkäin levylle. Amazon Redshift käyttää useita pakkaustekniikoita ja voi usein saavuttaa merkittävää pakkausta verrattuna perinteisiin relaatiotietovarastoihin.
    Amazon Redshift ei vaadi indeksejä tai materialisoituja näkymiä, joten se vaatii vähemmän tilaa kuin perinteiset relaatiotietokantajärjestelmät. Kun lataat tietoja tyhjään taulukkoon, Amazon Redshift ottaa tiedoistasi näytteitä automaattisesti ja valitsee sopivimman pakkaustekniikan.Massiivinen rinnakkaiskäsittely
    Amazon Redshift jakaa tiedot automaattisesti ja lataa kyselyn eri solmuille. Amazon Redshiftin avulla uusien solmujen lisääminen tietovarastoon on helppoa, ja tämä mahdollistaa nopeamman kyselyn suorituskyvyn tietovarastosi kasvaessa.

Punasiirtymän ominaisuudet

Redshiftin ominaisuudet on esitetty alla:

java alustustaulukko
Punasiirtymä
    Helppo asentaa, ottaa käyttöön ja hallita
      Automaattinen hallinta
      Redshift on helppo asentaa ja käyttää. Voit ottaa uuden tietovaraston käyttöön vain muutamalla napsautuksella AWS-konsolissa, ja Redshift huolehtii infrastruktuurista automaattisesti puolestasi. AWS:ssä kaikki hallinnolliset tehtävät, kuten varmuuskopiointi ja replikointi, on automatisoitu, sinun on keskityttävä tietoihisi, ei hallintaan.Automaattiset varmuuskopiot
      Redshift varmuuskopioi tiedot automaattisesti S3:lle. Voit myös kopioida tilannekuvia S3:ssa toisella alueella katastrofista palautumista varten.
    Kustannustehokas
      Ei etukäteiskuluja, maksa kuten menet
      Amazon Redshift on kustannustehokkain tietovarastopalvelu, koska joudut maksamaan vain käyttämästäsi.
      Sen kustannukset alkavat 0,25 dollarista tunnissa ilman sitoutumista ja etukäteiskustannuksia, ja ne voivat nousta 250 dollariin per teratavu vuodessa.
      Amazon Redshift on ainoa tietovarastopalvelu, joka tarjoaa On Demand -hinnoittelun ilman etukäteiskustannuksia, ja se tarjoaa myös varatun instanssin hinnoittelun, joka säästää jopa 75 % tarjoamalla 1–3 vuoden ajanjakson.Valitse solmun tyyppi.
      Voit valita jommankumman kahdesta solmusta punasiirtymän optimoimiseksi.
        Tiheä laskentasolmu
        Tiheä laskentasolmu voi luoda korkean suorituskyvyn tietovarastoja käyttämällä nopeita suorittimia, suurta määrää RAM-muistia ja puolijohdelevyjä.Tiheä tallennussolmu
        Jos haluat alentaa kustannuksia, voit käyttää tiheää tallennussolmua. Se luo kustannustehokkaan tietovaraston käyttämällä suurempaa kiintolevyasemaa.
    Skaalaa nopeasti tarpeidesi mukaan.
      Petabyyttimittainen tietovarastointi
      Amazon Redshift skaalaa automaattisesti ylös tai alas solmuja tarpeen muutosten mukaan. Vain muutamalla napsautuksella AWS-konsolissa tai yhdellä API-kutsulla voidaan helposti muuttaa tietovaraston solmujen määrää.Eksatavun mittakaavan datajärven analytiikka
      Se on Redshiftin ominaisuus, jonka avulla voit suorittaa kyselyitä Amazon S3:n datan eksatavuilla. Amazon S3 on turvallinen ja kustannustehokas data rajoittamattoman tiedon tallentamiseen avoimessa muodossa.Rajaton samanaikaisuus
      Redshiftin ominaisuus tarkoittaa, että useat kyselyt voivat käyttää samoja tietoja Amazon S3:ssa. Sen avulla voit suorittaa kyselyitä useissa solmuissa riippumatta kyselyn monimutkaisuudesta tai tiedon määrästä.
    Kysy datajärveltäsi
    Amazon Redshift on ainoa tietovarasto, jota käytetään Amazon S3 -tietojärven kyselyyn lataamatta tietoja. Tämä tarjoaa joustavuutta tallentamalla usein käytettävät tiedot Redshiftiin ja jäsentämättömät tai harvoin käytettävät tiedot Amazon S3:een.Turvallinen
    Muutamalla parametriasetuksella voit asettaa Redshiftin käyttämään SSL:ää tietojesi suojaamiseen. Voit myös ottaa salauksen käyttöön, kaikki levylle kirjoitetut tiedot salataan.Nopeampi suorituskyky
    Amazon Redshift tarjoaa sarakemuotoisen tiedon tallennuksen, pakkaamisen ja rinnakkaiskäsittelyn kyselyjen suorittamiseen tarvittavan I/O:n määrän vähentämiseksi. Tämä parantaa kyselyn suorituskykyä.