- Redshift on nopea ja tehokas, täysin hallittu, petatavun mittakaavainen tietovarastopalvelu pilvessä.
- Asiakkaat voivat käyttää Redshiftiä vain 0,25 dollarilla tunnissa ilman sitoumuksia tai etukäteiskustannuksia ja skaalata petabyyttiin tai enemmän hintaan 1 000 dollaria per teratavu vuodessa.
OLAP
OLAP on Online Analytics Processing System käyttämä Punasiirtymä .
Esimerkki OLAP-tapahtumasta:
Oletetaan, että haluamme laskea digitaalisen radiotuotteen nettovoiton EMEA- ja Tyynenmeren alueella. Tämä vaatii suuren määrän ennätyksiä. Nettovoiton laskemiseen tarvitaan seuraavat tietueet:
- EMEA-alueella myytyjen radioiden summa.
- Tyynenmeren alueella myyty radioiden summa.
- Radion yksikköhinta kullakin alueella.
- Jokaisen radion myyntihinta
- Myyntihinta - yksikköhinta
Monimutkaiset kyselyt vaaditaan yllä olevien tietueiden hakemiseen. Data Warehousing -tietokannat käyttävät erityyppistä arkkitehtuuria sekä tietokantanäkökulmasta että infrastruktuurikerroksen näkökulmasta.
Punasiirtymän asetukset
Redshift koostuu kahden tyyppisistä solmuista:
Yksi solmu: Yksi solmu tallentaa jopa 160 Gt.
Monisolmu: Monisolmu on solmu, joka koostuu useammasta kuin yhdestä solmusta. Sitä on kahta tyyppiä:
Se hallitsee asiakasyhteyksiä ja vastaanottaa kyselyitä. Johtava solmu vastaanottaa kyselyt asiakassovelluksista, jäsentää kyselyt ja kehittää suoritussuunnitelmat. Se koordinoi näiden suunnitelmien rinnakkaissuorituksen laskentasolmun kanssa ja yhdistää kaikkien solmujen välitulokset ja palauttaa sitten lopputuloksen asiakassovellukseen.
Laskentasolmu suorittaa suoritussuunnitelmat, ja sitten välitulokset lähetetään johtosolmulle koottavaksi ennen kuin ne lähetetään takaisin asiakassovellukseen. Siinä voi olla jopa 128 laskentasolmua.
Ymmärretään johtosolmun käsite ja lasketaan solmut esimerkin kautta.
Redshift-varasto on kokoelma laskentaresursseja, jotka tunnetaan solmuina, ja nämä solmut on järjestetty klusteriksi kutsuttuun ryhmään. Jokainen klusteri toimii Redshift Enginessä, joka sisältää yhden tai useamman tietokannan.
Kun käynnistät Redshift-instanssin, se alkaa yhdellä 160 Gt:n solmulla. Kun haluat kasvaa, voit lisätä muita solmuja hyödyntääksesi rinnakkaiskäsittelyä. Sinulla on johtajasolmu, joka hallitsee useita solmuja. Leader-solmu hoitaa asiakasyhteyden sekä laskentasolmut. Se tallentaa tiedot laskentasolmuihin ja suorittaa kyselyn.
Miksi Redshift on 10 kertaa nopeampi
Punasiirtymä on 10 kertaa nopeampi seuraavista syistä:
Sen sijaan, että Amazon Redshift tallentaisi tiedot rivien sarjana, se järjestää tiedot sarakkeiden mukaan. Rivipohjaiset järjestelmät ovat ihanteellisia tapahtumien käsittelyyn, kun taas sarakepohjaiset järjestelmät ovat ihanteellisia tietovarastointiin ja analytiikkaan, joissa kyselyihin liittyy usein suurille tietojoukoille suoritettuja aggregaatteja. Koska vain kyselyihin osallistuvat sarakkeet käsitellään ja saraketiedot tallennetaan tallennusvälineeseen peräkkäin, sarakepohjaiset järjestelmät vaativat vähemmän I/O:ita, mikä parantaa kyselyn suorituskykyä.
Saraketietovarastot voidaan pakata paljon enemmän kuin rivipohjaisia tietovarastoja, koska samanlaiset tiedot tallennetaan peräkkäin levylle. Amazon Redshift käyttää useita pakkaustekniikoita ja voi usein saavuttaa merkittävää pakkausta verrattuna perinteisiin relaatiotietovarastoihin.
Amazon Redshift ei vaadi indeksejä tai materialisoituja näkymiä, joten se vaatii vähemmän tilaa kuin perinteiset relaatiotietokantajärjestelmät. Kun lataat tietoja tyhjään taulukkoon, Amazon Redshift ottaa tiedoistasi näytteitä automaattisesti ja valitsee sopivimman pakkaustekniikan.
Amazon Redshift jakaa tiedot automaattisesti ja lataa kyselyn eri solmuille. Amazon Redshiftin avulla uusien solmujen lisääminen tietovarastoon on helppoa, ja tämä mahdollistaa nopeamman kyselyn suorituskyvyn tietovarastosi kasvaessa.
Punasiirtymän ominaisuudet
Redshiftin ominaisuudet on esitetty alla:
java alustustaulukko
Redshift on helppo asentaa ja käyttää. Voit ottaa uuden tietovaraston käyttöön vain muutamalla napsautuksella AWS-konsolissa, ja Redshift huolehtii infrastruktuurista automaattisesti puolestasi. AWS:ssä kaikki hallinnolliset tehtävät, kuten varmuuskopiointi ja replikointi, on automatisoitu, sinun on keskityttävä tietoihisi, ei hallintaan.
Redshift varmuuskopioi tiedot automaattisesti S3:lle. Voit myös kopioida tilannekuvia S3:ssa toisella alueella katastrofista palautumista varten.
Amazon Redshift on kustannustehokkain tietovarastopalvelu, koska joudut maksamaan vain käyttämästäsi.
Sen kustannukset alkavat 0,25 dollarista tunnissa ilman sitoutumista ja etukäteiskustannuksia, ja ne voivat nousta 250 dollariin per teratavu vuodessa.
Amazon Redshift on ainoa tietovarastopalvelu, joka tarjoaa On Demand -hinnoittelun ilman etukäteiskustannuksia, ja se tarjoaa myös varatun instanssin hinnoittelun, joka säästää jopa 75 % tarjoamalla 1–3 vuoden ajanjakson.
Voit valita jommankumman kahdesta solmusta punasiirtymän optimoimiseksi.
Tiheä laskentasolmu voi luoda korkean suorituskyvyn tietovarastoja käyttämällä nopeita suorittimia, suurta määrää RAM-muistia ja puolijohdelevyjä.
Jos haluat alentaa kustannuksia, voit käyttää tiheää tallennussolmua. Se luo kustannustehokkaan tietovaraston käyttämällä suurempaa kiintolevyasemaa.
Amazon Redshift skaalaa automaattisesti ylös tai alas solmuja tarpeen muutosten mukaan. Vain muutamalla napsautuksella AWS-konsolissa tai yhdellä API-kutsulla voidaan helposti muuttaa tietovaraston solmujen määrää.
Se on Redshiftin ominaisuus, jonka avulla voit suorittaa kyselyitä Amazon S3:n datan eksatavuilla. Amazon S3 on turvallinen ja kustannustehokas data rajoittamattoman tiedon tallentamiseen avoimessa muodossa.
Redshiftin ominaisuus tarkoittaa, että useat kyselyt voivat käyttää samoja tietoja Amazon S3:ssa. Sen avulla voit suorittaa kyselyitä useissa solmuissa riippumatta kyselyn monimutkaisuudesta tai tiedon määrästä.
Amazon Redshift on ainoa tietovarasto, jota käytetään Amazon S3 -tietojärven kyselyyn lataamatta tietoja. Tämä tarjoaa joustavuutta tallentamalla usein käytettävät tiedot Redshiftiin ja jäsentämättömät tai harvoin käytettävät tiedot Amazon S3:een.
Muutamalla parametriasetuksella voit asettaa Redshiftin käyttämään SSL:ää tietojesi suojaamiseen. Voit myös ottaa salauksen käyttöön, kaikki levylle kirjoitetut tiedot salataan.
Amazon Redshift tarjoaa sarakemuotoisen tiedon tallennuksen, pakkaamisen ja rinnakkaiskäsittelyn kyselyjen suorittamiseen tarvittavan I/O:n määrän vähentämiseksi. Tämä parantaa kyselyn suorituskykyä.