25 parimat ETL-i intervjuuküsimuste testimist & Vastused

Anonim

Järgnevad korduma kippuvad küsimused intervjuudes, mis on mõeldud esmakursuslastele, samuti kogenud ETL-i testijatele ja arendajatele.

1) Mis on ETL?

Andmelaonduse arhitektuuris on ETL oluline komponent, mis haldab iga äriprotsessi andmeid. ETL tähistab Extract, Transform ja Load . Ekstrakt teeb andmebaasist andmete lugemise protsessi. Transform muudab andmete teisendamise vormingusse, mis võiks olla asjakohane aruandluse ja analüüsi jaoks. Kuigi laadimine teeb andmete kirjutamise sihtandmebaasi.

2) Selgitage, mida sisaldavad ETL-i testimistoimingud?

ETL-i testimine hõlmab järgmist

  • Kontrollige, kas andmed transformeeruvad õigesti vastavalt ärinõuetele
  • Veenduge, et prognoositud andmed laaditakse andmelaosse ilma kärpimise ja kadumiseta
  • Veenduge, et ETL-rakendus teataks valedest andmetest ja asendaks need vaikeväärtustega
  • Skaalautuvuse ja jõudluse parandamiseks veenduge, et andmed laaditakse oodatud aja jooksul

3) Mainige, mis on andmeladu rakenduste tüübid ja mis vahe on andmekaevandusel ja andmeladu?

Andmeladu rakenduste tüübid on

  • Info töötlemine
  • Analüütiline töötlemine
  • Andmete kaevandamine

Andmekaevandamist võib määratleda varjatud ennustava teabe eraldamise protsessina suurtest andmebaasidest ja tõlgendada andmeid, samas kui andmehoidla võib andmete analüütiliseks töötlemiseks kasutada andmemiini. Andmehoidla on protsess, kus mitmest allikast pärit andmed koondatakse ühte ühisesse hoidlasse

4) Milliseid erinevaid tööriistu kasutatakse ETL-is?

  • Cognose otsuste voog
  • Oracle Warehouse Builder
  • Äriobjektid XI
  • SASi äriladu
  • SAS Enterprise ETL server

5) Mis on fakt? Mis tüüpi faktid on?

See on mitmemõõtmelise mudeli keskne komponent, mis sisaldab analüüsitavaid meetmeid. Faktid on seotud mõõtmetega.

Faktide tüübid on

  • Söödalisandi faktid
  • Poollisandi faktid
  • Mittelisandlikud faktid

6) Selgitage, mis on kuubikud ja OLAP-kuubikud?

Kuubikud on andmetöötlusüksused, mis koosnevad andmelao faktitabelitest ja mõõtmetest. See pakub mitmemõõtmelist analüüsi.

OLAP tähistab veebianalüütika töötlemist ja OLAP kuup salvestab aruandluse jaoks suured andmed mõõtmelises vormis. See koosneb faktidest, mida nimetatakse mõõtude järgi kategoriseeritud mõõdikuteks.

7) Selgitage, mis on jälgimise tase ja mis on tüübid?

Jälgimistase on logifailidesse salvestatud andmete hulk. Jälgimistaseme saab liigitada kaheks: Normal ja Verbose. Tavaline tase selgitab jälgimise taset üksikasjalikult, samal ajal kui paljusõnaline selgitab jälgimisastmeid igal real.

8) Selgitage, mis on faktitera?

Teravilja fakti võib määratleda kui taset, millele faktiteave salvestatakse. Seda tuntakse ka kui faktide täpsust

9) Selgitage, mis on faktivaba faktiskeem ja mis on mõõdikud?

Faktitabel ilma mõõtmeteta on faktita faktitabel. See saab vaadata toimuvate sündmuste arvu. Näiteks kasutatakse seda sündmuse, näiteks töötajate arvu registreerimiseks ettevõttes.

Faktitabeli veergudel põhinevad arvandmed on mõõdikud

10) Selgitage, mis on transformatsioon?

Teisendus on hoidlaobjekt, mis genereerib, muudab või edastab andmeid. Transformatsioon on kahte tüüpi: aktiivne ja passiivne

11) Selgitage otsingu muundamise kasutamist?

Otsingu teisendamine on kasulik

  • Seotud väärtuse hankimine tabelist veeru väärtuse abil
  • Värskendage aeglaselt muutuvat dimensioonitabelit
  • Kontrollige, kas tabelis on kirjeid juba olemas

12) Selgitage, mis on jaotamine, räsijaotus ja ümmarguse roboti jaotamine?

Toimivuse parandamiseks jagatakse tehingud alamjaotusteks, seda nimetatakse jaotuseks. Partitsioonimine võimaldab Informatica Serveril luua mitme ühenduse mitme allikaga

Vaheseinte tüübid on

Ümberjaotuse jagamine:

  • Informaatika abil jaotatakse andmed kõigi jaotiste vahel ühtlaselt
  • Igas sektsioonis, kus töödeldavate ridade arv on ligikaudu sama, saab seda jaotust kasutada

Räsi jaotamine:

  • Informatica server kasutab võtmete jaotamiseks partitsioonide vahel andmete rühmitamise funktsiooni
  • Seda kasutatakse tagamaks, et samas partitsioonis peavad olema tagatud sama partitsioonivõtmega ridade protsessid

13) Mainige, mis on DataReaderi sihtkohaadapteri kasutamise eelis?

DataReaderi sihtkohaadapteri kasutamise eeliseks on see, et see täidab mälus ADO-kirjekomplekti (koosneb kirjetest ja veergudest) ja paljastab DataReader-liidese juurutamisega DataFlow-ülesande andmed, nii et teine ​​rakendus saaks neid andmeid tarbida.

14) Kuidas on võimalik tabelit värskendada SSIS-i (SQL Serveri integreerimisteenus) abil?

SSIS-i abil tabeli värskendamiseks on võimalikud viisid:

  • Kasutage SQL-i käsku
  • Kasutage astmelauda
  • Kasuta vahemälu
  • Kasutage skriptiülesannet
  • Kui kasutatakse MSSQL-i, kasutage värskendamiseks andmebaasi täielikku nime

15) Kui teil on otsingu jaoks mitte-OLEDB (objektide linkimise ja manustamise andmebaas) allikas, mida teete?

Kui teil on otsingu jaoks mitte-OLEBD-allikas, peate andmete laadimiseks ja allikana kasutama vahemälu

16) Millisel juhul kasutate ühendatud ja ühendamata teisendustes dünaamilist vahemälu ja staatilist vahemälu?

  • Dünaamilist vahemälu kasutatakse siis, kui peate värskendama põhitabelit ja aeglaselt muutuvaid mõõtmeid (SCD) tüüp 1
  • Lameda faili jaoks kasutatakse staatilist vahemälu

17) Selgitage, millised on ühendamata ja ühendatud otsingu erinevused?

Ühendatud otsing

Ühendamata otsing

  • Ühendatud otsing osaleb kaardistamises

- Seda kasutatakse juhul, kui kaardistamisel kasutatakse avaldise teisendamise asemel otsingufunktsiooni

  • Tagastada saab mitu väärtust

- tagastab ainult ühe väljundporti

  • Selle saab ühendada teise teisendusega ja tagastada väärtuse
  • Teist transformatsiooni ei saa ühendada
  • Staatilist või dünaamilist vahemälu saab ühendatud otsingu jaoks kasutada
  • Ühendus pole ainult staatilise vahemäluna
  • Ühendatud otsing toetab kasutaja määratud vaikeväärtusi
  • Ühendamata otsing ei toeta kasutaja määratud vaikeväärtusi
  • Veerus Ühendatud otsing mitu saab tagasi samast reast või lisada dünaamilise otsingu vahemällu
  • Ühendamata otsing määrab ühe tagasipordi ja tagastab igast reast ühe veeru

18) Selgitage, mis on andmeallika vaade?

Andmeallika vaade võimaldab määratleda relatsiooniskeemi, mida kasutatakse analüüsiteenuste andmebaasides. Dimensioonid ja kuubikud luuakse otse andmeallika objektide asemel andmeallika vaadetest.

19) Selgitage, mis vahe on OLAP-i ja ETL-i tööriistadel?

ETL-i ja OLAP-i tööriista erinevus seisneb selles

ETL-i tööriist on mõeldud andmete väljavõtmiseks pärandsüsteemidest ja laadimiseks teatud andmebaasi koos teatud andmete puhastamise protsessiga.

Näide: andmete etapp, Informatica jne

Kui OLAP on mõeldud aruandluse eesmärgiks OLAP-andmetes, mis on saadaval mitmesuunalises mudelis.

Näide: äriobjektid, Cognos jne

20) Kuidas saate SAP-andmeid Informatica abil välja tõmmata?

  • Toiteühenduse suvandiga eraldate SAP-andmed informaatika abil
  • Installige ja konfigureerige tööriist PowerConnect
  • Importige allikas Source Analyzerisse. Informatica ja SAP vahel toimib Powerconnect kui rööbastee. Järgmine samm on ABAP-koodi genereerimine kaardistamiseks, ainult SAT-st saab andmeid hankida ainult informaatika
  • Allikate ühendamiseks ja importimiseks välistest süsteemidest kasutatakse Power Connecti

21) Maini, mis vahe on Power Martil ja Power Centeril?

Elektrikeskus

Võim Mart

  • Oletame, et töödeldakse tohutut andmemahtu
  • Oletame, et töödeldakse väikest andmemahtu
  • See toetab selliseid ERP-allikaid nagu SAP, inimesed pehmed jne.
  • See ei toeta ERP allikaid
  • See toetab kohalikku ja ülemaailmset hoidlat
  • See toetab kohalikku hoidlat
  • See muudab lokaalse globaalseks hoidlaks
  • Sellel pole spetsifikatsiooni, mis muudaks lokaalse globaalseks hoidlasse

22) Selgitage, mis on lavastusala ja mis on lavastusala eesmärk?

Andmete järk on piirkond, kus hoiate andmeid ajutiselt andmelao serveris. Andmete etapistamine sisaldab järgmisi samme

  • Alusandmete väljavõtmine ja andmete ümberkujundamine (ümberkorraldamine)
  • Andmete teisendamine (andmete puhastamine, väärtuste teisendamine)
  • Asendusvõtmete määrangud

23) Mis on bussskeem?

Erinevate äriprotsesside jaoks ühiste mõõtmete tuvastamiseks kasutatakse BUS-skeemi. Sellel on kohandatud mõõtmed koos teabe standardse määratlusega

24) Selgitage, mis on andmete puhastamine?

Andmete puhastamine on andmete kustutamine andmelaost. See kustutab rämpsandmed nagu nullväärtuste või lisatühikutega read.

25) Selgitage, mis on skeemi objektid?

Skeemi objektid on loogiline struktuur, mis viitab otseselt andmebaaside andmetele. Skeemiobjektid sisaldavad tabeleid, vaateid, järjestuse sünonüüme, indekse, klastreid, funktsioonipakette ja andmebaasilinke

26) Selgitage neid mõisteid Session, Worklet, Mapplet ja Workflow?

  • Mapplet: see korraldab või loob teisenduste komplekte
  • Tööleht: see tähistab antud ülesannete konkreetset kogumit
  • Töövoog: see on juhiste kogum, mis annab serverile teada, kuidas ülesandeid täita
  • Seanss: see on parameetrite kogum, mis ütleb serverile, kuidas andmeid allikatest sihtmärkidesse teisaldada

Tasuta PDF-i allalaadimine: ETL-i intervjuu küsimuste ja vastuste testimine