Информатица ЕТЛ: Водич за почетнике за разумевање ЕТЛ-а помоћу Информатица ПоверЦентер-а



Разумевање концепата Информатица ЕТЛ и различитих фаза ЕТЛ процеса и увежбавање случаја употребе који укључује базу података запослених.

Сврха Информатица ЕТЛ је да корисницима пружи не само процес издвајања података из изворних система и њиховог уношења у складиште података, већ и пружање корисницима заједничке платформе за интегрисање података са различитих платформи и апликација.То је довело до повећања потражње за .Пре него што разговарамо о Информатица ЕТЛ, прво схватимо зашто нам је потребан ЕТЛ.

Зашто нам је потребан ЕТЛ?

Свака компанијаових дана морају обрађују велике скупове података из различитих извора. Ове податке треба обрадити како би се добили проницљиви подаци за доношење пословних одлука. Али, често такви подаци имају следеће изазове:





  • Велике компаније генеришу пуно података и тако огроман део података може бити у било ком формату. Били би доступни у више база података и многим неструктурираним датотекама.
  • Ови подаци се морају упоредити, комбиновати, упоређивати и учинити да функционишу као бешавна целина. Али различите базе података не комуницирају добро!
  • Многе организације су примениле интерфејсе између ових база података, али су се суочиле са следећим изазовима:
    • Сваки пар база података захтева јединствени интерфејс.
    • Ако промените једну базу података, можда ће бити потребно надоградити много интерфејса.

Испод можете видети разне базе података организације и њихове интеракције:

Разни скупови података организације - Информатица - ЕТЛ - Едурека

Различите базе података које користе различити одсеци организације



Различите интеракције база података у организацији

Као што се горе види, организација може имати различите базе података у својим различитим одељењима и интеракцију између њих постаје тешко применити јер се за њих морају створити различити интерфејси за интеракцију. Да би се превазишли ови изазови, најбоље могуће решење је коришћење концепата Интеграција података што би омогућило међусобну комуникацију података из различитих база података и формата. Доња слика нам помаже да схватимо како алат за интеграцију података постаје уобичајени интерфејс за комуникацију између различитих база података.

Разне базе података повезане путем интеграције података



Али постоје различити процеси за обављање интеграције података. Међу овим процесима ЕТЛ је најоптималнији, ефикаснији и најпоузданији процес. Путем ЕТЛ-а, корисник не само да може унети податке из различитих извора, већ може извршити различите операције на подацима пре него што их ускладишти на крајњи циљ.

Међу различитим доступним ЕТЛ алатима доступним на тржишту, Информатица ПоверЦентер је водећа платформа за интеграцију података на тржишту. Тестирајући на скоро 500.000 комбинација платформи и апликација, Информатица ПоверЦентер интер делује са најширем могућим спектром различитих стандарда, система и апликација. Хајде да сада разумемо кораке који су укључени у ЕТЛ процес Информатица.

Информатика ЕТЛ | Информатица Арцхитецтуре | Водич за Информатица ПоверЦентер | Едурека

Овај водич за Едурека Информатица помаже вам да детаљно разумете основе ЕТЛ-а користећи Информатица Поверцентер.

Кораци у Информатица ЕТЛ процесу:

Пре него што пређемо на различите кораке који су укључени у Информатица ЕТЛ, имаћемо преглед ЕТЛ-а. У ЕТЛ-у, Издвајање је тамо где се подаци издвајају из хомогених или хетерогених извора података, Трансформација где се подаци трансформишу ради складиштења у одговарајућем формату или структури за потребе испитивања и анализе и учитавање где се подаци учитавају у коначну циљну базу података, складиште података, складиште података или складиште података. Слика испод помоћи ће вам да разумете како се одвија процес Информатица ЕТЛ.

Преглед ЕТЛ процеса

Као што се види горе, Информатица ПоверЦентер може учитати податке из различитих извора и складиштити их у једно складиште података. Погледајмо сада кораке који су укључени у ЕТЛ процес Информатица.

Постоје углавном 4 корака у ЕТЛ процесу Информатица, хајде да их сада дубље разумемо:

  1. Издвоји или ухвати
  2. Пилинг или чишћење
  3. Трансформисати
  4. Оптерећење и индекс

1. Издвајање или хватање: Као што се види на доњој слици, Хватање или Екстракт је први корак у Информатица ЕТЛ процесу.То је поступак добијања снимка изабраног подскупа података из извора, који се мора учитати у складиште података. Снимак је статички приказ података у бази података само за читање. Процес екстракције може бити две врсте:

  • Пуни извод: Подаци се у потпуности издвајају из изворног система и није потребно пратити промене у извору података од последњег успешног издвајања.
  • Инкрементални екстракт: Ово ће ухватити само промене настале од последњег пуног извода.

Фаза 1: Издвајање или хватање

2. Пилинг или чишћење: Ово је поступак чишћења података који долазе из извора коришћењем различитих техника препознавања узорака и АИ за побољшање квалитета података који се преносе. Обично су грешке попут правописних погрешака, погрешних датума, нетачне употребе поља, неусклађених адреса, недостајућих података, дупликата података, недоследностиистакнуто, а затим исправљено или уклоњеноу овом кораку. Такође, у овом кораку се обављају операције попут декодирања, поновног форматирања, временског жигосања, конверзије, генерисања кључа, спајања, откривања / евидентирања грешака, лоцирања података који недостају. Као што се види на доњој слици, ово је други корак процеса Информатица ЕТЛ.

Фаза 2: Прочишћавање или чишћење података

3. Трансформација: Као што се види на доњој слици, ово је трећи и најважнији корак у процесу Информатица ЕТЛ. Трансформације је операција претварања података из формата изворног система у костур складишта података. Трансформација се у основи користи за представљање скупа правила, која дефинишу ток података и начин на који се подаци учитавају у циљеве. Да бисте сазнали више о Трансформацији, погледајте Трансформације у Информатици Блог.

Фаза 3: Трансформација

4. Оптерећење и индекс: Ово је последњи корак процеса Информатица ЕТЛ, као што се види на доњој слици. У овој фази трансформисане податке смештамо у складиште и креирамо индексе за податке. Доступне су две главне врсте учитавања података на основу процеса учитавања:

  • Пуно оптерећење или скупно оптерећење :Процес учитавања података када то радимо први пут. Посао извлачи читав волумен података из изворне табеле и учитава се у циљно складиште података након примјене потребних трансформација. Покренуће се једнократно, а затим ће се само промене снимити као део инкременталног екстракта.
  • Инкрементално оптерећење или освежавање : Само модификовани подаци ће бити ажурирани у циљу праћени пуним оптерећењем. Промене ће бити забележене упоређивањем створеног или измењеног датума са датумом последњег покретања посла.Само модификовани подаци извучени су из извора и биће ажурирани у циљу без утицаја на постојеће податке.

Фаза 4: Оптерећење и индекс

Ако сте разумели ЕТЛ процес Информатица, сада смо у бољој позицији да схватимо зашто је Информатица најбоље решење у таквим случајевима.

Карактеристике Информатица ЕТЛ:

За све интеграције података и ЕТЛ операције, Информатица нас је обезбедила Информатица ПоверЦентер . Погледајмо сада неке кључне карактеристике Информатица ЕТЛ:

  • Пружа могућност спецификације великог броја правила трансформације са ГУИ-јем.
  • Генеришите програме за трансформисање података.
  • Руковање са више извора података.
  • Подржава екстракцију података, чишћење, агрегирање, реорганизацију, трансформацију и учитавање.
  • Аутоматски генерише програме за издвајање података.
  • Брзо учитавање циљних складишта података.

Испод су типични сценарији у којима се користи Информатица ПоверЦентер:

  1. Миграција података:

Компанија је купила нову апликацију за обрачун рачуна за свој рачун. ПоверЦентер може преместити постојеће податке о налогу у нову апликацију. Доња слика ће вам помоћи да разумете како можете да користите Информатица ПоверЦентер за миграцију података. Информатица ПоверЦентер може лако сачувати линију података за порезе, рачуноводство и друге законски прописане сврхе током процеса миграције података.

Миграција података из старије рачуноводствене апликације у нову

  1. Интеграција апликација:

Рецимо да компанија-А купује компанију-Б. Дакле, да би се постигле предности консолидације, систем наплате компаније-Б мора бити интегрисан у систем наплате компаније-А, што се лако може урадити помоћу Информатица ПоверЦентер-а. Доња слика ће вам помоћи да разумете како можете да користите Информатица ПоверЦентер за интеграцију апликација између компанија.

Интегрисање примене између компанија

  1. Складиштење података

Типичне радње потребне у складиштима података су:

  • Комбиновање информација из многих извора за анализу.
  • Премештање података из многих база података у складиште података.

Сви горе наведени типични случајеви могу се лако извести помоћу Информатица ПоверЦентер-а. Испод можете видети да се Информатица ПоверЦентер користи за комбиновање података из различитих врста база података као што су Орацле, СалесФорце итд. И довођење у заједничко складиште података које је креирао Информатица ПоверЦентер.

Подаци Из различитих база података интегрисаних у заједничко складиште података

  1. Миддлеваре

Рецимо да малопродајна организација користи САП Р3 за своје малопродајне апликације и САП БВ као своје складиште података. Директна комуникација између ове две апликације није могућа због недостатка комуникационог интерфејса. Међутим, Информатица ПоверЦентер се може користити као посреднички софтвер између ове две апликације. На слици испод можете видети архитектуру начина на који се Информатица ПоверЦентер користи као посреднички софтвер између САП Р / 3 и САП БВ. Апликације из САП Р / 3 преносе своје податке у АБАП оквир који их затим преноси уСАП продајно место (ПОС) и САПРачуни услуга (БОС). Информатица ПоверЦентер помаже у преносу података са ових услуга у САП пословно складиште (БВ).

Информатица ПоверЦентер као Миддлеваре у САП Ретаил Арцхитецтуре

Иако сте видели неколико кључних карактеристика и типичних сценарија Информатица ЕТЛ, надам се да разумете зашто је Информатица ПоверЦентер најбољи алат за ЕТЛ процес. Погледајмо сада пример употребе Информатица ЕТЛ.

Случај употребе: Спајање две табеле за добијање Јединствене детаљне табеле

Рецимо да својим запосленима желите да омогућите мудар превоз, јер се одељења налазе на различитим локацијама. Да бисте то урадили, прво морате знати којем одељењу припада сваки запослени и где се налази одељење. Међутим, детаљи о запосленима чувају се у различитим табелама и потребно је да податке о одељењу придружите постојећој бази података са детаљима свих запослених. Да бисмо то урадили, прво ћемо учитати обе табеле у Информатица ПоверЦентер, извршити трансформацију изворног квалификатора на подацима и на крају учитати детаље у циљану базу података.Почнимо:

Корак 1 : Отворите ПоверЦентер Десигнер.

Испод је почетна страница Информатица ПоверЦентер Десигнер.

Повежимо се сада са спремиштем. У случају да нисте конфигурисали своја спремишта или се суочите са било којим проблемом, можете да проверите наше Блог.

Корак 2: Кликните десним тастером миша на ваше спремиште и изаберите опцију повезивања.

Када кликнете на опцију повезивања, од вас ће се затражити доњи екран и затражити ваше корисничко име и лозинку за спремиште.

Након што се повежете са спремиштем, морате отворити своју радну фасциклу као што је приказано доле:

Од вас ће бити затражено да питате име свог мапирања. Наведите име свог мапирања и кликните на ОК (назвао сам га као м-ЗАПОСЛЕНИ ).

Корак 3: Учитајмо сада табеле из базе података, започните повезивањем са базом података. Да бисте то урадили, одаберите картицу Извори и опцију Увези из базе података као што је приказано доле:

Када кликнете на Увези из базе података, на екрану ће се приказати упит као у наставку да бисте питали детаље ваше базе података и њено корисничко име и лозинку за повезивање (користим орацле базу података и корисника ХР-а).

Кликните на Повежи да бисте се повезали са базом података.

Корак 4: Како желим да се придружим ЗАПОСЛЕНИ и ОДЕЉЕЊЕ табеле, изабраћу их и кликнути на ОК.
Извори ће бити видљиви у вашем радном простору дизајнера мапирања, као што се види доле.

Корак 5: Слично учитајте табелу циљева на мапирање.

Корак 6: Сад да повежемо квалификатор извора и циљну табелу. Кликните десним тастером миша на било које празно место радног простора и изаберите Аутолинк као што је приказано доле:

Испод је мапирање које повезује Аутолинк.

Корак 7: Како морамо да повежемо обе табеле са изворним квалификатором, изаберите ступце табеле одељења и спустите га у изворни квалификатор као што је приказано доле:

Спустите вредности колона у Изворни квалификатор СК_ЕМПЛОИЕЕС .

Испод је ажурирани изворни квалификатор.

Корак 8: Двапут кликните на Изворни квалификатор да бисте уредили трансформацију.

Добићете скочни прозор Уређивање трансформације, као што је приказано доле. Кликните картицу Својства.

Корак 9: На картици Својства кликните на поље Вредност реда УсерДефинед Јоин.

Добићете следећи СКЛ уређивач:

Корак 10: Ентер ЕМПЛОИЕЕС.ДЕПАРТМЕНТ_ИД = ОДЕЉЕЊЕ.ДЕПАРТМЕНТ_ИД као услов за спајање обе табеле у СКЛ пољу и кликните на ОК.

Корак 11: Сада кликните на ред СКЛ упит да бисте генерисали СКЛ за придруживање како је приказано доле:

Добићете следећи СКЛ Едитор, кликните на Генерате СКЛ опцију.

Следећи СКЛ ће бити генерисан за стање које смо навели у претходном кораку. Кликните на ОК.

Корак 12: Кликните на Аппли и ОК.

Испод је завршено мапирање.

Завршили смо са дизајнирањем начина на који се подаци морају преносити од извора до циља. Међутим, стварни пренос података тек треба да се догоди и за то морамо да користимо ПоверЦентер Воркфлов Десигн. Извршење тока посла довешће до преноса података са извора на циљ. Да бисте сазнали више о току рада, погледајте нашу Водич за информатику: Ток рада Блог

Корак 13: Ли ми сада покренимо Воркфлов Манагер кликом на икону В као што је приказано доле:

шта је виртуелна метода

Испод је почетна страница дизајнера тока посла.

Корак 14: Створимо сада нови ток посла за наше мапирање. Кликните картицу Ток посла и изаберите Створи опцију.

Добићете искачући прозор у наставку. Наведите име вашег процеса рада и кликните на ОК.

Корак 15 : Када се креира ток посла, у радном простору Воркфлов Манагер добијамо икону Старт.

Додамо сада нову сесију у радни простор као што се види доле кликом на икону сесије и кликом на радни простор:

Кликните на радни простор да бисте поставили икону Сессион.

Корак 16: Током додавања сесије морате одабрати Мапирање које сте креирали и сачували у горњим корацима. (Сачувао сам га као м-ЗАПОСЛЕНИ).

Испод је радни простор након додавања иконе сесије.

Корак 17 : Сада када сте креирали нову сесију, морамо је повезати са почетним задатком. То можемо учинити кликом на икону Задатак везе као што је приказано доле:

Прво кликните икону Старт, а затим икону Сесија да бисте успоставили везу.

Испод је повезан ток посла.

Корак 18: Сада када смо завршили дизајн, започнимо радни ток. Кликните картицу Воркфлов и одаберите опцију Старт Воркфлов.

Менаџер тока посла који покреће Монитор тока рада.

Корак 19 : Једном када започнемо ток посла, Воркфлов Манагер се аутоматски покрећеиомогућава вам надгледање извршења вашег процеса рада. Испод можете видети да Воркфлов Монитор приказује статус вашег тока посла.

Корак 20: Да бисте проверили статус тока посла, кликните десним тастером миша на ток рада и изаберите Дохвати својства покретања као што је приказано доле:

Изаберите картицу Извор / циљна статистика.

Испод можете видети број редова који су пренесени између извора и циља након трансформације.

Такође можете верификовати свој резултат проверавајући циљну табелу као што је приказано доле.

Надам се да је овај блог Информатица ЕТЛ-а био користан за ваше разумевање концепата ЕТЛ-а користећи Информатица и да је створио довољно интереса да научите више о Информатици.

Ако вам је овај блог био користан, можете погледати и нашу серију блогова са водичима за Информатица , Водич за Информатица: Разумевање Информатице „изнутра“ и Трансформације Информатица: Срце и душа Информатица ПоверЦентер-а . Ако тражите детаље о сертификацији Информатица, можете проверити наш блог Сертификација Информатица: Све што треба знати .

Ако сте се већ одлучили за Информатицу бавите каријером, препоручио бих вам да погледате нашу страница курса. Обука за сертификацију Информатица у Едуреки учиниће вас стручњаком за Информатицу кроз сесије које воде инструктори уживо и практичну обуку користећи случајеве употребе из стварног живота.