Зашто бисте се мешали кад се већ можете придружити у Таблеау-у?



Мешање података у табели - метода која се користи када постоје повезани подаци у више извора података, које желите заједно да анализирате у једном приказу.

У свету који дневно генерише и троши 2,5 квинтилион бајта података, организације су дужне да траже нове методе за трансформисање и комбиновање података како би постигле оптималну ефикасност. Један од таквих метода комбиновања података је Мешање података у табели .

финал вс напокон вс финализе

Будући да ово служи тако важној сврси у циклусу података било које дате организације, у већини представља врло битан модул . На овом блогу ћемо разговарати о следећим концептима:





Зашто вам је потребно мешање података у Таблеау?

Претпоставимо да сте ви Табела програмера који има податке о трансакцијама ускладиштене у Салесфорцеу и податке о квотама ускладиштене у Аццессу. Подаци које желите да комбинујете чувају се у различитим базама података, а грануларност података забележених у свакој табели разликује се у два извора података, па је мешање података најбољи начин за комбиновање ових података.

Мешање података је корисно под следећим условима:



  1. Желите да комбинујете податке из различитих база података које нису подржане спајањем више база података.

    Спајања више база података не подржавају везе са коцкама (на пример, Орацле Ессбасе) или неким везама само са екстрактом (на пример, Гоогле Аналитицс). У овом случају подесите појединачне изворе података за податке које желите да анализирате, а затим користите комбиновање података за комбиновање извора података на једном листу.

  2. Подаци су на различитим нивоима детаља.

    Понекад један скуп података снима податке помоћу различитих ниво детаља тј. већа или мања грануларност од осталих скупова података.

    На пример, претпоставимо да анализирате податке о трансакцијама и податке о квотама. Подаци о трансакцијама могу обухватити све трансакције. Међутим, подаци о квотама могу агрегирати трансакције на кварталном нивоу. Будући да се вредности трансакција бележе на различитим нивоима детаља у сваком скупу података, требало би да користите комбиновање података за комбиновање података.



Шта је мешање података у табели?

Мешање података је врло моћна карактеристика у Одбор, табла . Користи се када постоје повезани подаци у више извора података, које желите заједно да анализирате у једном приказу. То је метода за комбиновање података која допуњује табелу података из једног извора података колонама података из другог извора података.

Обично користите спајања за обављање ове врсте комбиновања података, али понекад је боље користити мешање података, зависно од фактора као што су врста података и њихова грануларност.

уџбеник за велике податке за почетнике

По чему се разликује од спајања података?

Мешање података симулира традиционално лево спајање. Главна разлика између њих је када спајање се врши с обзиром на агрегацију.

Лево придружено

Када користите лево удруживање за комбиновање података, упит се шаље у базу података у којој се изводи спајање. Коришћење левог спајања враћа све редове из леве табеле и све редове из десне табеле која има одговарајуће подударање редова у левој табели. Резултати спајања се затим шаљу назад и обједињују у Таблеау-у.

На пример, претпоставимо да имате следеће табеле. Ако су уобичајене колоне ИД корисник , лево удруживање узима све податке из леве табеле, као и све податке из десне табеле, јер сваки ред има одговарајуће подударање реда у левој табели.

Спајање података - Мешање података у Таблеау - ЕдурекаМешање података

Када користите комбиновање података за комбиновање података, упит се шаље бази података за сваки извор података који се користи на листу. Резултати упита, укључујући обједињене податке, Таблеау враћа и комбинује. Поглед користи све редове из примарног извора података, леве табеле и обједињене редове из секундарног извора података, десне табеле, на основу димензије поља повезивања.

Можете да промените поље за повезивање или да додате више поља за повезивање да бисте у мешавину укључили различите или додатне редове података из секундарног извора података, мењајући обједињене вредности.

На пример, претпоставимо да имате следеће табеле. Ако су поља за повезивање ИД корисник у обе табеле мешањем ваших података узимају се сви подаци из леве табеле, а леву табелу допуњују подацима из десне табеле. У овом случају, све вредности не могу бити део резултујуће табеле због следећег:

  • Ред у левој табели нема одговарајуће подударање реда у десној табели, као што је означено нулл вредношћу.
  • У редовима у десној табели има више одговарајућих вредности, као што је означено звездицом (*).

Претпоставимо да имате исте табеле као горе, али секундарни извор података садржи ново поље под називом Сврха . Опет, ако је поље за повезивање ИД корисник , мешање ваших података узима све податке из леве табеле и допуњује их подацима из десне табеле. У овом случају ћете видети исту нулл вредност и звездице у претходном примеру поред следећег:

  • Због Сврха поље је мера, видите вредности реда заСврхапоље обједињено пре него што се подаци у десној табели комбинују са подацима у левој табели.
  • Као и у претходном примеру, ред у левој табели нема одговарајући ред за Сврха поље, како је назначено другом нулл вредношћу.

Када заменити чланство Мешање

1. Податке треба очистити.

Ако се ваше табеле не поклапају међусобно правилно након спајања, подесите изворе података за сваку табелу, извршите потребна прилагођавања (то јест, преименујте колоне, промените типове података колона, направите групе, користите прорачуне итд.) И затим користите комбиновање података за комбиновање података.

2. Придруживања узрокују двоструке податке.

Дуплирани подаци након спајања симптом су података на различитим нивоима детаља. Ако приметите дупликате података, уместо да креирате спој, уместо тога користите мешање података за мешање у заједничку димензију.

3. Имате пуно података.

Обично се спајања препоручују за комбиновање података из исте базе података. База података обрађује удруживања, што омогућава придруживањима да искористе неке од изворних могућности базе података. Међутим, ако радите са великим скуповима података, удруживања могу оптеретити базу података и значајно утицати на перформансе. У овом случају, мешање података може помоћи. Будући да Таблеау обрађује комбиновање података након агрегирања података, има мање података за комбиновање. Када је мање података за комбиновање, генерално се побољшавају перформансе.

Спајање података у табели

Мешање података можете користити када податке имате у одвојеним изворима података које желите заједно да анализирате на једном листу. Таблеау има два уграђена извора података која су именована Узорак-супермаркета и Узорак ланца кафе.мдб који ће се користити за илустрацију мешања података.

1. корак: Повежите се са подацима и подесите изворе података

  • Повежите се на скуп података и подесите извор података на страници извора података. Ан инбуилт извор података Узорак ланца кафе.мдб ,која је датотека базе података МС Аццесс, користиће се за илустрацију мешања података.
  • Иди на Подаци > Нови извор података, повежите се са другим скупом података.Овај пример користи Узорак - Суперсторе извор података. Т.кокошка је поставила извор података.
  • Кликните картицу листа да бисте започели изградњу вашег приказа.

Корак 2: Одредите примарни извор података

  • Превуците најмање једно поље из примарног извора података у приказ да бисте га одредили као примарни извор података. У Подаци кликните на извор података који желите да означите као примарни извор података. У овом примеру, Узорак ланца кафе је изабрано.
  • Следећи снимак екрана приказује различите табеле и спојеве доступне у датотеци.

инсталирајте пхп на Виндовс 8

Корак 3: Одредите секундарни извор података

  • Поља коришћена у приказу из извора података који нису примарни извор података или активне везе аутоматски одређују наредне изворе података као секундарни извор података. У овом случају, Сампле Суперсторе.

Корак 4: Спајање података

  • Сада можете да интегришете податке из оба извора на основу заједничке димензије ( Стање , у овом случају). Имајте на уму да се слика мале везе појављује поред димензије - Стате. Ово указује на заједничку димензију између два извора података.
  • Претпоставимо да креирате тракасти графикон помоћу Однос добити у Полици колоне и Стање у Реду полица, графикон показује како се однос добити разликује за сваку државу и у супермаркетама и у ланцима кафића.

Ограничења мешања података у табели

  1. Постоје нека ограничења мешања података око неадитивних агрегата, као што је МЕДИЈАН , и РАВСКЛАГГ .
  2. Мешање података компромитује брзину упита у великој гранулацији.
  3. Када покушате да сортирате према израчунатом пољу које користи помешане податке, израчунато поље није наведено на падајућој листи Поље дијалошког оквира Сортирање.
  4. Извори података коцке могу се користити само као примарни извор података за мешање података у Табели. Не могу се користити као секундарни извори података.

Надам се да сви сада имате добру представу о томе Мешање података у табели са овог блога. Гладни сте за више знања? Не брините, овај видео ће вам пружити боље разумевање концепта.