Водич за кошнице - Архитектура кошница и НАСА студија случаја



Овај Хиве туториал блог пружа вам детаљно знање о архитектури кошница и моделу података о кошници. Такође објашњава НАСА-ину студију случаја Апацхе Хиве.

Водич за Апацхе Хиве: Увод

Хиве је ригорозно коришћен алат за аналитику великих података и одличан алат за покретање вашег са. У овом блогу туторијала о Хиве-у детаљно ћемо разговарати о Апацхе Хиве-у. Апацхе Хиве је алат за складиштење података у , који пружа језик сличан СКЛ-у за постављање упита и анализу великих података. Мотивација за развој Хиве-а је пут учења без трења за програмере и аналитичаре СКЛ-а. Хиве није спаситељ само људима који нису из програмског порекла, већ такође смањује рад програмера који проводе дуге сате пишући МапРедуце програме. У овом блогу Апацхе Хиве Туториал, говорићу о:





Водич за Апацхе Хиве: Шта је кошница?

Апацхе Хиве је систем складишта података изграђен на врху Хадооп-а и користи се за анализу структурираних и полуструктурираних података.Хиве апстрахује сложеност Хадооп МапРедуце-а. У основи, пружа механизам за пројектовање структуре на податке и извршавање упита написаних у ХКЛ (Хиве Куери Лангуаге) који су слични СКЛ изразима. Интерно, ови упити или ХКЛ преводилац преводилац конвертује у мапу како би смањио послове. Због тога не треба да бринете о писању сложених МапРедуце програма за обраду података помоћу Хадооп-а. Усмерен је на кориснике који воле СКЛ. Апацхе Хиве подржава језик за дефинисање података (ДДЛ), језик за манипулисање подацима (ДМЛ) и функције које дефинишу корисници (УДФ).

Водич за кошнице за почетнике | Разумевање кошнице у дубини | Едурека



СКЛ + Хадооп МапРедуце = ХивеКЛ

Водич за Апацхе Хиве: Прича о Хиве - од Фацебоок-а до Апацхе-а

Случај употребе Фацебоок-а - Водич за кошнице - ЕдурекаШипак : Хиве Туториал - случај употребе Фацебоок-а

структуре података и алгоритми у јави

Изазови на Фацебоок-у: Експоненцијални раст података

Пре 2008. године, сва инфраструктура за обраду података на Фацебоок-у била је изграђена око складишта података заснованог на комерцијалном РДБМС-у. Ове инфраструктуре биле су довољно способне да у то време задовоље потребе Фацебоок-а. Али, како су подаци почели брзо да расту, постало је велики изазов за управљање и обраду овог великог скупа података. Према Фацебоок чланку, подаци су скалирани са 15 ТБ података 2007. у 2 ПБ 2009. 2009. Такође, многи Фацебоок производи укључују анализу података попут Аудиенце Инсигхтс, Фацебоок Лекицон, Фацебоок Адс, итд. било је потребно скалабилно и економично решење да се избори са овим проблемом и зато је почео да користи Хадооп оквир.



Демократизирање Хадооп - МапРедуце

Али како су подаци расли, сложеност Мап-Редуце кодова пропорционално је расла. Дакле, постало је тешко оспособити људе са не-програмским искуством да пишу програме МапРедуце. Такође, за обављање једноставне анализе треба написати стотину редова МапРедуце кода. С обзиром да су СКЛ инжењери и аналитичари, укључујући Фацебоок, широко користили, стога се чинило да је постављање СКЛ-а на врх Хадооп-а логичан начин да се Хадооп учини доступним корисницима са СКЛ позадином.

Отуда је способност СКЛ-а довољна за већину аналитичких захтева и скалабилност Хадооп-а родила Апацхе Хиве који омогућава извршавање СКЛ сличних упита на подацима присутним у ХДФС-у. Касније је Фацебоок пројекат Хиве отворио у августу 2008. године и данас је слободно доступан као Апацхе Хиве.

Погледајмо сада карактеристике или предности Хиве-а због којих је толико популаран.

Водич за Апацхе Хиве: Предности кошнице

  • Корисно за људе који нису из програмског окружења јер елиминише потребу за писањем сложеног програма МапРедуце.
  • Прошириво и скалабилан да се носи са све већим обимом и разноврсношћу података, без утицаја на перформансе система.
  • То је као ефикасан ЕТЛ (Ектрацт, Трансформ, Лоад) алат.
  • Хиве подржава излагање својих клијентских апликација написаних на Јава, ПХП, Питхон, Ц ++ или Руби Штедљиви сервер . (Ове језике на страни клијента уграђене у СКЛ можете користити за приступ бази података као што је ДБ2, итд.).
  • Како се подаци о метаподацима Хиве-а чувају у РДБМС-у, то значајно смањује време за обављање семантичких провера током извршавања упита.

Водич за Апацхе Хиве: Где користити Апацхе Хиве?

Апацхе Хиве користи оба света, тј. СКЛ систем базе података и оквир. Стога га користи огромно мноштво компанија. Углавном се користи за складиштење података где можете обављати аналитику и рударење подацима које не захтевају обраду у реалном времену. Нека од поља у којима можете користити Апацхе Хиве су следећа:

  • Складиштење података
  • Ад-хоц анализа

Као што је речено, не можете пљескати само једном руком, тј. Не можете сваки проблем решити једним алатом. Према томе, можете повезати Хиве са другим алатима да бисте га користили у многим другим доменима. На пример, Таблеау заједно са Апацхе Хиве може да се користи за визуелизацију података, Апацхе Тез интеграција са Хиве ће вам пружити могућности обраде у стварном времену итд.
Крећући се напред на овом блогу Апацхе Хиве Туториал, погледајмо студију случаја НАСА-е где ћете упознати како је Хиве решио проблем са којим су се суочили НАСА-ини научници током вршења евалуације климатских модела.

Водич за кошнице: НАСА-ина студија случаја

Климатски модел је математички приказ климатских система заснован на различитим факторима који утичу на климу Земље. У основи, описује интеракцију различитих покретача климе попут океана, сунца, атмосфере итдпружају увид у динамику климатског система. Користи се за пројектовање климатских услова симулирањем климатских промена на основу фактора који утичу на климу. НАСА-ина Лабораторија за млазни погон развила је Регионални систем за оцену климатског модела (РЦМЕС) за анализу и процену климатског модела на основу података даљинског очитавања присутних у различитим спољним спремиштима.

РЦМЕС (Регионал Цлимате Модел Евалуатион Систем) има две компоненте:

  • РЦМЕД (Регионална база података за оцену климатских модела):

То је скалабилна база података у облаку која учитава податке даљинског очитавања и податке о поновној анализи који су повезани са климом помоћу екстрактора као што су Апацхе ООДТ екстрактори, Апацхе Тика итд. Коначно, трансформише податке као модел тачке података који је облика (географска ширина) , дужина, време, вредност, висина) и складишти је у Моју СКЛ базу података. Клијент може да преузме податке присутне у РЦМЕД-у извођењем просторно-временских упита. Опис таквих упита за нас сада није релевантан.

  • РЦМЕТ (Регионал Цлимате Модел Евалуатион Тоолкит):

Пружа кориснику могућност упоређивања референтних података присутних у РЦМЕД-у са излазним подацима климатског модела преузетим из неких других извора за обављање различитих врста анализе и процене. Можете се позвати на доњу слику да бисте разумели архитектуру РЦМЕС-а.

Референтни подаци у РЦМЕД-у потичу из сателитског даљинског истраживања, у складу са различитим параметрима потребним за процену климатског модела. На пример - АИРС (Атмоспхериц Инфраред Соундер) пружа параметре као што су температура површинског ваздуха, температура и Геопотенцијал, ТРММ (Тропска киша, мерење мисија) пружа месечне падавине итд.

Проблеми са којима се НАСА суочила користећи МиСКЛ систем база података:

  • Након учитавања МиСКЛ базе података са 6 милијарди корпи образаца (географска ширина, дужина, време, вредност тачке података, висина), систем се срушио као што је приказано на горњој слици.
  • Чак и након поделе целе табеле на мање подскупове, систем је генерисао огромне трошкове током обраде података.

Дакле, било им је потребно скалабилно решење које може да складишти и обрађује ову огромну количину података помоћу СКЛ-а попут могућности постављања упита. Коначно, одлучили су да користе Апацхе Хиве за превазилажење горе наведених проблема.

Како Апацхе Хиве може решити проблем?

Сада, да видимо, које су то функције које су убедиле НАСА-ин тим ЈПЛ да Апацхе Хиве укључи као саставни део у своју стратегију решења:

  • Будући да Апацхе Хиве ради на врху Хадооп-а, прилагодљив је и може обрађивати податке дистрибуирано и паралелно.
  • Пружа језик упита за кошнице који је сличан СКЛ-у и због тога је лак за учење.

Примена кошнице:

Следећа слика објашњава РЦМЕС Арцхитецт са интеграцијом Апацхе Хиве:

Шипак : Водич за кошнице - РЦМЕС архитектура са Апацхе кошницом

Горња слика приказује примену апацхе кошнице у РЦМЕС. НАСА тим је предузео следеће кораке приликом распоређивања Апацхе Хиве:

  • Инсталирали су Хиве користећи Цлоудера и Апацхе Хадооп како је приказано на горњој слици.
  • Користили су Апацхе Скооп за уношење података у кошницу из МиСКЛ базе података.
  • Апацхе ООДТ омотач је примењен за извршавање упита у Хиве-у и враћање података натраг у РЦМЕТ.

Почетна запажања упоређивања са кошницом:

  • У почетку су учитали 2,5 милијарде тачака података у једну табелу и извршили упит за бројање. На пример, Кошница> изаберите цоунт (датапоинт_ид) из датаПоинта. Било је потребно 5-6 минута да се изброје сви записи (15-17 минута за пуних 6,8 милијарди записа).
  • Фаза смањења је била брза, али фаза мапе је узимала 95% укупног времена обраде. Користили су шест ( 4к четворојезгарни ) системи са 24 ГБ РАМ-а (приближно) у сваком од система.
  • Чак и након додавања додатних машина, промене величине ХДФС блока (64 МБ, 128 МБ, 256 МБ) и промене многих других конфигурационих променљивих (ио.врста.фактор, тј.врста.мб), нису постигли много успеха у смањењу времена за довршавање бројања.

Уноси чланова заједнице кошница:

Коначно, чланови заједнице кошница прискочили су у помоћ и пружили различите увиде како би решили проблеме са њиховим тренутним применама у кошници:

  • Споменули су да је брзина читања ХДФС приближно 60 МБ / с у односу на 1ГБ / с у случају локалног диска, у зависности од мрежног капацитета и оптерећења на НамеНоде.
  • Чланови су то предложили 16 мапера ће се у њиховом тренутном систему подударати са И / О перформансама локалног задатка који није Хадооп.
  • Такође су предложили да се смањи сплит-сизе за свако мапирање да повећа бројодмапере и, пружајући више паралелизма.
  • Коначно, чланови заједнице су им рекли усе цоунт (1) уместо да се позива на рачунати ( датапоинт_ид) . То је зато што у случају бројања (1) не постоји референтни ступац и стога се не врши декомпресија и десериализација током извођења бројања.

Коначно, НАСА је успела да прилагоди њихов кластер кошница према њиховим очекивањима узимајући у обзир све сугестије које су дали чланови заједнице кошница. Због тога су успели да изврше упите о милијардама редова за само 15 секунди користећи претходно поменуте системске конфигурације.

Водич за Апацхе Хиве: Архитектура кошница и њене компоненте

Следећа слика описује Архитектуру кошница и ток у који се подноси упитКошницаи коначно обрађена помоћу МапРедуце оквира:

шта је бинарно претраживање у јави

Шипак : Водич за кошнице - Архитектура кошница

Као што је приказано на горњој слици, Архитектура кошница може се категорисати у следеће компоненте:

  • Клијенти кошница: Хиве подржава апликацију написану на многим језицима као што су Јава, Ц ++, Питхон итд. Користећи ЈДБЦ, Тхрифт и ОДБЦ управљачке програме. Стога се увек може написати клијентска апликација кошнице написана на језику по њиховом избору.
  • Услуге кошница: Апацхе Хиве пружа разне услуге попут ЦЛИ, веб интерфејса итд. За извршавање упита. Убрзо ћемо истражити сваку од њих на овом блогу туторијала за кошнице.
  • Оквир обраде и управљање ресурсима: Интерно,Хиве користи Хадооп МапРедуце фрамеворк као де фацто мотор за извршавање упита. је засебна тема за себе и због тога се овде не расправља.
  • Дистрибуирано складиште: Како је Хиве инсталиран на врху Хадоопа, он користи основни ХДФС за дистрибуирано складиште. Можете се позвати на ХДФС блог да бисте сазнали више о томе.

Сада, истражимо прве две главне компоненте у Архитектури кошница:

1. Клијенти кошница:

Апацхе Хиве подржава различите типове клијентских апликација за извршавање упита у кошници. Ови клијенти се могу сврстати у три врсте:

  • Штедљиви клијенти: Како се Хиве сервер заснива на Апацхе Тхрифт, он може служити захтевима свих оних програмских језика који подржавају Тхрифт.
  • ЈДБЦ клијенти: Хиве омогућава Јава апликацијама да се на њега повежу помоћу ЈДБЦ управљачког програма који је дефинисан у класи орг.апацхе.хадооп.кошница.јдбц.ХивеДривер.
  • ОДБЦ клијенти: Хиве ОДБЦ управљачки програм омогућава апликацијама које подржавају ОДБЦ протокол да се повежу са Хиве-ом. (Као и ЈДБЦ управљачки програм, ОДБЦ управљачки програм користи Тхрифт за комуникацију са Хиве сервером.)

2. Услуге кошница:

Кошница пружа многе услуге као што је приказано на горњој слици. Погледајмо сваког од њих:

  • ЦЛС кошнице (интерфејс командне линије): Ово је задата љуска коју пружа Хиве, где можете директно извршавати своје упите и наредбе за Хиве.
  • Апацхе Хиве веб интерфејси: Поред интерфејса командне линије, Хиве такође нуди ГУИ путем Интернета за извршавање упита и наредби Хиве-а.
  • Хиве Сервер: Хиве сервер је изграђен на Апацхе Тхрифт и стога се назива и Тхрифт Сервер који омогућава различитим клијентима да предају захтеве Хиве-у и преузму коначни резултат.
  • Апацхе Хиве Дривер: Одговорна је за примање упита које клијент подноси путем ЦЛИ-а, веб корисничког интерфејса, Тхрифт-а, ОДБЦ-а или ЈДБЦ-а. Затим возач прослеђује упит компајлеру где се врши рашчлањивање, провера типова и семантичка анализа уз помоћ шеме присутне у метастореу. У следећем кораку се генерише оптимизовани логички план у облику ДАГ-а (Дирецтед Ацицлиц Грапх) задатака смањења мапе и ХДФС задатака. Коначно, извршни механизам извршава ове задатке по редоследу њихових зависности, користећи Хадооп.
  • Метасторе: Можете мислити у метасторекао централно спремиште за чување свих података о метаподацима Хиве-а. Метаподаци о кошници укључују разне врсте информација попут структуре табела и партицијазаједно са колоном, типом колоне, сериализатором и десериализатором који су потребни за операцију читања / писања података присутних у ХДФС-у. Метасторесастоји се од две основне целине:
    • Услуга која пружа метастореприступ другимрУслуге кошница.
    • Складиште диска за метаподатке које је одвојено од ХДФС складишта.

Сада, хајде да разумемо различите начине примене Хиве метастореу следећем одељку овог водича за кошнице.

Водич за Апацхе Хиве: Конфигурација Метасторе-а

Метасторе складишти информације о мета подацима користећи РДБМС и слој отвореног кода ОРМ (Објецт Релатионал Модел) назван Дата Нуцлеус који претвара приказ објекта у релациону шему и обрнуто. Разлог за одабир РДБМС уместо ХДФС је постизање ниске латенције. Можемо применити метасторе у следеће три конфигурације:

1. Уграђена метастора:

И услуга метасторе и услуга Хиве по дефаулту се извршавају у истом ЈВМ-у, користећи уграђену инстанцу Дерби Датабасе, где се метаподаци чувају на локалном диску. Ово се назива конфигурација уграђене мета-продавнице. У овом случају, само један корисник може се истовремено повезати са базом података метасторе. Ако покренете другу инстанцу управљачког програма Хиве, добићете грешку. Ово је добро за јединствено тестирање, али не и за практична решења.

2. Локална метастора:

Ова конфигурација омогућава нам да имамо више сесија Хиве, тј. Више корисника може истовремено користити базу података метасторе. То се постиже употребом било које ЈДБЦ компатибилне базе података попут МиСКЛ-а која ради у одвојеном ЈВМ-у или на другој машини од оне услуге Хиве и метасторе услуге које раде у истом ЈВМ-у као што је горе приказано. Генерално, најпопуларнији избор је примена МиСКЛ сервера као метасторе базе података.

3. Даљинска метастора:

У конфигурацији удаљене метасторе, услуга метасторе ради на свом засебном ЈВМ-у, а не на ЈВМ услуге Хиве. Остали процеси комуницирају са сервером метасторе користећи Тхрифт Нетворк АПИ-је. У овом случају можете да имате један или више метасторе сервера да бисте обезбедили већу доступност.Главна предност коришћења удаљене метасторе је да не морате делити ЈДБЦ акредитиве за пријављивање са сваким корисником Хиве да бисте приступили бази података метасторе.

Водич за Апацхе Хиве: Модел података

Подаци у кошници могу се разврстати у три врсте на грануларном нивоу:

  • Сто
  • Подела
  • Канта

Табеле:

Табеле у кошници су исте као табеле присутне у релационој бази података. На њима можете обављати операције филтрирања, пројектовања, придруживања и удруживања. У кошници постоје две врсте табела:

1. Управљана табела:

Команда:

СТВОРИ ТАБЕЛУ (врста података_ступац1, тип података_талона2)

УЧИТАЈ ПУТ У ПОДАТКЕ У табелу манагед_табле

Као што и само име говори (управљана табела), Хиве је одговоран за управљање подацима управљане табеле. Другим речима, оно што сам мислио рекавши, „Кошница управља подацима“, јесте да ако податке из датотеке присутне у ХДФС учитате у кошницу Управљани сто и издати наредбу ДРОП на њој, табела заједно са њеним метаподацима ће бити избрисана. Дакле, подаци који припадају испуштеним манагед_табле више не постоје нигде у ХДФС-у и никако га не можете вратити. У основи, премештате податке када издате наредбу ЛОАД са локације ХДФС датотеке у директоријум складишта Хиве.

структура података о реду у јави

Белешка: Подразумевана путања директорија складишта је постављена на / усер / хиве / варехоусе. Подаци табеле кошница налазе се у варехоусе_дирецтори / име_табеле (ХДФС). Такође можете одредити путању директорија складишта у конфигурацијском параметру хиве.метасторе.варехоусе.дир присутан у хиве-сите.кмл.

2. Спољна табела:

Команда:

СТВОРИ ВАЊСКУ ТАБЕЛУ (тип података_стуб1, тип_датума ступац2) ЛОКАЦИЈА ‘’

УЧИТАЈ УЛАЗ ПОДАТАКА ‘’ У ТАБЕЛУ

За спољни сто , Хиве није одговоран за управљање подацима. У овом случају, када издате наредбу ЛОАД, Хиве премјешта податке у свој директориј складишта. Затим, Хиве креира информације о метаподацима за спољну табелу. Ако издате наредбу ДРОП на спољни сто , бришу се само подаци о метаподацима у вези са спољном табелом. Стога, податке те врло екстерне табеле и даље можете преузети из директорија складишта помоћу ХДФС наредби.

Преграде:

Команда:

СТВОРИ ТАБЕЛУ име_табеле (тип_податка1, податак_врста_датотеке) ПОДЕЉЕНО ОД (преграда_датотеке1, врста_дељене_датотеке_ & хеллип.)

Хиве организује табеле у партиције за груписање сличних података заједно на основу колоне или партицијског кључа. Свака таблица може имати један или више партицијских кључева за идентификацију одређене партиције. То нам омогућава бржи упит за делове података.

Белешка: Запамтите, најчешћа грешка која се прави током креирања партиција је одређивање имена постојећег ступца као ступца партиције. При томе ћете примити грешку - „Грешка у семантичкој анализи: Поновљен је ступац у колонама за партиционирање“.

Хајде да схватимо партицију узевши пример где имам табелу студент_детаилс која садржи информације о студентима неког инжењерског колеџа као што је студент_ид, име, одељење, година итд. Сада, ако извршим партицију на основу колоне одељења, подаци свих ученика припадност одређеном одељењу биће ускладиштена заједно на тој партицији. Физички, партиција није ништа друго до поддиректориј у директоријуму табеле.

Рецимо да у нашој табели студентски_детаљи имамо податке за три одељења - ЦСЕ, ЕЦЕ и Цивил. Због тога ћемо имати укупно три преграде за свако одељење као што је приказано на доњој слици. И за свако одељење имаћемо све податке који се тичу тог одељења који бораве у посебном поддиректоријуму под директоријумом табеле кошница. На пример, сви подаци о студентима у вези са одељењима за ЦСЕ биће ускладиштени у усер / хиве / варехоусе / студент_детаилс / депт. = ЦСЕ. Дакле, упити у вези са студентима ЦСЕ морали би само да прегледају податке присутне у партицији ЦСЕ. Ово чини партиционирање врло корисним јер смањује кашњење упита само скенирањем релевантне партиционирани подаци уместо целог скупа података. У ствари, у имплементацијама из стварног света имаћете посла са стотинама ТБ података. Дакле, замислите да скенирате ову огромну количину података за неки упит где 95% подаци које сте скенирали нису били релевантни за ваш упит.

Предложио бих вам да погледате блог на Команде кошница где ћете наћи различите начине примене партиција са примером.

Канте:

Команде:

СТВАРИ ТАБЕЛУ име_табеле РАЗДЕЉЕНО ПО (партицијски1 тип_датотеке, партицијски2 тип_датотеке и хеллип.) КЛАСЕРИРАНО ПО (име_колоне1, име_колоне2, ...) РЕДЈЕНО ПО (име_колоне [АСЦ | ДЕСЦ], ...)] У БРОЈСКЕ канте

Сада можете сваку партицију или непартиционирану табелу поделити у сегменте на основу хеш функције колоне у табели. Заправо, сваки сегмент је само датотека у директорију партиције или директоријуму табеле (непартиционирана табела). Стога, ако сте одлучили подијелити партиције у н сегмената, имат ћете н датотека у сваком од ваших директорија партиција. На пример, можете видети горњу слику где смо сваку партицију стрпали у 2 сегмента. Дакле, свака партиција, рецимо ЦСЕ, имаће две датотеке у којима ће свака од њих чувати податке ученика ЦСЕ-а.

Како Хиве распоређује редове у сефове?

Па, Хиве одређује број сегмента за ред користећи формулу: хасх_фунцтион (буцкетинг_цолумн) модуло (нум_оф_буцкетс) . Ево, хфункција пепела зависи од типа података колоне. На пример, ако табелу групирате на основу неке колоне, рецимо да је усер_ид, типа података ИНТ, хеш_функција ће бити - хасх_фунцтион (усер_ид ) = целобројна вредност усер_ид . И, претпоставимо да сте креирали два сегмента, онда ће Хиве израчунати редове који иду у сегмент 1 на свакој партицији: (вредност усер_ид) модуло (2). Према томе, у овом случају, редови који имају усер_ид који се завршавају са парном целобројном цифром налазиће се у истом сегменту који одговара свакој партицији. Функција хасх_ за друге типове података помало је сложена за израчунавање, а заправо за низ није ни људски препознатљива.

Белешка: Ако користите Апацхе Хиве 0.к или 1.к, морате да издате наредбу - поставите хиве.енфорце.буцкетинг = труе са вашег Хиве терминала пре извођења сефовања. То ће вам омогућити да имате тачан број редуктора док користите кластер по клаузули за сегментирање колоне. У случају да то нисте учинили, можда ћете утврдити да број датотека које су генерисане у директоријуму ваше табеле није једнак броју сегмената. Као алтернативу, можете такође поставити број редуктора једнак броју сегмената користећи сет мапред.редуце.таск = нум_буцкет.

Зашто су нам потребне канте?

Два су главна разлога за извођење сегментирања на партицији:

  • ДО придружи се страни мапе захтева да подаци који припадају јединственом кључу за придруживање буду присутни на истој партицији. Али шта је са оним случајевима када се ваш партицијски кључ разликује од придруживања? Због тога у овим случајевима можете извршити бочно спајање мапом додавањем табеле у кључеве.
  • Скупљање чини поступак узорковања ефикаснијим и стога нам омогућава да смањимо време упита.

Желео бих да завршим овај туториал блог о Хиве-у овде. Прилично сам сигуран да бисте након проласка кроз овај туториал блог Хиве схватили једноставност Апацхе Хиве-а. Од тада сте научили све основе кошнице, крајње је време да се упознате са Апацхе Хиве-ом. Дакле, погледајте следећи блог у овој серији блогова са Хиве Туториал-ом који је о инсталацији Хиве-а и почните да радите на Апацхе Хиве-у.

Сада када сте разумели Апацхе Хиве и његове карактеристике, погледајте Едурека, поуздана компанија за учење на мрежи са мрежом од више од 250.000 задовољних ученика раширених широм света. Едурека курс обуке за сертификацију великих података помаже ученицима да постану стручњаци за ХДФС, предиво, МапРедуце, ​​свињу, кошницу, ХБасе, Оозие, Флуме и Скооп користећи случајеве коришћења у реалном времену на малопродаји, друштвеним медијима, ваздухопловству, туризму, финансијском домену.

Имате питање за нас? Молимо вас да то споменете у одељку за коментаре и јавићемо вам се.