Бушење на Апацхе бушилици, Нев Аге Куери Енгине

Овај водич за Апацхе Дрилл даје вам све информације које су вам потребне да бисте започели рад са Апацхе Дрилл механизмом за упите, употребу са Хадооп-ом, Биг Дата & Апацхе Спарк-ом.

Апацхе Дрилл је први у индустрији СКЛ Енгине без шема. Дрилл није први мотор за упите на свету, али је први који постиже фину равнотежу између флексибилности и брзине. Дрилл је дизајниран за скалирање на неколико хиљада чворова и упит петабајта података интерактивном брзином која је потребна окружењима БИ / Аналитицс.

Може се интегрирати са неколико извора података као што су Хиве, ХБасе, МонгоДБ, систем датотека, РДБМС. Такође, улазни формати као што су Авро, ЦСВ, ТСВ, ПСВ, Паркет, датотеке Хадооп секвенце и многи други могу се лако користити у Дрилл-у.

Зашто Апацхе дрилл?

Највећа предност Апацхе Дрилл-а је у томе што шему може открити у ходу док тражите било какве податке. Штавише, може да ради са вашим БИ алатима као што су Таблеау, Кликвиев, МицроСтратеги итд. За бољу аналитику.

Ево цитата индустријског аналитичара који сумира вредност Апацхе Дрилл:

„Дрилл није само СКЛ-он-Хадооп. Ради се о СКЛ-у-на-прилично-било чему, одмах и без формалности. “

- Андрев Бурст, Гигаом Ресеарцх, јануар 2015

Дриллбит је демон Апацхе Дрилл-а који се покреће на сваком чвору у кластеру. Користи ЗооКеепер за сву комуникацију у кластеру и главно чланство у кластеру. Одговорна је за прихватање захтева клијента, обраду упита и враћање резултата клијенту. Бушилица која прими захтев од клијента назива се „предрадник“. Он генерише план извршења, фрагменти извршења се шаљу другим бушилицама које раде у кластеру.

Drillbits-Apache-Drill

Још једна предност је што је инсталација и подешавање бушилице прилично једноставна. Научимо како да инсталирамо Апацхе Дрилл.

Први корак је преузимање пакета бушилица.

јава цласс лоадер интервју питања

Команда: вгет хттпс://арцхиве.апацхе.орг/дист/дрилл/дрилл-1.5.0/апацхе-дрилл-1.5.0.тар.гз

Команда: тар -квф апацхе-дрилл-1.5.0.тар.гз

Команда: лс

Даље, подесите променљиве окружења у датотеку .басхрц.

Команда: судо гедит .басхрц

извоз ДРИЛЛ_ХОМЕ = / хоме / едурека / апацхе-дрилл-1.5.0

екпорт ПАТХ = $ ПАТХ: /хоме/едурека/апацхе-дрилл-1.5.0/бин

Ова наредба ће ажурирати промене:

Команда: извор .басхрц

Сада идите на дрилл цонф директоријум и уредите датотеку дрилл-оверриде.цонф са ИД-ом кластера и зоокеепер хост & портом, покренућемо га на локалном кластеру.

Команда: цд апацхе-дрилл-1.5.0

Команда: судо гедит цонф / дрилл-оверриде.цонф

Подразумевано, ДРИЛЛ_МАКС_ДИРЕЦТ_МЕМОРИ ће бити 8 ГБ у дрилл-енв.сх, а ми га морамо чувати у складу са меморијом коју имамо.

Команда: судо гедит цонф / дрилл-енв.сх

Да бисте бушилицу инсталирали само у један чвор, можете да користите уграђени режим, где ће се покретати локално. Аутоматски ће покренути услугу дриллбит када покренете ову наредбу.

Команда: ./бин/дрилл-ембеддед

Можете покренути једноставан упит да бисте проверили инсталацију.

Команда: изаберите * из сис.оптионс ВХЕРЕ упишите = 'СИСТЕМ' и име као 'сецурити%'

Да бисмо проверили веб конзолу Апацхе Дрилл-а, морамо да посетимо лоцалхост: 8047 у веб прегледачу.

Упит можете покренути и са картице Упит.

Да бисте покренули бушење у дистрибуираном режиму, потребно је да уредите ИД кластера и додате ЗооКеепер информације у дрилл-оверриде.цонф као доле.

Затим морамо покренути услугу ЗооКеепер на сваком чвору. Након тога овом командом морате покренути услугу дриллбит на сваком чвору.

добити дужину низа јс

Команда: ./бин/дриллбит.сх почетак

Команда: јпс

Сада користимо наредбу испод за покретање љуске бушења.

Сада можемо извршавати наше упите на кластеру у дистрибуираном режиму.

Ово је први пост на блогу из дводелне серије блогова Апацхе Дрилл. Ускоро долази и други блог из серије.

Имате питање за нас? Спомените их у одељку за коментаре и јавићемо вам се.

Повезани постови:

Бушење на Апацхе бушилици, 2. део

Апацхе Спарк вс Хадооп МапРедуце