Значај науке о подацима са Касандром



Цассандра је база података отвореног кода за руковање великим количинама података на многим серверима, тако да је потражња научника за подацима са знањем Цассандре велика.

'

Брзо ширење дигиталних података путем рачунара, мобилних уређаја, видеа, друштвених медија, дигиталних сензора итд., У комбинацији са великим открићима у нижој обрадивој моћи, апликацијама база података отвореног кода и ширим пропусним опсегом изазвало је велико интересовање у читавом пословном свету у ново подручје науке о великим подацима и аналитика.





Велики подаци у великим неструктурираним количинама су сувише велики да би се њима могло управљати и анализирати их традиционалним методама. Сама количина и брзина данашњих података чине хватање, филтрирање, складиштење и анализу стварних изазова. Редовно се развијају нови производи који захтевају нове скупове вештина и стручност. Све је већа потреба за појединцима који могу да интегришу нову инфраструктуру, платформе и процесе у организацију, као и онима који могу да изграде нову аналитику и алгоритме способне да створе огромну интелигенцију од велике пословне вредности. За више информација прочитајте наш блог пост на

Релевантност науке о подацима у различитим индустријама:

Дата Сциенце & Аналитицс има примену у свим гранама индустрије:



  • електронска трговина - Мотори за персонализацију и препоруке који повећавају продају.
  • Оглашавање - Изузетно циљана испорука огласа у реалном времену потрошачима.
  • Медији и забава - Прилагођени развој садржаја који максимизира ангажовање корисника.
  • Друштвени медији - Повећана „лепљивост“ на сајту, раст корисника, могућност праћења брзих трендова на основу расположења потрошача.
  • Финансијске услуге –Оптимизоване праксе позајмљивања које минимизирају ризик и преваре.
  • Фармација / Биоинформатика - Побољшано откривање лекова, ефикаснији третмани претећих болести, побољшања генетског инжењеринга.
  • Здравствена заштита - Боље бодовање медицинских пацијената за здравствене ризике, као и предвиђање и рано спречавање болести.
  • Снага / енергија - Интелигентна мрежна интелигенција, ефикасност употребе, уштеда енергије и смањење застоја.
  • Информациона сигурност - Изразито побољшано откривање крађе и праћење драгоцених информација и имовине компаније.

Кључне вештине стручњака за науку о подацима:

Домен за науку о подацима захтева професионалце који:

како створити упозорење у јавасцрипту
  • Разуме аналитику података и науку одлучивања
  • Добро су упућени у ИТ
  • Имајте снажну пословну оштроумност
  • Поседују способност ефикасне комуникације са доносиоцима одлука

Опширније: Основне вештине потребне да бисте били научник података.

Уобичајене технологије повезане са праксом науке о подацима:

Технологије повезане са науком о подацима



  • Базе података

Орацле, СКЛ Сервер, Терадата

Цассандра, Хадооп, МапРедуце, ​​ХБасе

Астер, Греенплум, Нетезза

  • Језици

Ајак, Ц ++, ЦСС, ХТМЛ5, Јава, ЈаваСцрипт, Перл, Питхон, Сцала

Кошница, Свиња, Луцен, Махоут, Солр

  • Статистика и предвиђање

Ангосс, МАТЛАБ, Р, САС, СПСС

АРЦХ, ГАРЦХ, СВАР, ВАР, ВЕЦ, ГАУСС

  • Визуализација података

КликВиев, Спотфире, Таблеау, иВоркс, Р.

  • БИ и извештавање

БусинессОбјецтс, Цогнос, МицроСтратеги

Шта је Касандра?

  • Апацхе Цассандра је систем за управљање дистрибуираним базама података отвореног кода дизајниран да обрађује велике количине података на многим робним серверима.
  • Цассандра пружа високу доступност без иједне тачке квара.
  • Цассандра нуди робусну подршку за кластере који се простиру на више дата центара, са асинхроном без-мастер репликацијом која омогућава операције са малим кашњењем за све клијенте.

За више информација прочитајте наш пост на блогу на .

Како Сциенце Сциенце користи Цассандру?

Цассандра је срамежљива и срамежљива дистрибуирана база података са ниским кашњењем и услугама велике пропусности које обрађују радна оптерећења у стварном времену која се састоји од стотина исправки у секунди и десетина хиљада читања у секунди.

Цассандра Случај употребе - ПРОФИСИ:

ПРОС је софтверска компанија за велике податке која у свом софтверу прописује аналитику која омогућава њиховим купцима да анализирају своје податке и стекну увид и смернице за оптимизацију управљања ценама, продајом и приходом.

Имају услугу у реалном времену која израчунава доступност авио-компанија, динамички узимајући у обзир податке о контроли прихода и нивое залиха који се могу променити стотинама пута у секунди.

Ова услуга се тражи неколико хиљада пута у секунди, што значи десетине хиљада претраживања података. Њихов позадински слој за складиштење ове услуге је Цассандра.

За своје решење у реалном времену, ПРОС је схватио потребу за:

  • Дистрибуирана кеш меморија која је високо доступна.
  • Лако скалабилан.
  • Са архитектуром без мајстора.
  • Уз репликацију података у готово реалном времену, чак и кроз центре података.
  • То може да поднесе читање и писање у реалном времену.

ПРОС је проценио Касандру на основу Орацле Беркелеи ДБ, Орацле Цохеренце, Террацотта, Волдеморт и Редис. Апацхе Цассандра се прилично лако нашла на врху листе.

шта је прекид реда у хтмл-у

ПРОС и Касандра

  • ПРОС користи Цассандру као дистрибуирану базу података за услуге са малим кашњењем и великом пропусношћу које обрађују радна оптерећења у стварном времену која се састоје од стотина исправки у секунди и десетина хиљада читања у секунди.
  • На пример, имају услугу у реалном времену која динамички израчунава расположивост авио-компанија узимајући у обзир податке о контроли прихода и нивое залиха који се могу променити стотинама пута у секунди. Ова услуга се тражи неколико хиљада пута у секунди, што значи десетине хиљада претраживања података. Њихов позадински слој за складиштење ове услуге је Цассандра. Неке од њихових СааС понуда користе Цассандру као позадинску продавницу за руковање комбинацијом серијских радних оптерећења у реалном времену и Хадооп-у.
  • Говорећи о Хадооп-у и Цассандри, они ваде податке из Цассандре и стављају их у Хадооп и покрећу серију и аналитику на томе, а затим се то враћа у Цассандру. То је постигнуто Цассандрином интеграцијом Хадооп.
  • Послови Хадооп-а извлаче податке из Касандре, примењују трансформације или анализе специфичне за посао и враћају податке назад у Касандру. За ову интеграцију не користе Датастак (службено издање Цассандра Маинтаинер) Ентерприсе издање, већ само отворену Хадооп инсталацију са Цассандром.

Моделирање података са Касандром:

Када се жели заменити кључ-вредност са нечим способнијим за репликацију и дистрибуцију података у реалном времену, истраживање о Динаму, ЦАП теореми и евентуалном моделу доследности показује да Касандра прилично одговара овом моделу. Како се више сазнаје о могућностима моделирања података, постепено се крећемо ка растављању података.

Ако неко долази из позадине релационе базе података са јаком АЦИД семантиком, онда мора узети времена да разуме евентуални модел доследности.

Схватите Цассандрину архитектуру врло добро и шта она ради испод хаубе. Са Цассандром 2.0 добијате лагане трансакције и окидаче, али они нису исти као традиционалне трансакције базе података с којима се можда може знати. На пример, нема доступних ограничења страног кључа - њиме мора да се бави сопствена апликација. Јасно разумевање случајева коришћења и образаца приступа подацима пре моделирања података са Цассандром и читање све доступне документације је неопходно.

Закључак:

Апацхе Цассандра се брзо развија и ми учимо и разумемо његове могућности - посебно на страни моделирања података. Ми је доживљавамо као дистрибуирану НоСКЛ базу података коју одабиремо за наше услуге и решења за велике податке.

Едурека пружа свеобухватан за оне који желе да постану научник података. Курс покрива низ Хадооп, Р и техника машинског учења који обухватају комплетну студију науке о подацима. Едурека такође пружа то вам помаже да савладате НоСКЛ базе података. Овај курс је дизајниран да пружи знање и вештине како бисте постали успешан стручњак за Касандру.