Моделирање техника у пословној аналитици са Р.



Блог даје кратак увод у Моделирање техника у пословној аналитици са Р.

Различите технике моделирања:

Било који проблем можемо поделити на мање процесе:





Класификација - је место где класификујемо податке. На пример. болести све болести показују одређено понашање и можемо их даље класификовати.

На пример: болести које смањују имунитет, болести од којих боли глава итд.



Регресија - укључује откривање везе између више променљивих.

На пример: како је тежина људског бића повезана са његовом висином.

јава како претворити доубле у инт

АномолијаОткривање - у основи је флуктуација.



На пример: У случају високог или ниског напона.

Други пример би могао укључити регулисано понашање које укључује вожњу десном или левом страном на основу земље. Овде је аномалија неко ко вози супротно.

Други пример може бити упад у мрежу. Овде се потврђени корисник пријављује на веб локацију ваше компаније, а онда ако се неко неовлашћени пријави, то јеАн0моли.

Значај атрибута - У основи даје више атрибута, као што су висина, тежина, температура, откуцаји срца. Треба напоменути да су сви ови атрибути важни за задатак.

претварање доубле у инт у јави

На пример: Неко покушава да предвиди, у које време ће особа доћи до канцеларије. Сваки атрибут игра важну улогу, али нису сви атрибути важни.

Правила удруживања - Једноставније речено, то је анализа или предвиђање следећег понашања, где се оно врти око механизма за препоруке.

На пример: Особа која купује хлеб може купити и млеко. Ако анализирамо прошла понашања приликом куповине, сви предмети у корпи имају однос. У овом случају може постојати вероватноћа да ће особа која купује хлеб купити и млеко.

Груписање - То је једна од најстаријих техника у статистици. У ствари, увек се може моделирати било који проблем, било да је то класификација или кластерисање, што значи груписање сличних ентитета.

На пример:

1) Узмите корпу са јабукама и поморанџама, у којој можемо да раздвојимо јабуке од поморанџи.

2) Важан случај употребе кластера је здравствена заштита. Скоро све статистике и анализе започеле су са случајевима употребе здравствене заштите. Да бисмо ушли дубље, постоји појам кластера који се назива кохорте (људи са сличним болестима), тако да се могу проучавати одвојено од постојећих купаца. На пример, ако 10 људи пати од грознице, а 10 људи од главобоље, наћи ћемо оно што је заједничко међу њима и произвести лек.

Издвајање својстава - У погледу тачности издвајања карактеристика, валидност и откази су прилично релевантни. Другим речима, издвајање карактеристика може се назвати препознавањем узорка.

авс покреће инстанцу из снимка

На пример:

У Гоогле претрази, када корисник унесе појам, долази до резултата. Е сад, важно питање које треба поставити је како је знало, која је страница релевантна и небитна за тај појам? На ово се може одговорити издвајањем карактеристика и препознавањем узорака, где додаје истакнуте карактеристике. Рецимо да је дата фотографија, одређене камере откривају лица, истичу лице како би давале лепе слике, што такође користи препознавање карактеристика.

Учење под надзором вс Учење без надзора

до) Категорија предвиђања - Технике укључују регресију, логистику, неуронске мреже и стабла одлучивања. Неки примери укључују откривање превара (где рачунар учи и предвиђа следећу превару из претходне историје преваре). У учењу без надзора не може се предвидети примерима, јер не постоје историјски подаци.

б) Категорија класификације - Узимајући пример, без обзира да ли је трансакција лажна или не, она улази у категорију класификације. Овде узимамо историјске податке и класификујемо их са стаблима одлука или у случају да уопште не узимамо никакве историјске податке, онда директно крећемо од података и покушавамо самостално да искористимо функције. На пример, ако треба да знамо запослене који ће вероватно напустити организацију или ће вероватно остати. У случају да је то нова организација, у којој не можемо да користимо историјске податке, увек можемо да користимо кластере за издвајање података.

ц) Категорија истраживања - Ово је директна метода која долази до тога шта значе велики подаци. У ненадгледаном учењу то се назива основним компонентама и груписањем.

д) Категорија афинитета - овде је укључено више елемената као што су унакрсна продаја / продаја, анализа тржишне корпе. У анализи корпе не постоји учење под надзором, јер не постоје историјски подаци. Дакле, податке узимамо директно и проналазимо асоцијације, секвенцирање и факторску анализу.

Имате питање за нас? Спомените их у одељку за коментаре и јавићемо вам се.

Повезани постови: