Р Туториал - Водич за почетнике за учење Р програмирања



Овај блог на Р водичу вас упознаје са Р алатом и помаже вам да детаљно разумете разне основе програмирања Р-а, примерима.

Р је најпопуларнији алат за аналитику података јер је отворен, флексибилан, нуди више пакета и има огромну заједницу. Дизајниран је за софтверске програмере, статистичаре и рудаче података, с обзиром на то, што је довело до популарности .На овом блогу Р водича даћу вам потпун увид у Р са примерима.

Испод су теме у овом блогу Р водича о којима ћу дискутовати у следећем низу:





  1. Зашто нам је потребна Аналитика ?
  2. Шта је пословна аналитика ?
  3. Зашто Р и ко користи Р. ?
  4. Инсталација Р.
  5. Оператери података
  6. Типови података
  7. Контрола протока

Р Водич: Зашто нам је потребна аналитика?

Пре него што одговорим на питање, дозволите ми да вас упознам са неким проблемима и њиховим решењима у Р на више домена.



банкарство - Р Туториал - Едурека

Банкарство :

У банкама се свакодневно генерише велика количина података о клијентима. ВХиле, који редовно ради са милионима купаца, постаје тешко пратити њихове хипотеке.



Решење :

Р прави прилагођени модел који одржава зајмове који се пружају сваком појединачном купцу, што нам помаже да одлучимо о износу који ће купац платити током времена.

Осигурање :

Осигурање умногоме зависи од предвиђања. Тешко јеодлучити коју политику прихватити или одбити.

Решење:

Коришћењем континуираног кредитног извештаја као улазног податка, можемо створити модел у Р који не само да ће проценити апетит за ризиком већ и направити предиктивну прогнозу.

Здравствена заштита:

Сваке године милиони људи буду примљени у болницу, а милијарде се потроше годишње само у процесу пријема.

Решење :

С обзиром на историју пацијента и историју болести, може се изградити предиктивни модел да би се утврдило ко је у ризику за хоспитализацију и у којој мери треба прилагодити медицинску опрему.

Сада знамо како аналитика података помаже организацијама да искористе своје податке и користе их за идентификовање нових могућности. Ако говоримо о потреби аналитике у организацији, морате наићи на ова 4 аспекта:

Даље, кренимо даље у Р туториал блог, где ћемо прво разумети шта је тачно пословна аналитика.

Р Водич: Шта је пословна аналитика?

Пословна аналитика је процес испитивања великих скупова података и постизања скривених образаца, корелација и других увида. У основи вам помаже да разумете све податке које сте прикупили, било да се ради о организационим подацима, подацима о истраживању тржишта или производа или било којој другој врсти података. Постаје вам лако доносити боље одлуке, боље производе, боље маркетиншке стратегије итд. Погледајте доњу слику за боље разумевање:

Ако погледате горњу слику, ваши подаци на првој слици су раштркани. Ако желите нешто специфично, попут одређеног записа у бази података, то постаје гломазно. Да бисте ово поједноставили, потребна вам је анализа. Анализом постаје лако успоставити корелацију између података. Једном када утврдите шта треба да радите, постаје вам прилично лако да доносите одлуке попут, којим путем желите да следите или у смислу пословне аналитике, који пут ће довести до бољитка ваше организације.

Али не можете очекивати да људи из ланца изнад увек разумеју необрађене податке које им пружате након аналитике. Дакле, да бисмо превазишли овај јаз, имамо концепт визуелизација података .

Визуализација података : Визуелизација података је визуелни приступ огромним количинама података које сте генерисали након аналитике. Људски ум обрађује визуелне слике и визуелна графика је боља од поређења са сировим подацима. Увек нам је лако да разумемо тортни графикон или тракасти графикон у поређењу са сировим бројевима. Сад се можда питате како можете постићи ову визуализацију података из података које сте већ анализирали?
На тржишту су доступни различити алати за визуелизацију података:

Сигурно се сви питате да већ постоји толико много алата који вам помажу да постигнете визуализацију података и одређену количину аналитике, зашто ићи са Р?

Дакле, моја следећа тема у блогу са водичима за Р бави се „зашто Р“ и „ко користи Р“.

Водич за Р: Зашто Р и ко користи Р?

Зашто Р?

Р је програмски и статистички језик.

Р се користи за анализу и визуелизацију података.

Р је једноставан и лак за учење, читање и писање.

Р је пример ФЛОСС-а (бесплатног софтвера Либре и софтвера отвореног кода) где човек може слободно дистрибуирати копије овог софтвера, читати његов изворни код, мењати га итд.

Ко користи Р?

  • Биро за финансијску заштиту потрошача користи Р за анализу података
  • Статистичари Јохн Деере-а користе Р за моделирање временских серија и геопросторну анализу на поуздан и поновљив начин.
  • Банк оф Америца користи Р за извештавање.
  • Р је део технолошког низа иза чувеног Фоурскуаре-овог механизма за препоруке.
  • АНЗ, четврта највећа банка у Аустралији, користи Р за анализу кредитног ризика.
  • Гоогле користи Р за предвиђање економске активности.
  • Мозилла, фондација одговорна за Фирефок веб прегледач, користи Р за визуелизацију веб активности.

Испод су неки од домена у којима се користи Р:

Сада, кренимо напред у блогу са водичима за Р и инсталирајмо Р.

Р Водич: Инсталација Р.

Дозволићу вам да вас водим кроз поступак инсталирања Р-а на ваш систем. Само следите кораке у наставку:

Корак 1 : Идите на везу- хттпс://цран.р-пројецт.орг/

Корак 2 : Преузмите и инсталирајте Р 3.3.3 на свој систем.

Погледајте доњи снимак екрана да бисте стекли боље разумевање.

Пратећи горње кораке, завршили сте са инсталационим делом Р. Сада можете директно започети кодирање у Р-ом тако што ћете преузети РСтудио ИДЕ. Да бисте преузели ово, следите кораке у наставку:

Корак 1 : Идите на везу хттпс://ввв.рстудио.цом/

Корак 2 : Преузмите и инсталирајте Рстудио на свој систем.

Након што све инсталирате, сви сте спремни за кодирање!

Р Водич за почетнике | Р Водич за програмирање | Едурека

Даље, померимо се на блогу Р Туториал и схватимо шта су оператери података у Р.

Р Водич: Оператери података у Р.

Постоји углавном 5 различитих врста оператера, који су наведени у наставку:

  1. Аритметички оператори : Изводите аритметичке операције као што су сабирање, одузимање, множење, дељење итд.
  2. Оператори доделе :Оператори додељивања користе се за додељивање вредности. На пример:
  • Оператор доделе =
    Синтакса:
    име променљиве = вредност
> к = 5 >Икс 
Излаз: [1] 5
  • Оператор доделе<-
    Синтакса:
    име променљиве<- value

    > к<- 15 > к
    Излаз: [1] 15
  • Оператор доделе<<-
    Синтакса:
    име променљиве<<- value
> к<<- 2 > к
Излаз: [1] 2
  • Оператор доделе ->
    Синтакса:
    вредност -> име променљиве

    > 25 -> к > к 
    Излаз: [1] 25

3. Релациони оператер : Дефинише везу између два ентитета. На пример: ,<=,!= etc.

> кк! = 2
Излаз:[1] ИСТИНА

4. Логички оператори : Ови оператори упоређују два ентитета и обично се користе са логичким (логичким) вредностима као што су &, | и !.

> к2 и 3
Излаз:[1] ИСТИНА

5. Специјални оператери : Ови оператори се користе за одређену сврху, а не за логичко рачунање. На пример:

  • Ствара низ бројева у низу за вектор.

    > кк
    Излаз: [1] 2 3 4 5 6 7 8
  • % у% Овај оператор се користи за утврђивање да ли елемент припада вектору.
    Пример

    > кии% у% к
    Излаз: [1] ИСТИНА

Р Водич: Типови података

Типови података се користе за чување информација. У Р, не треба да декларишемо променљиву као неки тип података. Променљиве су додељене Р-Објектима, а тип података Р-објекта постаје тип података променљиве.У Р је присутно углавном шест типова података:

Идемо детаљније о сваком од њих:

Вецтор : Вецтор је низ елемената података истог основног типа. Пример:

втр = (1, 3, 5, 7 9)

или

втр<- (1, 3, 5 ,7 9)

Постоји 5 атомских вектора, који се такође називају и пет класа вектора.

функција статичког члана у ц ++

Листа : Листе су Р објекти који садрже елементе различитих врста као што су & минус бројеви, низови, вектори и друга листа унутар њих.

> н = ц (2, 3, 5) > с = ц ('аа', 'бб', 'цц', 'дд', 'ее') > к = листа (н, с, ИСТИНИТО) > к

Оутпут -

[[1]] [1] 2 3 5 [[2]] [1] 'аа' 'бб' 'цц' 'дд' 'ее' [[3]] [1] ИСТИНА

Низови : Низови су Р подаци објекти који могу да чувају податке у више од две димензије. Као улаз узима векторе и користи вредности у параметру дим за стварање низа.

вектор1<- c(5,9,3) вектор2<- c(10,11,12,13,14,15) резултат<- array(c(vector1,vector2),dim = c(3,3,2))

Оутпут -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Низови : Матрице су Р објекти у којима су елементи распоређени у дводимензионални правоугаони распоред. Матрица се креира помоћу функције матрик (). Пример: матрица (подаци, нров, нцол, биров, димнамес) где,

подаци је улазни вектор који постаје елемент података матрице.

нров је број редова који се креирају.

нцол је број колона које треба створити.

биров је логичан траг. Ако је ИСТИНА, тада су улазни векторски елементи поређани по редовима.

димнаме је имена додељена редовима и колонама.

> Мат<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Мат
Оутпут :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Фактори : Фактори су објекти података који се користе за категоризацију података и њихово чување као нивое. Могу да чувају и низове и целе бројеве. Корисни су у анализи података за статистичко моделирање.

> подаци<- c('East','West','East','North','North','East','West','West“,'East“) > дата_фактор<- factor(data) > дата_фактор

Оутпут :

[1] Исток Запад Исток Север Север Исток Запад Запад Исток Нивои: Исток Северозапад

Оквири података : Оквир података је табела или дводимензионална структура налик низу у којој свака колона садржи вредности једне променљиве, а сваки ред по један скуп вредности из сваке колоне.

> стд_ид = ц (1: 5) > стд_наме = ц ('Рицк', 'Дан', 'Мицхелле', 'Риан', 'Гари') > оцене = ц (623.3.515.2.611.0.729.0.843,25) > стд.дата<- data.frame(std_id, std_name, marks) > стд.дата

Оутпут :

стд_ид ознаке стд_наме 1 1 Рицк 623,30 2 2 И 515.20 3 3 Мишел 611,00 4 4 Рајан 729,00 5 5 Гери 843.25

Овим долазимо до краја различитих типова података у Р. Даље, кренимо даље у блогу Р Туториал и схватимо још један кључни концепт - изјаве о контроли протока.

Р Водич: Изјаве о контроли протока

Изводи контроле протока играју веома важну улогу јер вам омогућавају да контролишете ток извршавања скрипте унутар функције. Најчешће коришћене изјаве о контроли протока представљене су на доњој слици:

Сада, разговарајмо о сваком од њих са примерима.

Р Водич: Изјаве о селектору

  • Ако је Изјава о контроли : Ова контролна изјава процењује један услов. Прилично је једноставно, јер има само једну кључну реч „ако“, праћену условом, а затим одређеним скупом изјава које треба извршити у случају да је тачно. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У овом дијаграму тока, код ће одговорити на следећи начин:

  1. Пре свега, ући ће у петљу где проверава стање.
  2. Ако је услов тачан, извршиће се условни код или написани изрази.
  3. Ако је услов нетачан, изјаве се игноришу.

Испод је пример ако контролна изјава у Р. Покушајте да покренете овај пример у Р Студио.

к = 2 поновити {к = к ^ 2 принт (к) иф (к> 100) {бреак}

Излаз:

[1] 4 [1] 16 [1] 256
  • Иф Елсе Цонтрол Статемент :Испитс тип изјаве о контролипроцењује групу услова и бира изјаве. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У овом дијаграму тока, код ће одговорити на следећи начин:

  1. Пре свега, ући ће у петљу где проверава стање.
  2. Ако је услов тачан, извршиће се први изрази „ако“.
  3. Ако је услов нетачан, он прелази на услов 'елсе иф', а ако је тачан, извршиће се 'елсе иф' код.
  4. Коначно, ако је и 'иф иф' код такође нетачан, онда ће прећи на 'елсе' код и биће извршен. То значи да ако ниједан од ових услова није тачан, тада се извршава израз „елсе“.

Испод је пример ако друго контролна изјава у Р. Покушајте да покренете овај пример у Р Студио.

к5) {принт ('к је већи од 5')} елсеиф (к == 5) {принт ('к је једнак 5')} елсе {принт ('к није већи од 5')}

Излаз:

[1] 'к је једнако 5'
  • Пребаци изјаве : Ове контролне изјаве се у основи користе за поређење одређеног израза са познатом вредношћу. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У овом дијаграму тока случаја Свитцх, код ће одговорити у следећим корацима:

  1. Прво ће ући у случај прекидача који има израз.
  2. Следеће ће ићи на случај 1, проверава вредност прослеђену услову. Ако је тачно, извршит ће се блок Статемент. Након тога ће се поломити из тог кућишта прекидача.
  3. У случају да је нетачно, онда ће се пребацити на следећи случај. Ако је услов случаја 2 тачан, извршиће изјаву и одвојити се од тог случаја, у супротном ће поново прећи на следећи случај.
  4. Рецимо сада да нисте навели ниједан случај или да је корисник унео погрешан унос, а затим ће отићи на подразумевани случај где ће одштампати вашу подразумевану изјаву.

Испод је пример наредбе прекидача у Р. Покушајте да покренете овај пример у Р Студио.

втр<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Излаз:

[1] 275

Р Водич: Изјаве петље

Петље вам помажу да поновите одређени скуп радњи тако да их не морате изводити више пута. Замислите да треба да извршите операцију 10 пута, ако започнете са писањем кода за сваки пут, дужина програма се повећава и касније би вам било тешко да је разумете. Али истовремено коришћењем петље, ако напишем исту изјаву унутар петље, то штеди време и олакшава читљивост кода. Такође се побољшава у погледу ефикасности кода.

На горњој слици „ понављање' и ' док „Изјаве вам помажу да извршите одређени скуп правила док услов не буде тачан, али“ за' је изјава петље која се користи када знате колико пута желите да поновите блок изјаве. Ако знате да то желите поновити 10 пута, ићи ћете са изјавом „за“, али ако нисте сигурни колико пута желите да се код понови, ићи ћете са „поновити“ или петља „док“.

Хајде да разговарамо о сваком од њих са примерима.

  • Понављање : Понављачка петља помаже у извршавању истог скупа кода изнова и изнова док се не испуни услов заустављања. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У горњој дијаграму тока, код ће одговорити у следећим корацима:

  1. Прво ће ући и извршити сет кода.
  2. Следеће ће проверити стање, ако је тачно, вратиће се и поново извршити исти скуп кода док не буде замишљено као нетачно.
  3. Ако се утврди да је нетачно, директно ће изаћи из петље.
  • Док : Израз вхиле такође помаже у извршавању истог скупа кода изнова и изнова док се не испуни услов заустављања. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У горњој дијаграму тока, код ће одговорити у следећим корацима:

  1. Пре свега провериће стање.
  2. Ако се утврди да је тачно, извршиће скуп кода.
  3. Даље, поново проверава стање, ако је тачно, извршиће поново исти код. Чим се утврди да је услов нетачан, он одмах излази из петље.

Испод је пример изјаве вхиле у Р. Покушајте да покренете овај пример у Р Студио.

к = 2 док (к<1000) { x=x^2 print(x) } 

Излаз:

4 16 256 65 536

Дакле, сигурно се питате како се ове две изјаве разликују? Да разјасним вашу сумњу!
Овде је главна разлика између понављања и вхиле изјаве у томе што се она мења у односу на ваше стање. Док петља у основи дефинише када ћете ући у петљу да бисте извршили изразе и понављање петља дефинише када изађете из петље након извршавања израза. Дакле, ове две изјаве су познате као петља за контролу уласка и контроле за излаз. Тако се разликују изјаве вхиле и репеат.

  • Фор Лооп: Петље се користе када требате извршити блок кода неколико пута. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У горњој дијаграму тока, код ће одговорити у следећим корацима:

  1. Као прво постоји иницијализација где одредите колико пута желите да се петља понови.
  2. Затим проверава стање. Ако је услов тачан, извршиће скуп кода одређени број пута.
  3. Чим се утврди да је услов нетачан, он одмах излази из петље.

Испод је пример за израз у Р. Покушајте да покренете овај пример у Р Студио.

втр<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Излаз:

7 19 25 65 45

Даље, пређимо на наш последњи скуп изјава у блогу Р Туториал, тј.

Р Водич: Изјаве о скоковима

Бреак Статемент : Изводи прекида помажу у прекиду програма и настављају контролу на следећу наредбу која следи петљу. Ове изјаве се такође користе у случају прекидача. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У горњој дијаграму тока, код ће одговорити у следећим корацима:

  1. Пре свега, ући ће у петљу где проверава стање.
  2. Ако је услов петље нетачан, он директно излази из петље.
  3. Ако је услов тачан, провериће стање прекида.
  4. Ако је услов прекида тачан, он постоји из петље.
  5. Ако је услов прекида нетачан, извршиће изразе који су остали у петљи, а затим поновити исте кораке.

Испод је пример изјаве о скоку у Р. Покушајте да покренете овај пример у Р Студио.

Икс<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Излаз:

[1] 1 [1] 2

Следећа изјава : Следећа изјава се користи када желите прескочити тренутну итерацију петље без прекида. Следећа изјава је прилично слична „настави“ у другом програмском језику. Погледајте доњи дијаграм тока да бисте стекли боље разумевање:

У горњој дијаграму тока, код ће одговорити у следећим корацима:

  1. Пре свега, ући ће у петљу где проверава стање.

  2. Ако је услов петље нетачан, он директно излази из петље.

  3. Ако је услов петље тачан, извршиће наредбе блока 1.

  4. Након тога ће проверити да ли постоји „следећа“ изјава. Ако је присутан, тада се изрази након тога неће извршити у истој итерацији петље.

  5. Ако није наведена наредба „нект“, тада ће се извршити све наредбе након тога.

Испод је пример следеће наредбе у Р. Покушајте да покренете овај пример у Р Студио.

фор (и у 1:15) {иф ((и %% 2) == 0) {нект} принт (и)}

Излаз:

1 3 5 7 9 11 13 15

Ово је крај Р туториал блога. Надам се да сте јасни за сваки концепт о којем сам горе говорио. Пратите нас, мој следећи блог биће на Р тренингу, где ћу детаљно објаснити неке концепте Р са бившимдовољно.

Сад кад сте разумели основе Р, погледајте Едурека, поуздана компанија за учење на мрежи са мрежом од више од 250 000 задовољних ученика раширених широм света. Едурекина аналитика података са Р обуком ће вам помоћи да стекнете стручност у Р програмирању, манипулацији подацима, истраживачкој анализи података, визуелизацији података, рударству података, регресији, анализи сентимента и коришћењу Р Студио-а за студије стварног живота у малопродаји, друштвеним медијима.

Имате питање за нас? Молимо вас да га помињете у одељку за коментаре овог блога „Р Туториал“ и јавићемо вам се што је пре могуће.