Матрица забуне у машинском учењу: решење на једном месту



Овај чланак се фокусира на Матрицу збуњености, која је један од најважнијих аспеката сваког алгоритма машинског учења који се користи за процену његове тачности.

У , обично имамо 2 различите врсте случајева, , и проблем. Матрица збрке помаже у израчунавању тачности класификационог модела што нам индиректно помаже да опишемо перформансе класификационог модела. То је најважнији корак када је у питању оцењивање модела. У овом чланку ћу обрађивати следеће теме:

1. Шта је матрица конфузије?





како направити дупли инт у јави

2. Тачност и компоненте матрице забуне

3. Прецизност, опозив и Ф-мера



4. Стварање матрице забуне помоћу Питхона и Склеарна

Шта је матрица забуне?

Матрица збрке је резиме поређења предвиђених резултата и стварних резултата у било ком случају коришћења проблема класификације. Резиме поређења је изузетно неопходан за одређивање перформанси модела након што се обучи са неким подацима о обуци. Accuracy-Confusion-MatrixЗа случај употребе бинарне класификације, Матрица збрке је матрица 2 × 2 која је приказана доле
Предвиђена вредност класе 1 Нпр .: 1 Предвиђена вредност класе 2 Нпр .: 0
Стварна вредност класе 1

Нпр .: 1

ТП (тачно позитивно) ФН (лажно негативан)
Стварна вредност класе 2



Нпр .: 0

ФП (лажно позитивно) ТН (тачно негативно)

Са горње слике:
Имамо,

  • Стварна вредност класе 1 = 1 која је слична позитивној вредности у бинарном исходу.
  • Стварна вредност класе 2 = 0 која је слична негативној вредности у бинарном исходу.

Индекс леве стране матрице забуне у основи означава стварне вредности, а горња колона предвиђене вредности.

Постоје разне компоненте које постоје када креирамо матрицу забуне. Компоненте су поменуте у наставку

Позитивно (П): Предвиђени резултат је позитиван (пример: слика је мачка)

Негативно (Н): предвиђени резултат је негативан (пример: Слике нису мачка)

Тачно позитивно (ТП): Овде ТП у основи указује на предвиђање, а стварне вредности су 1 (тачно)

Тачно негативно (ТН): Овде ТН означава предвиђање, а стварна вредност је 0 (нетачно)

Лажно негативан (ФН): Овде ФН означава да је предвиђена вредност 0 (негативна), а стварна 1. 1. Овде се обе вредности не подударају. Отуда је лажно негативан.

Лажно позитиван (ФП): Овде ФП указује да је предвиђена вредност 1 (позитивна), а стварна вредност 0. Овде се опет обе вредности не подударају. Отуда је лажно позитиван.

Тачност и компоненте матрице забуне

Након што се креира матрица забуне и утврдимо све вредности компонената, постаје нам врло лако да израчунамо тачност. Дакле, погледајмо компоненте да бисмо ово боље разумели.
  • Тачност класификације

Из горње формуле, збир ТП (тачно позитиван) и ТН (истински негативан) тачни су предвиђени резултати. Стога, да бисмо израчунали тачност у процентима, делимо са свим осталим компонентама. Међутим, постоје неки проблеми у тачности и не можемо у потпуности да зависимо од тога.

Узмимо у обзир да је наш скуп података потпуно неуравнотежен. У овом сценарију, тачност 98% може бити добра или лоша на основу изјаве о проблему. Отуда имамо још неколико кључних појмова који ће нам помоћи да будемо сигурни у тачност коју израчунавамо. Услови су наведени у наставку:

  • ТПР (истинска позитивна стопа) или осетљивост:

Тачна позитивна стопа која је позната и као осетљивост мери проценат истинске позитивне вредности у односу на укупну стварну позитивну вредност која је означена са (ТП + ФН)

Предвиђена вредност класе 1 Нпр .: 1 Предвиђена вредност класе 2 Нпр .: 0 Укупно
Стварна вредност класе 1

Нпр .: 1

ТП (тачно позитивно) ФН (лажно негативан) Укупан стварни позитив
Стварна вредност класе 2

Нпр .: 0

ФП (лажно позитивно)ТН (тачно негативно)Укупни стварни негативи
ТПР = Тачно позитивно / (Тачно позитивно + Лажно негативно
  • ТНР (тачно негативна стопа) или специфичност:

Тачно негативна стопа или специфичност мери удео стварних негатива у односу на укупне негативе

Предвиђена вредност класе 1 Нпр .: 1 Предвиђена вредност класе 2 Нпр .: 0 Укупно
Стварна вредност класе 1

Нпр .: 1

ТП (тачно позитивно)ФН (лажно негативан)Укупан стварни позитив
Стварна вредност класе 2

Нпр .: 0

ФП (лажно позитивно) ТН (тачно негативно) Укупни стварни негативи

ТНР = тачно негативно / (тачно негативно + лажно позитивно)

  • Лажно позитивна стопа (ФПР):

Лажно позитивна стопа представља проценат предвиђених лажно позитивних резултата (ФП) у односу на укупан број предвиђених позитивних резултата (ТП + ФП).

Предвиђена вредност класе 1 Нпр .: 1 Предвиђена вредност класе 2 Нпр .: 0
Стварна вредност класе 1 Нпр .: 1 ТП (тачно позитивно) ФН (лажно негативан)
Стварна вредност класе 2 Нпр .: 0 ФП (лажно позитивно) ТН (тачно негативно)
Збир укупно предвиђеног позитивног Збир укупно предвиђеног негативног
ФПР = Лажно позитивно / (Тачно позитивно + Лажно позитивно)
  • Стопа лажних негатива (ФНР):

Стопа лажно негативних резултата представља проценат предвиђених лажних негатива (ФП) у односу на укупан број предвиђених негативних резултата (ТН + ФН).

Предвиђена вредност класе 1 Нпр .: 1 Предвиђена вредност класе 2 Нпр .: 0
Стварна вредност класе 1 Нпр .: 1ТП (тачно позитивно) ФН (лажно негативан)
Стварна вредност класе 2 Нпр .: 0ФП (лажно позитивно) ТН (тачно негативно)
Збир укупно предвиђеног позитивног Збир укупно предвиђеног негативног
ФНР = Лажно негативно / (Лажно негативно + Тачно негативно)

Прецизност, опозив и мерење Ф

  • Поврат:

Опозив је сличан истинској позитивној стопи и то је однос укупног броја тачно предвиђених позитивних вредности (ТП) према свим позитивним вредностима.

  • Прецизност:

Прецизност у основи указује на све тачке за које је модел предвидео да су позитивне и који проценат њих је заправо позитиван.

Прецизност и опозив су метрички резултати који се фокусирају на позитивну класу, као што је приказано из горњих формула.

  • Ф-Меасуре

Дакле, Ф-Меасуре је техника која комбинује технику прецизности и опозива и користи хармоничну средину уместо уобичајене аритметичке средине, због чега се екстремне вредности кажњавају. Ф-мера се назива и Ф1-оцена и даје се доњом формулом.

Размотримо пример и видимо како можемо израчунати тачност, прецизност, опозив и Ф1-резултат.

Н = 165 Предвиђено ДА Предвиђено НЕ
Стварно ДА ТП = 150 ФН = 10
Цуррент НО ФП = 20 ТН = 100
    • Тачност = (ТП + ТН) / (ТП + ТН + ФП + ФН) = (150 + 100) / (150 + 100 + 20 + 10) = 0.89
    • Поврат = ТП / (ТП + ФН) = 150 / (150 + 10) = 0.93
    • Прецизност: ТП / (ТП + ФП) = 150 / (150 + 20) = 0.88

  • Ф-мера = (2 * опозив * прецизност) / (опозив + пресисион) = (2 * 0,93 * 0,88) / (0,93 + 0,88) = 0.90

Стварање матрице забуне помоћу Питхона и Склеарна

Сада ћемо видети пример како можемо створити матрицу забуне користећи питхон заједно са склеарн библиотеком.

један. У почетку ћемо створити листу стварних података и предвиђених за проверу тачности као што је приказано у наставку

# Питхон скрипта за стварање збуњујуће матрице. стварни_подаци = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] предвиђени_подаци = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1]

2. Морамо да увозимо матрицу забуне из библиотеке склеарн, као што је приказано доле:

како прекинути програм у јави
фром склеарн.метрицс импорт цонфусион_матрик

3 Затим ћемо створити матрицу забуне као што је приказано доле:

финал_ресултс = цонфусион_матрик (стварни_подаци, предвиђени_подаци)

Четири. Сада можемо наставити и израчунати тачност увозом библиотеке као што је приказано доле:

из склеарн.метрицс увоз тачност_скор тачност = тачност_резултата (стварни_подаци, предвиђени_подаци)

5. На крају израчунавамо Ф1-резултат или Ф-меру као што је приказано доле:

фром склеарн.метрицс импорт репорт_репорт репорт = репорт_цлаис (стварни_подаци, предвиђени_подаци)

Испод је комплетан код:

стварни_подаци = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] предвиђени_подаци = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1] из склеарн.метрицс импорт цонфусион_матрик финал_ресултс = цонфусион_матрик (стварни_подаци, предвиђени_подаци) испис (финал_ресултс) из склеарн.метрицс увоз прецизност_резултата тачност = прецизност_вредности (стварни_подаци, предвиђени_подаци) из извештаја склеарн.метрицс извештај класификације_извештаја = класификација_извештај ( стварни_подаци, предвиђени_подаци) испис (тачност) испис (извештај)

matrix

Дакле, овим смо дошли до краја овог чланка. Надам се да је сва ваша забуна око Матрице збрке сада решена.

Едурека помаже вам да стекнете стручност у различитим алгоритмима машинског учења као што су регресија, груписање, стабла одлучивања, случајне шуме, наивни Баиес и К-учење. Ово машинско учење коришћењем Питхон Траининг-а излаже вас концептима статистике, временских серија и различитим класама алгоритама машинског учења, као што су надгледани, ненадгледани и појачани алгоритми. Током читавог курса за сертификацију науке о подацима решићете стварне студије случаја о медијима, здравству, друштвеним медијима, ваздухопловству, људским ресурсима.