У , обично имамо 2 различите врсте случајева, , и проблем. Матрица збрке помаже у израчунавању тачности класификационог модела што нам индиректно помаже да опишемо перформансе класификационог модела. То је најважнији корак када је у питању оцењивање модела. У овом чланку ћу обрађивати следеће теме:
како направити дупли инт у јави
2. Тачност и компоненте матрице забуне
3. Прецизност, опозив и Ф-мера
4. Стварање матрице забуне помоћу Питхона и Склеарна
Шта је матрица забуне?
Матрица збрке је резиме поређења предвиђених резултата и стварних резултата у било ком случају коришћења проблема класификације. Резиме поређења је изузетно неопходан за одређивање перформанси модела након што се обучи са неким подацима о обуци. За случај употребе бинарне класификације, Матрица збрке је матрица 2 × 2 која је приказана долеПредвиђена вредност класе 1 Нпр .: 1 | Предвиђена вредност класе 2 Нпр .: 0 | |
Стварна вредност класе 1 Нпр .: 1 | ТП (тачно позитивно) | ФН (лажно негативан) |
Стварна вредност класе 2 Нпр .: 0 | ФП (лажно позитивно) | ТН (тачно негативно) |
Са горње слике:
Имамо,
- Стварна вредност класе 1 = 1 која је слична позитивној вредности у бинарном исходу.
- Стварна вредност класе 2 = 0 која је слична негативној вредности у бинарном исходу.
Индекс леве стране матрице забуне у основи означава стварне вредности, а горња колона предвиђене вредности.
Постоје разне компоненте које постоје када креирамо матрицу забуне. Компоненте су поменуте у наставку
Позитивно (П): Предвиђени резултат је позитиван (пример: слика је мачка)
Негативно (Н): предвиђени резултат је негативан (пример: Слике нису мачка)
Тачно позитивно (ТП): Овде ТП у основи указује на предвиђање, а стварне вредности су 1 (тачно)
Тачно негативно (ТН): Овде ТН означава предвиђање, а стварна вредност је 0 (нетачно)
Лажно негативан (ФН): Овде ФН означава да је предвиђена вредност 0 (негативна), а стварна 1. 1. Овде се обе вредности не подударају. Отуда је лажно негативан.
Лажно позитиван (ФП): Овде ФП указује да је предвиђена вредност 1 (позитивна), а стварна вредност 0. Овде се опет обе вредности не подударају. Отуда је лажно позитиван.
Тачност и компоненте матрице забуне
Након што се креира матрица забуне и утврдимо све вредности компонената, постаје нам врло лако да израчунамо тачност. Дакле, погледајмо компоненте да бисмо ово боље разумели.- Тачност класификације
Из горње формуле, збир ТП (тачно позитиван) и ТН (истински негативан) тачни су предвиђени резултати. Стога, да бисмо израчунали тачност у процентима, делимо са свим осталим компонентама. Међутим, постоје неки проблеми у тачности и не можемо у потпуности да зависимо од тога.
Узмимо у обзир да је наш скуп података потпуно неуравнотежен. У овом сценарију, тачност 98% може бити добра или лоша на основу изјаве о проблему. Отуда имамо још неколико кључних појмова који ће нам помоћи да будемо сигурни у тачност коју израчунавамо. Услови су наведени у наставку:
- ТПР (истинска позитивна стопа) или осетљивост:
Тачна позитивна стопа која је позната и као осетљивост мери проценат истинске позитивне вредности у односу на укупну стварну позитивну вредност која је означена са (ТП + ФН)
Предвиђена вредност класе 1 Нпр .: 1 | Предвиђена вредност класе 2 Нпр .: 0 | Укупно | |
Стварна вредност класе 1 Нпр .: 1 | ТП (тачно позитивно) | ФН (лажно негативан) | Укупан стварни позитив |
Стварна вредност класе 2 Нпр .: 0 | ФП (лажно позитивно) | ТН (тачно негативно) | Укупни стварни негативи |
- ТНР (тачно негативна стопа) или специфичност:
Тачно негативна стопа или специфичност мери удео стварних негатива у односу на укупне негативе
Предвиђена вредност класе 1 Нпр .: 1 | Предвиђена вредност класе 2 Нпр .: 0 | Укупно | |
Стварна вредност класе 1 Нпр .: 1 | ТП (тачно позитивно) | ФН (лажно негативан) | Укупан стварни позитив |
Стварна вредност класе 2 Нпр .: 0 | ФП (лажно позитивно) | ТН (тачно негативно) | Укупни стварни негативи |
ТНР = тачно негативно / (тачно негативно + лажно позитивно)
- Лажно позитивна стопа (ФПР):
Лажно позитивна стопа представља проценат предвиђених лажно позитивних резултата (ФП) у односу на укупан број предвиђених позитивних резултата (ТП + ФП).
Предвиђена вредност класе 1 Нпр .: 1 | Предвиђена вредност класе 2 Нпр .: 0 | |
Стварна вредност класе 1 Нпр .: 1 | ТП (тачно позитивно) | ФН (лажно негативан) |
Стварна вредност класе 2 Нпр .: 0 | ФП (лажно позитивно) | ТН (тачно негативно) |
Збир укупно предвиђеног позитивног | Збир укупно предвиђеног негативног |
- Стопа лажних негатива (ФНР):
Стопа лажно негативних резултата представља проценат предвиђених лажних негатива (ФП) у односу на укупан број предвиђених негативних резултата (ТН + ФН).
Прецизност, опозив и мерење Ф
- Поврат:
Опозив је сличан истинској позитивној стопи и то је однос укупног броја тачно предвиђених позитивних вредности (ТП) према свим позитивним вредностима.
- Прецизност:
Прецизност у основи указује на све тачке за које је модел предвидео да су позитивне и који проценат њих је заправо позитиван.
Прецизност и опозив су метрички резултати који се фокусирају на позитивну класу, као што је приказано из горњих формула.
- Ф-Меасуре
Дакле, Ф-Меасуре је техника која комбинује технику прецизности и опозива и користи хармоничну средину уместо уобичајене аритметичке средине, због чега се екстремне вредности кажњавају. Ф-мера се назива и Ф1-оцена и даје се доњом формулом.
Размотримо пример и видимо како можемо израчунати тачност, прецизност, опозив и Ф1-резултат.
Н = 165 | Предвиђено ДА | Предвиђено НЕ |
Стварно ДА | ТП = 150 | ФН = 10 |
Цуррент НО | ФП = 20 | ТН = 100 |
- Тачност = (ТП + ТН) / (ТП + ТН + ФП + ФН) = (150 + 100) / (150 + 100 + 20 + 10) = 0.89
- Поврат = ТП / (ТП + ФН) = 150 / (150 + 10) = 0.93
- Прецизност: ТП / (ТП + ФП) = 150 / (150 + 20) = 0.88
- Ф-мера = (2 * опозив * прецизност) / (опозив + пресисион) = (2 * 0,93 * 0,88) / (0,93 + 0,88) = 0.90
Стварање матрице забуне помоћу Питхона и Склеарна
Сада ћемо видети пример како можемо створити матрицу забуне користећи питхон заједно са склеарн библиотеком.
један. У почетку ћемо створити листу стварних података и предвиђених за проверу тачности као што је приказано у наставку
# Питхон скрипта за стварање збуњујуће матрице. стварни_подаци = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] предвиђени_подаци = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1]
2. Морамо да увозимо матрицу забуне из библиотеке склеарн, као што је приказано доле:
како прекинути програм у јави
фром склеарн.метрицс импорт цонфусион_матрик
3 Затим ћемо створити матрицу забуне као што је приказано доле:
финал_ресултс = цонфусион_матрик (стварни_подаци, предвиђени_подаци)
Четири. Сада можемо наставити и израчунати тачност увозом библиотеке као што је приказано доле:
из склеарн.метрицс увоз тачност_скор тачност = тачност_резултата (стварни_подаци, предвиђени_подаци)
5. На крају израчунавамо Ф1-резултат или Ф-меру као што је приказано доле:
фром склеарн.метрицс импорт репорт_репорт репорт = репорт_цлаис (стварни_подаци, предвиђени_подаци)
Испод је комплетан код:
стварни_подаци = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0,1,0,1] предвиђени_подаци = [0, 1, 1, 1, 0, 0, 1, 0, 1, 0,1,0,1] из склеарн.метрицс импорт цонфусион_матрик финал_ресултс = цонфусион_матрик (стварни_подаци, предвиђени_подаци) испис (финал_ресултс) из склеарн.метрицс увоз прецизност_резултата тачност = прецизност_вредности (стварни_подаци, предвиђени_подаци) из извештаја склеарн.метрицс извештај класификације_извештаја = класификација_извештај ( стварни_подаци, предвиђени_подаци) испис (тачност) испис (извештај)
Дакле, овим смо дошли до краја овог чланка. Надам се да је сва ваша забуна око Матрице збрке сада решена.
Едурека помаже вам да стекнете стручност у различитим алгоритмима машинског учења као што су регресија, груписање, стабла одлучивања, случајне шуме, наивни Баиес и К-учење. Ово машинско учење коришћењем Питхон Траининг-а излаже вас концептима статистике, временских серија и различитим класама алгоритама машинског учења, као што су надгледани, ненадгледани и појачани алгоритми. Током читавог курса за сертификацију науке о подацима решићете стварне студије случаја о медијима, здравству, друштвеним медијима, ваздухопловству, људским ресурсима.