Како извести логистичку регресију у Питхону?



Логистичка регресија у Питхону користећи склеарн за предвиђање исхода одређивањем односа између зависних и једне или више независних променљивих.

Логистичка регресија у Питхону је техника предиктивне анализе. Такође се користи у машинском учењу за проблеме бинарне класификације. На овом блогу ћемо проћи кроз следеће теме да бисмо разумели логистичку регресију у Питхону:

  1. Шта је регресија?
  2. Логистичка регресија у Питхону
  3. Логистичка регресија вс Линеарна регресија
  4. Користите случајеве
  5. Демонстрација

Такође можете упутити овај детаљан водич о логистичкој регресији у питхону са демонстрацијом ради бољег разумевања или проћи кроз да савлада логистичку регресију.





Шта је регресија?

анализа је моћна техника статистичке анализе. А. зависни променљива нашег интереса користи се за предвиђање вредности других независне варијабле у скупу података.

Регресију наилазимо на интуитиван начин све време. Попут предвиђања времена помоћу скупа података о временским приликама у прошлости.



Користи многе технике за анализу и предвиђање исхода, али нагласак је углавном на томе однос између зависне променљиве и једне или више независних променљивих.

анализа предвиђа исход у бинарној променљивој која има само два могућа исхода.



Логистичка регресија у Питхону

То је техника за анализу скупа података који има зависну променљиву и једну или више независних променљивих за предвиђање исхода у бинарној променљивој, што значи да ће имати само два исхода.

Зависна променљива је категоричан у природи. Зависна променљива се такође назива циљна променљива а независне променљиве се називају предиктори .

Логистичка регресија је посебан случај линеарне регресије где исход предвиђамо само у категоријској променљивој. Предвиђа вероватноћу догађаја помоћу функције дневника.

Ми користимо Сигмоидна функција / крива да предвиди категоријску вредност. Вредност прага одлучује о исходу (победа / пораз).

Једначина линеарне регресије: и = β0 + β1Кс1 + β2Кс2…. + βнКсн

  • И означава зависну променљиву коју треба предвидети.
  • β0 је пресек И, који је у основи тачка на линији која додирује и осу.
  • β1 је нагиб линије (нагиб може бити негативан или позитиван у зависности од односа између зависне променљиве и независне променљиве.)
  • Кс овде представља независну променљиву која се користи за предвиђање наше резултујуће зависне вредности.

Сигмоидна функција: п = 1/1 + е-Да

Применити сигмоидну функцију на једначину линеарне регресије.

логистичка регресија у питхон-едурека

Једначина логистичке регресије: п = 1/1 + е- (β0 + β1Кс1 + β2Кс2…. + βнКсн)

Погледајмо различите типове логистичке регресије.

Врсте логистичке регресије

подниз у примеру скл сервера
    • Бинарна логистичка регресија - има само два могућа исхода. Пример- да или не
    • Мултиномијска логистичка регресија - Има три или више номиналних категорија. Пример - мачка, пас, слон.
    • Редовна логистичка регресија - Има три или више редних категорија, што значи да ће категорије бити поредане. Пример- оцене корисника (1-5).

Линеарна вс логистичка регресија

Док линеарна регресија може имати бесконачно могуће вредности, логистичка регресија има дефинитивни исходи .

Линеарна регресија се користи када је променљива одговора континуиране природе, али логистичка регресија се користи када је променљива одговора категоричке природе.

Предвиђање неплатиша у банци користећи детаље трансакције у прошлости је пример логистичке регресије, док је континуирани излаз попут стања на берзи пример линеарне регресије.

Користите случајеве

Следе примери употребе где можемо користити логистичку регресију.

Временска прогноза

Временска предвиђања резултат су логичке регресије. Овде анализирамо податке из претходних временских извештаја и предвиђамо могући исход за одређени дан. Али логична регресија само би предвидела категоричке податке, попут тога да ли ће киша падати или не.

Утврђивање болести

Ми Можемоупотребалогичка регресија уз помоћ историје болести пацијента да би се предвидело да ли је болест у сваком случају позитивна или негативна.

Узмимо узорак скупа података за изградњу модела предвиђања користећи логистичку регресију.

Демо

Изградићемо модел предвиђањаКористећилогичка регресија у Питхону уз помоћодскуп података,у овопокриваћемо следеће кораке да бисмо постигли логичку регресију.

Прикупљање података

Први корак за спровођење логистичке регресије је прикупљање података. Учитаћемо цсв датотеку која садржи скуп података у програме користећи панде. НБА податке користимо за изградњу модела предвиђања да бисмо предвидели могућност домаће утакмице или утакмице у гостима, анализирајући везу између релевантних података.

импорт пандас ас пд импорт нумпи ас нп импорт сеаборн ас снс импорт матплотлиб.пиплот ас плт дф = пд.реад_цсв (р'Ц: УсерсМохаммадВасеемДоцументсдата.цсв ') принт (дф.хеад (5))

Добићете све податке у читљив формат за лакшу анализу. А онда можете одредити зависне и независне променљиве за свој модел.

Анализирање података

Скуп података се анализира како би се утврдио однос између променљивих. Стварањем различитих графикона за проверу односа између променљивих.

снс.цоунтплот ('Почетна', хуе = 'ВИНорЛОСС', дата = дф) плт.схов ()

Изнад је однос између процента победе / пораза у односу на утакмицу код куће / у гостима. С.подједнакоможемо уцртати графикон односа између осталих релевантних уноса у подацима.

Препирка података

Скуп података се модификује у складу са циљном променљивом. Уклонићемо све нулл вредности и вредности низа из ДатаФраме-а.

принт (дф.иснулл (). сум ())

Проверићемо да ли постоје сви небитни подаци попут нулл вредности и вредности које неће бити потребне током изградње модела предвиђања. Ако у НБА скупу података који користимо нема нулл вредности, наставићемо са поделом података.

Подаци о тестирању и обуци

За перформансе модела подаци се деле на податке о испитивању и податке о возовима. Подаци се деле помоћу траин_тест_сплит . Подаци су овде подељени у омјеру 70:30.

Сада, за предвиђање модела функција логистичке регресије се имплементира увозом модела логистичке регресије у модул склеарн.

добити дужину низа јс

Модел се затим уклапа у гарнитуру воза помоћу функције уклапања. Након тога предвиђање се врши помоћу функције предвиђања.

из склеарн.модел_селецтион импорт траин_тест_сплит фром склеарн.линеар_модел импорт ЛогистицРегрессион фром склеарн.метрицс импорт логистицс_репорт фром склеарн.метрицс импорт цонфусион_матрик, дакладнаст_сцоре к = дф.дроп ('Почетна', оса = 1) и = дф ['Почетна'] к_траин, к_тест, и_траин, и_тест = траин_тест_сплит (к, и, тест_сизе = 0.33, рандом_стате = 1) логмодел = ЛогистицРегрессион () логмодел.фит (к_траин, и_траин) предвиђања = логмодел.предицт (к_тест) принт (класификација_извештаја (и_тест, предвиђања)) принт (матрица_забуњивања (и_тест, предвиђања)) принт (резултат_тачности (и_тест, предвиђања))

Извештај о класификацији:

Извештај о класификацији приказује Прецизност , Подсетимо, Ф1 и подршка оцене за модел.

Прецизност резултат значи ниво до ког је предвиђање модела прецизно. Прецизност домаће утакмице је 0.62 а за утакмицу у гостима је 0.58 .

Поврат је износ до којег модел може предвидети исход. Подсетимо за домаћу утакмицу је 0.57 а за утакмицу у гостима је 0.64 . Резултати Ф1 и Подршка су количина података тестираних за предвиђања. У НБА скупу података подаци тестирани за домаћу утакмицу су 1662 а за утакмицу у гостима је 1586 .

Матрица забуне:

Матрица забуне је табела која описује перформансе модела предвиђања. Матрица забуне садржи стварне вредности и предвиђене вредности. те вредности можемо користити за израчунавање оцене тачности модела.

Мапа топлоте збуњујуће матрице:

Хајде да направимо топлотну мапу матрице конфузије користећи сеаборн и да визуализујемо модел предвиђања који смо изградили. За цртање мапе топлоте потребна је следећа синтакса.

снс.хеатмап (пд.ДатаФраме (цонфусион_матрик (и_тест, предвиђања))) плт.схов ()

Увидом у топлотну карту можемо закључити следеће:

  • Од свих предвиђања, класификатор је предвидео да за укупно 1730 пута, од којих је 1012 било стварно да.
  • од свих предвиђања, класификатор је предвидео не за укупно 1518 пута, од којих је 944 стварно.

Овом анализом матрице забуне можемо закључити оцену тачности за наш модел предвиђања.

Оцена тачности:

Оцена тачности је проценат тачности предвиђања направљених моделом. За наш модел оцена тачности је 0,60, што је прилично тачно. Али што је више оцена тачности ефикаснији ваш модел предвиђања. Увек морате тежити већој оцени тачности за бољи модел предвиђања.

Пратећи горе описане кораке, предвидели смо могућност играња дома / госта користећи НБА скуп података. Након анализе извештаја о класификацији можемо претпоставити могућност утакмице код куће / у гостима.

На овом блогу смо разговарали о логистичкој регресији у питхон концептима, у чему се разликује од линеарног приступа. Такође, покрили смо демонстрацију помоћу НБА скупа података. За више увида и вежбања можете да користите скуп података по вашем избору и следите размотрене кораке за примену логистичке регресије у Питхону.

Такође, погледајте разне блогове Дата-Сциенце на платформи едурека да бисте савладали научника за податке у себи.

Ако желите да научите Питхон и изградите каријеру у науци о подацима, погледајте нашу интерактивну мрежу уживо овде долази са подршком од 24 * 7 која ће вас водити током читавог периода учења.
Имате питање? Молимо вас да то поменете у коментарима и јавићемо вам се.