Који су предуслови за машинско учење?



Овај блог о предусловима за машинско учење помоћи ће вам да разумете основне концепте које морате знати пре него што започнете са машинским учењем.

Машинско учење је несумњиво најтраженија технологија тог доба! Ако сте почетник који започиње са машинским учењем, важно је да знате предуслове за машинско учење. Овај блог ће вам помоћи да разумете различите концепте које морате знати пре него што започнете са машинским учењем.

Да бисте стекли детаљно знање о вештачкој интелигенцији и машинском учењу, можете се пријавити уживо Едурека са 24/7 подршком и доживотним приступом.





Ево листе тема покривен на овом блогу:

  1. Предуслови за машинско учење
  2. Разумевање машинског учења са случајем употребе

Предуслови за машинско учење

За почетакМашинско учење морате бити упознати са следећим концептима:



  1. Статистика
  2. Линеарна алгебра
  3. Рачун
  4. Вероватноћа
  5. Програмски језици

Статистика

Статистика садржи алате који се могу користити за добијање одређеног резултата из података. Постоји дескриптивна статистика која се користи за трансформисање сирових података у неке важне информације. Такође, инференцијалне статистике се могу користити за добијање важних информација из узорка података уместо да користе комплетан скуп података.

Да бисте сазнали више о Статистике можете проћи кроз следеће блогове:

Линеарна алгебра

Понуде линеарне алгебреса векторима, матрицама и линеарним трансформацијама. Веома је важан у машинском учењу, јер се може користити за трансформисање и извођење операција на скупу података.



Рачун

Рачун је важно подручје математике и игра интегралну улогу у многим алгоритмима машинског учења. Скуп података који има више карактеристика јекористи се за изградњу модела машинског учења јер су карактеристике вишеструко мултиваријабилни рачун игра важну улогу за изградњу модела машинског учења. Интеграције и диференцијације су неопходни.

Вероватноћа

Вероватноћа помаже у предвиђању вероватноће појаве, помаже нам у закључивању да се ситуација може или не мора поновити. За машинско учење вероватноћа је а темељ.

Mathematics

Да бисте сазнали више о вероватноћи, можете проћи кроз ово Блог.

Програмски језик

Неопходно је знати програмске језике као што су Р и Питхон како би се применио читав процес машинског учења. Питхон и Р нуде уграђене библиотеке које олакшавају примену алгоритама машинског учења.

Поред основног знања из програмирања, важно је и да знате како да издвојите, обрадите и анализирате податке. Ово је једна од најважнијих вештина која је потребна за машинско учење.

Да бисте сазнали више о програмирању језика за машинско учење можете проћи кроз следеће блогове:

  1. Најбоље Питхон библиотеке за науку података и машинско учење

Случај употребе машинског учења

Машинско учење се састоји од стварања алгоритма који може научити на основу података да би предвидео попут врста предмета на слици или механизма за препоруке, најбољу комбинацију лекова за лечење одређене болести или филтрирање нежељене поште.

како упозорити у јавасцрипту

Машинско учење је засновано на математичким предусловима и ако знате зашто се математика користи у машинском учењу, биће забавно. Морате знати математику иза функција које ћете користити и који модел је погодан за податке и зашто.

Почнимо са занимљивим проблемом предвиђања цена кућа, који садржи скуп података који садржи историју различитих карактеристика и цена, за сада ћемо размотрити површину животног простора у квадратним метрима и цене.

Сада имамо скуп података који садржи две колоне као што је приказано доле:

Мора постојати одређена корелација између ове две променљиве да бисмо сазнали да ћемо морати да изградимо модел који може предвидети цену кућа, како то можемо?

Хајде да графички прикажемо ове податке и да видимо како то изгледа:

Овде је оса Кс цена квадратног метра стамбеног простора, а оса И цена куће. Ако уцртамо све тачке података, добићемо распршени приказ који се може представити линијом као што је приказано на горњој слици, а ако унесемо неке податке, тада ће предвидети неки исход. У идеалном случају, морамо пронаћи линију која ће пресецати максималне тачке података.

Овде покушавамо да направимо линију која се назива:

И = мКс + ц

Овај метод предвиђања линеарног односа између циљне (зависне променљиве) и предикторске променљиве (независне променљиве) назива се линеарном регресијом. Омогућава нам да проучимо и резимирамо везу између две променљиве.

  • Кс = Независна променљива
  • И = зависна променљива
  • ц = пресретање и
  • м = нагиб линије

Ако узмемо у обзир једначину, имамо вредности за Кс која је независна променљива, па све што треба да урадимо је да израчунамо вредности за м и ц како бисмо предвидели вредност И.

Па како да пронађемо ове променљиве?

Да бисмо пронашли ове променљиве, можемо испробати гомилу вредности и покушати да пронађемо линију која пресеца максималан број тачака података. Али, како можемо пронаћи најбољу линију?

Дакле, да бисмо пронашли најприкладнију линију, можемо користити функцију грешке најмање квадрата која ће пронаћи грешку између стварне вредности и и предвиђене вредности и`.

Функција грешке најмањих квадрата може се представити помоћу следеће једначине:

шта је иос програмер

Помоћу ове функције можемо открити грешку за сваку предвиђену тачку података поредећи је са стварном вредношћу тачке података. Затим узимате збир свих ових грешака и квадратујете их да бисте открили одступање у предвиђању.

Ако трећем оси додамо наш граф који садржи све могуће вредности грешака и уцртамо га у тродимензионални простор, то ће изгледати овако:

На горњој слици, идеалне вредности би биле у доњем црном делу који ће предвидети цене близу стварне тачке података. Следећи корак је проналажење најбољих могућих вредности за м и ц. То се може постићи употребом технике оптимизације која се назива градијентни спуст.

Градиентни спуст је итеративна метода, где започињемо са иницијализацијом неког скупа вредности за наше променљиве и полако их побољшавамо минимизирајући грешку између стварне вредности и предвиђене вредности.

Сада ако мислимо да практично цене стана заправо не зависе само од цене по квадратном метру, постоји много фактора као што је број спаваћих соба, купатила итд. Ако узмемо у обзир и те карактеристике, једначина ће изгледати некако овако

И = б0 + б1к1 + б2к2 + & хеллип .. + бнкн + ц

Ово је мултилинеарна регресија, ово припада линеарној алгебри, овде можемо користити матрице величине мкн где су м особине и н тачке података.

Размотримо још једну ситуацију у којој можемо да користимо вероватноћу да бисмо пронашли стање куће како бисмо кућу класификовали на основу тога да ли је у добром или лошем стању. Да бисмо ово радили, мораћемо да користимо технику која се назива Логистичка регресија и која ради на вероватноћи појава представљених сигмоидном функцијом.

У овом чланку смо покрили предуслове машинског учења и како се они примењују у машинском учењу. Дакле, у основи се састоји од статистике, рачуна, линеарне алгебре и теорије вероватноће. Рачун има технике коришћене за оптимизацију, линеарна алгебра има алгоритме који могу радити на огромним скуповима података, са вероватноћом можемо предвидети вероватноћу појаве, а статистика нам помаже да закључимо корисне увиде из узорка скупова података.

Сад кад знате предуслове за машинско учење, сигуран сам да сте знатижељни да сазнате више. Ево неколико блогова који ће вам помоћи да започнете са науком о подацима:

Ако желите да се упишете на комплетан курс о вештачкој интелигенцији и машинском учењу, Едурека има посебно курираног то ће вас оспособити за технике попут учења под надзором, учења без надзора и обраде природног језика. Обухвата обуку о најновијим достигнућима и техничким приступима у вештачкој интелигенцији и машинском учењу као што су дубоко учење, графички модели и учење ојачања.