Најновији пројекти машинског учења које треба испробати 2019. године



Овај чланак ће вам пружити свеобухватно знање о пројектима машинског учења у индустрији и достигнућима учињеним у овој области.

је очигледно поље које је забележило луди напредак у последњих неколико година. Овај тренд и напредовање створили су пуно радних места у индустрији. Потреба за Инжењери машинског учења су велике потражње, а овај налет је резултат еволуирајуће технологије и генерисања огромних количина података званих Биг Дата. Дакле, у овом чланку ћу расправљати о најневероватнијим пројектима машинског учења које свакако треба знати и радити са њима, следећим редоследом:

Шта је машинско учење?

Машинско учење је концепт који омогућава машини да учи на примерима и искуству, и то без изричитог програмирања. Дакле, уместо да пишете код, оно што радите је да податке шаљете генеричком алгоритму, а алгоритам / машина гради логику на основу датих података.





Ко је МЛ инжењер

Кораци машинског учења

Било који алгоритам машинског учења следи уобичајени образац или кораке.



Прикупљање података: Ова фаза укључује прикупљање свих релевантних података из различитих извора

Преуређивање података: То је поступак чишћења и претварања „сирових података“ у формат који омогућава погодну потрошњу

Анализирајте податке: Подаци се анализирају како би се одабрали и филтрирали подаци потребни за припрему модела



Возовски алгоритам: Алгоритам се обучава на скупу података за обуку, кроз који алгоритам разуме образац и правила која управљају подацима

Тест Модел: Скуп података за тестирање одређује тачност нашег модела.

Примена: Ако су брзина и тачност модела прихватљиви, тада би тај модел требало применити у стварном систему. Након примене модела на основу његових перформанси, модел се ажурира и побољшава ако дође до пада перформанси, модел се преквалификује.

Врсте машинског учења

Машинско учење је подкатегорисано у три врсте:

Надгледано учење: То је онај у којем имате улазне променљиве (к) и излазну променљиву (И) и користите алгоритам да бисте научили функцију мапирања од улаза до излаза.

Учење без надзора: Понекад су дати подаци неструктурирани и необележени. Тако постаје тешко класификовати те податке у различите категорије. Учење без надзора помаже у решавању овог проблема. Ово учење се користи за груписање улазних података у часове на основу њихових статистичких својстава.

Учење ојачања: Све је у предузимању одговарајућих радњи како би се максимизирала награда у одређеној ситуацији.
што се тиче учвршћивања учења, нема очекиваних резултата. Агент за појачање одлучује које ће радње предузети да би се извршио задати задатак. У недостатку скупа података о обуци, обавезно ће учити из свог искуства.

Погледајмо сада неколико пројеката машинског учења из стварног живота који могу помоћи компанијама да генеришу профит.

Случајеви употребе у индустрији

1. СТУДИО КРЕТАЊА

Домаин: Пола

Фокус: Оптимизирајте поступак одабира

пхп како исписати низ

Пословни изазов: Мотион Студио је највећа радио продукцијска кућа у Европи. Имајући приход већи од милијарду долара, компанија је одлучила да покрене нови ријалити шоу: РЈ Стар. Одговор на емисију је без преседана, а компанија је преплављена гласовним клиповима. Ви као стручњак за МЛ морате глас класификовати као мушки / женски како би први ниво филтрације био бржи.

Кључна питања: Узорак гласа је са нагласком.

Пословна корист: Од РЈ Стар је ријалити, време за одабир кандидата је врло кратко. Цео успех представе, а самим тим и зарада зависи од брзог и глатког извођења

импорт пандас ас пд импорт нумпи ас нп импорт матплотлиб.пиплот ас плт импорт сеаборн ас снс% матплотлиб инлине импорт упозорења о увозу варнингс.филтерварнингс ('игноре') дф = пд.реад_цсв ('воице-Цлассифицатион.цсв') дф.хеад ()

# Проверите бр. записа дф.инфо () дф.десцрибе () дф.иснулл (). сум ()

принт ('Облик података:', дф.схапе) принт ('Укупан број етикета: {}'. формат (дф.схапе [0])) принт ('Број мушких: {}'. формат (дф [ дф.лабел == 'мушки']. облик [0])) принт ('Број женских: {}'. формат (дф [дф.лабел == 'женски']. облик [0]))

Кс = дф.илоц [:,: -1] принт (дф.схапе) принт (Кс.схапе)

из склеарн.препроцессинг импорт ЛабелЕнцодер и = дф.илоц [:, - 1] гендер_енцодер = ЛабелЕнцодер () и = гендер_енцодер.фит_трансформ (и) и из склеарн.препроцессинг импорт СтандардСцалер скалер = СтандардСцалер () скалер.фит (Кс) Кс = сцалер.трансформ (Кс) из склеарн.модел_селецтион увоз траин_тест_сплит Кс_траин, Кс_тест, и_траин, и_тест = траин_тест_сплит (Кс, и, тест_сизе = 0.3, рандом_стате = 100) из склеарн.свм импорт СВЦ из склеарн импорт метрицс фром склеарн.метрицс , цонфусион_матрик свц_модел = СВЦ () свц_модел.фит (Кс_траин, и_траин) и_пред = свц_модел.предицт (Кс_тест) принт ('Оцена тачности:') принт (метрицс.аццураци_сцоре (и_тест, и_пред))

испис (цонфусион_матрик (и_тест, и_пред))

2. ЛИТИОН МОЋ

Домаин: Аутомотиве

Фокус: Подстакните возаче

Пословни изазов: Литхионповер је највећи добављач батерија за електрична возила (е-возила). Возачи батерију изнајмљују обично на дан, а затим је замењују напуњеном батеријом компаније. Литхионповер има модел променљиве цене заснован на историји вожње возача. Како животни век батерије зависи од фактора као што су прекорачење брзине, дневно пређена раздаљина итд. Ви као МЛ стручњак морате да направите модел кластера у коме се возачи могу групирати на основу података о вожњи.

Кључна питања: Возачи ће бити подстакнути на основу кластера, тако да груписање мора бити тачно.

Пословне предности: Повећање добити, до 15-20%, јер ће се возачима са лошом прошлошћу наплаћивати више.

импорт пандас ас пд импорт нумпи ас нп импорт матплотлиб.пиплот ас плт импорт сеаборн ас снс снс.сет () # фор стилинг плот% матплотлиб инлине импорт варнингс.филтерварнингс ('игноре') импорт матплотлиб.пиплот ас плт плт.рцПарамс [ 'фигуре.фигсизе'] = (12, 6) дф = пд.реад_цсв ('дривер-дата.цсв') дф.хеад ()

дф.инфо () дф.десцрибе ()

фром склеарн.цлустер импорт КМеанс # Узимање 2 кластера кмеанс = КМеанс (н_цлустерс = 2) дф_анализе = дф.дроп ('ид', акис = 1) кмеанс.фит (дф_анализе)

кмеанс.цлустер_центерс_

принт (кмеанс.лабелс_) принт (лен (кмеанс.лабелс_))

принт (типе (кмеанс.лабелс_)) јединствени, цоунтс = нп.уникуе (кмеанс.лабелс_, ретурн_цоунтс = Труе) принт (дицт (зип (јединствени, броји)))

дф_анализе ['цлустер'] = кмеанс.лабелс_ снс.сет_стиле ('вхитегрид') снс.лмплот ('меан_дист_даи', 'меан_овер_спеед_перц', дата = дф_анализе, хуе = 'цлустер', палетте = 'цоолварм', сизе = 6, аспект = 1, фит_рег = Нетачно)

# Сад, проверимо кластере, када је н = 4 кмеанс_4 = КМеанс (н_цлустерс = 4) кмеанс_4.фит (дф.дроп ('ид', акис = 1)) кмеанс_4.фит (дф.дроп ('ид', оса = 1)) принт (кмеанс_4.цлустер_центерс_) јединствени, цоунтс = нп.уникуе (кмеанс_4.лабелс_, ретурн_цоунтс = Труе) кмеанс_4.цлустер_центерс_ принт (дицт (зип (јединствени, броји)))

дф_анализе ['цлустер'] = кмеанс_4.лабелс_ снс.сет_стиле ('вхитегрид') снс.лмплот ('меан_дист_даи', 'меан_овер_спеед_перц', дата = дф_анализе, хуе = 'цлустер', палетте = 'цоолварм', сизе = 6, аспект = 1, фит_рег = Нетачно)

3. БлуЕк

Домаин: Логистика

Фокус: Оптимална путања

мерге сорт ц ++ алгоритам

Пословни изазов: БлуЕк је водећа логистичка компанија у Индији. Познат је по ефикасној испоруци пакета купцима. Међутим, БлуЕк се суочава са изазовом када његови возачи комбија иду неоптималним путем за испоруку. То узрокује кашњења и веће трошкове горива. Ви као стручњак за МЛ морате да креирате модел МЛ користећи Реинфорцемент Леарнинг тако да се кроз програм пронађе ефикасан пут.

Кључна питања: Подаци имају пуно атрибута и класификација може бити незгодна.

Пословне предности: Ако се крене оптималним путем, може се уштедети до 15% трошкова горива.

импорт нумпи као нп импорт пилаб као плт импорт нетворкк као нк # Иницијализација тачака поинтс_лист = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] гоал = 7 пресликавање = {0: 'Старт', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-одредиште '} Г = нк.Грапх () Г.адд_едгес_фром (поинтс_лист) пос = нк.спринг_лаиоут (Г, к = .5, центер = поинтс_лист [2]) нк .драв_нетворкк_нодес (Г, поз, ноде_цолор = 'г') нк.драв_нетворкк_едгес (Г, пос, едге_цолор = 'б') нк.драв_нетворкк_лабелс (Г, пос) плт.схов ()

НО_ОФ_ПОИНТС = 8 # Инититирање Р матрице Р = нп.матрик (нп.онес (схапе = (НО_ОФ_ПОИНТС, НО_ОФ_ПОИНТС))) Р * = -1 за тачку у поинтс_лист: принт (поинт) иф поинт [1] == гоал: Р [тачка] = 150 остало: Р [тачка] = 0 ако је тачка [0] == циљ: Р [тачка [:: - 1]] = 150 остало: # реверс тачке Р [тачка [:: - 1]] = 0

Р [циљ, циљ] = 150 Р.

К = нп.матрик (нп.зерос ([НО_ОФ_ПОИНТС, НО_ОФ_ПОИНТС])) # Параметар за учење гама = 0,8 Инитиал_стате = 1 деф аваилабле_ацтион (стате): цуррент_стате_ров = Р [стате,] ав_ацт = нп.вхере (цуррент_стате_ров & ампампампгт = 0 ) [1] ретурн ав_ацт аваилабле_ацт = расположиве_акције (почетно_стање) деф сампле_нект_ацтион (аваилабле_ацтионс_ранге): нект_ацтион = инт (нп.рандом.цхоице (аваилабле_ацт, 1)) ретурн нект_ацтион ацтион = сампле_нект_ацтион (аваилабле_ацт) деф упдате (цуррент_стате, ацтион, гамма) : мак_индек = нп.вхере (К [акција,] == нп.мак (К [акција,])) [1] ако је мак_индек.схапе [0] & ампампампгт 1: мак_индек = инт (нп.рандом.цхоице (мак_индек, сизе = 1)) елсе: мак_индек = инт (мак_индек) мак_валуе = К [ацтион, мак_индек] К [цуррент_стате, ацтион] = Р [цуррент_стате, ацтион] + гама * мак_валуе принт ('мак_валуе', Р [цуррент_стате, ацтион] + гама * мак_валуе) иф (нп.мак (К) & ампампампгт 0): ретурн (нп.сум (К / нп.мак (К) * 100)) елсе: ретурн (0) упдате (почетно_стање, акција, гама)

сцорес = [] фор и ин ранге (700): цуррент_стате = нп.рандом.рандинт (0, инт (К.схапе [0])) аваилабле_ацт = аваилабле_ацтион (цуррент_стате) ацтион = сампле_нект_ацтион (аваилабле_ацт) сцоре = упдате (цуррент_стате, акција, гама) сцорес.аппенд (сцоре) принт ('Сцоре:', стр (сцоре)) принт ('Обучена К матрица:') принт (К / нп.мак (К) * 100) # Тестирање цуррент_стате = 0 корака = [цуррент_стате] вхиле цуррент_стате! = 7: нект_степ_индек = нп.вхере (К [цуррент_стате,] == нп.мак (К [цуррент_стате,])) [1] иф нект_степ_индек.схапе [0] & ампампампгт 1: нект_степ_индек = инт (нп.рандом.цхоице (нект_степ_индек, сизе = 1)) елсе: нект_степ_индек = инт (нект_степ_индек) степс.аппенд (нект_степ_индек) цуррент_стате = нект_степ_индек

принт ('Најефикаснији пут:') принт (кораци) плт.плот (резултати) плт.схов ()

Пројекти машинског учења отвореног кода у 2019

Детецтрон : Детецтрон је софтверски систем Фацебоок АИ Ресеарцх који примењује најсавременије алгоритме за откривање објеката. Написан је на Питхону, а покреће га Цаффе2 оквир за дубоко учење.

Циљ Детецтрона је да обезбеди висококвалитетну базу кодова високих перформанси за истраживање детекције објеката. Дизајниран је тако да буде флексибилан како би подржао брзу примену и евалуацију нових истраживања. Садржи више од 50 унапред обучених модела.

Денспосе : Процена густе људске позе има за циљ мапирање свих људских пиксела РГБ слике на 3Д површину људског тела. ДенсеПосе-РЦНН је примењен у оквиру Детецтрон-а.

ТенсорФлов.јс : То је библиотека за развој и обуку МЛ модела и њихово постављање у прегледач. Постало је веома популарно издање откако је изашло почетком ове године и наставља да задивљује својом флексибилношћу. Са овим можете

  • Развијте МЛ у прегледачу: Користите флексибилне и интуитивне АПИ-је за израду модела од нуле користећи ЈаваСцрипт библиотеку линеарне алгебре ниског нивоа или АПИ-је слојева високог нивоа.
  • Покрените постојеће моделе : Користите претвараче модела ТенсорФлов.јс за покретање већ постојећих модела ТенсорФлов директно у прегледачу.
  • Поновно оспособљавање постојећих модела: Поновно обучите постојеће моделе МЛ помоћу података сензора повезаних са прегледачем или других података на страни клијента.

Вавеглов: Машинско учење такође значајно напредује у обради звука и није само стварање музике или класификације. ВавеГлов је генеративна мрежа заснована на протоку за синтезу говора компаније НВИДИА. Истраживачи су такође навели кораке које можете следити ако желите да истренирате сопствени модел од нуле.

Имаге Оутпаинтинг : Замислите да имате половичну слику сцене и желели сте целу сценографију, па то је оно што слика за наношење слика може учинити за вас. Овај пројекат је Керасова примена Станфордовог папира за надгледање слике. Модел је обучен са 3500 података о плажама са аргументацијом од укупно до 10500 слике за 25 епоха .

Ово је невероватан рад са детаљним објашњењем корак по корак. Обавезан пример за све љубитеље машинског учења. Лично, ово је мој омиљени пројекат машинског учења.

Дубоко сликарско усклађивање : Па, кад смо код слика, овај је ремек-дело. Оно што овај алгоритам ради је да слика узима као улаз, а ако јој додате спољни елемент, он тај елемент меша у околину као да је њен део.

Можете ли рећи разлику? Нема право? Па, ово нам показује докле смо стигли у погледу машинског учења.

ДеепМимиц: Сада, пажљиво погледајте слике овде, видите фигуру штапа која ради спин-кицк, бацкфлип и точак. Да је мој пријатељ појачање учење на делу. ДеепМимиц је пример вођеног дубоког појачавања учења карактерних вештина заснованих на физици.

Магента : Магента је истраживачки пројекат који истражује улогу машинског учења у процесу стварања уметности и музике. Ово првенствено укључује развој нових алгоритама за дубинско учење и учвршћивање за генерисање песама, слика, цртежа и других материјала.

То је такође истраживање у изградњи паметних алата и интерфејса који омогућавају уметницима и музичарима да се прошире ( не заменити! ) њихови процеси који користе ове моделе. Идите раширити крила, створите свој јединствени садржај за Инстаграм или Соундцлоуд и постаните инфлуенцер.

Дакле, момци, овим смо дошли до краја овог невероватног чланка о пројектима машинског учења. Испробајте ове примере и јавите нам у одељку за коментаре испод. Надам се да сте упознали практичну примену машинског учења у индустрији. Едурека чини вас вештим у техникама попут надзора под надзором, учења без надзора и обраде природног језика. Обухвата обуку о најновијим достигнућима и техничким приступима у вештачкој интелигенцији и машинском учењу као што су дубоко учење, графички модели и учење ојачања