САС програмирање - научите како кодирати у САС-у!



Овај блог о САС програмирању упознаје вас са концептима програмирања САС и помаже вам да детаљно разумете различите основе САС-а са примерима.

На овом блогу упознаћу вас са неким важним концептима САС програмирања. Пре него што започнемо, важно је да се упознате са САС-ом. Мој претходни блог на Водич за САС помоћи ће вам да разумете САС, његове апликације и помоћи ће вам да инсталирате САС Университи Едитион, које бисмо овде користили као програмско окружење. Питате се које су вештине које бисте требали савладати ове године? Такође, ако планирате да закорачите у Аналитику података, је један од најбољих начина да започнете са истим.

Изашао је Едурека 2019 Тецх Царе Гуиде! Најпопуларније улоге у послу, прецизни путеви учења, перспективе индустрије и још много тога у водичу. Преузимање Сада.





Дакле, без даљегкашњење,почнимо са САС програмирањем, зар не?

Овај блог ће вам помоћи да разумете следеће теме:



Пре него што започнемо са кодирањем, желео бих да вас упознам са неколико важних термина који су важни за САС програмирање.

Основе програмирања САС

САС Виндовс

Велике организације и институти за обуку радије користе САС Виндовс. САС Виндовс има пуно услужних програма који помажу у смањењу времена потребног за писање кодова.

Следећа слика приказује различите делове система САС Виндовс.



САС-Виндовс - САС програмирање - Едурека

  • Прозор дневника : То је прозор за извршење. Овде можете проверити извршење вашег програма. Такође приказује грешке, упозорења и напомене.
  • Прозор кода :Овај прозор је познат и као прозор за уређивање. Сматрајте то празним папиром или бележницом, где можете да напишете САС код.
  • Излазни прозор : Као што само име говори, овај прозор приказује излаз програма / кода који сте написали у едитору.
  • Прозор резултата : То је индекс који наводи све излазе програма који се покрећу у једној сесији. Будући да садржи резултате одређене сесије, ако затворите софтвер и поново га покренете, прозор с резултатима ће бити празан.
  • Истражите прозор : Садржи листу свих библиотека у систему. Овде такође можете да прегледате датотеке подржане системом.

Неколико организација користи Линук, међутим, без графичког корисничког интерфејса, морате писати код за сваки упит. Отуда је незгодно за употребу.

САС скупови података

САС скупови података називају се датотекама података. Датотеке података чине редове и колоне. Редови садрже запажања, а колонеИмена променљивих.

САС променљиве

САС има две врсте променљивих:

  • Нумеричке променљиве : Ово је подразумевани тип променљиве. Ове променљиве се користе у математичким изразима.
  • Карактерне променљиве :Карактерне променљиве се користе за вредности које се не користе у математичким изразима.
    Они се третирају као текст или низови. Променљива постаје променљива карактера додавањем а„$“запалитина крају имена променљиве.

САС библиотеке

САС библиотека је колекција САС датотека које се чувају у истој фасцикли или директоријуму на рачунару.

  • Привремена библиотека : У овој библиотеци се скуп података брише када се заврши САС сесија.
  • Стална библиотека : Скупови података се трајно чувају. Стога су доступни током сесија.

Корисници такође могу створити или дефинисати нову библиотеку познату као кориснички дефинисане библиотеке помоћу кључне речи ЛИБНАМЕ . То су такође сталне библиотеке.

САС програмирање: Структура САС кода

САС програмирање засновано је на два градивна блока:

  • ПОДАЦИ Корак : ДАТА корак ствара САС скуп података, а затим их прослеђује у ПРОЦ корак
  • ПРОЦ Корак : ПРОЦ корак обрађује податке

САС програм треба да следи доле наведена правила:

ц ++ како сортирати низ
  • Готово сваки код започиње или ДАТА или ПРОЦ кораком
  • Свака линија САС кода завршава се тачком и зарезом
  • САС код завршава се кључном речи РУН или КУИТ
  • САС кодови не разликују велика и мала слова
  • Можете написати код у различите редове или можете написати више изјава у један ред

Сад кад смо видели неколико основних терминологија, кренимо са САС програмирањем са овим основним кодом:

ДАТА Улаз за запослене_Инфо Емп_ИД Емп_Наме $ Емп_Вертицал $ даталинес 101 Мак СКЛ 102 Рама САС 103 Прииа Јава 104 Картхик Екцел 105 Мандееп САС Рун

У горе наведеном коду креирали смо скуп података који се назива Емплоиее_Инфо. Има три променљиве, једну нумеричку променљиву као Емп_Ид и две променљиве знакова као Емп_Наме и Емп_Вертицалс. Команда Покрени приказује скуп података у излазном прозору.

Слика испод приказује излаз горе поменутог кода.

Претпоставимо да желите да видите резултат у приказу штампе, па то можете да урадите помоћу поступка ПРОЦ ПРИНТ, остатак кода остаје исти.

ПОДАЦИ Запослени_Инфо унос Емп_ИД Емп_Наме $ Емп_Вертицал $ даталинес 101 Мак СКЛ 102 Рама САС 103 Прииа Јава 104 Картхик Екцел 105 Мандееп САС Рун ПРОЦ ПРИНТ ДАТА = Емплоиее_Инфо Рун

Слика испод приказује излаз горњег кода.

Управо смо креирали скуп података и разумели како функционише поступак ПРИНТ. Узмимо сада горњи скуп података и искористимо га за даље програмирање. Рецимо да желимо да додамо датум придруживања запосленика скупу података. Дакле, креирамо променљиву која се назива ДОЈ, дајемо је као улаз и исписујемо резултат.

ПОДАЦИ Запослени_Инфо унос Емп_ИД Емп_Наме $ Емп_Вертицал $ ДОЈ подаци 101 Мак СКЛ 18/08/2013 102 Рама САС 25/06/2015 103 Прииа Јава 21/02/2010 104 Картхик Екцел 19/05/2007 105 Мандееп САС 11/09/2016 Покрени ПРОЦ ПРИНТ ДАТА = Покрени Емплоиее_Инфо

Слика испод приказује излаз горњег кода. Видљиво је да је променљива креирана, али вредност ДОЈ није одштампана. Уместо тога, видимо да су тачке замениле вредности датума.


Зашто се ово догодило? Па, ДОЈ променљива је без суфикса „$“, што значи да ће је САС подразумевано читати као нумеричку променљиву. Али, подаци које смо унели имају посебан знак ‘/’, па стога не исписују резултат јер нису чисто нумерички подаци. Ако проверите прозор дневника, видећете поруку о грешци као „неважећи подаци за променљиву ДОЈ“

Како да решимо овај проблем? Па, један од начина да се то реши је коришћење суфикса „$“ за ДОЈ променљиву. Ово ће претворити ДОЈ променљиву у карактер и моћи ћете да штампате вредности датума. Допустите нам да извршимо промене кода и да видимо излаз.

ПОДАЦИ Запослени_Инфо улаз Емп_ИД Емп_Наме $ Емп_Вертицал $ ДОЈ $ даталинес 101 Мак СКЛ 18/08/2013 102 Рама САС 25/06/2015 103 Прииа Јава 21/02/2010 104 Картхик Екцел 19/05/2007 105 Мандееп САС 11/09 / 2016. Покрени ПРОЦ ПРИНТ ДАТА = Покрени запослени_Инфо

На излазном екрану приказат ће се сљедећи излаз.


Можете видети да се вредности података приказују као датуми претварањем ДОЈ у карактер. Међутим, ово је привремено решење. Да објасним како?

Па, замислите да банка има сличан скуп података. Скуп података садржи детаље о власнику рачуна као што су износ зајма, рате,ирок доспећа рате кредита. Замислите, ималац је пропустио рок за плаћање рате и банка жели да израчуна кашњење. Банка ће морати да израчуна разлику између датума рока и тренутног датума.

Али, ако скуп података банке садржи датуме у формату знакова, тада банка неће моћи да извршава математичке операције на њему. Овај проблем може утицати и на наш скуп података. Па како да решимо овај проблем?

Следећи концепт ће вам помоћи да превазиђете ово питање.

Неформати и формати у САС-у

Важно је да добро разумете ову тему ако желите да будете добри у програмирању САС-а.Ако се сећате, раније сам споменуо да САС има два стандардна типа променљивих:

  • Нумерички
  • Карактер

Када САС наиђе на нестандардне променљиве, САС ће избацити грешку или нећете добити жељени излаз. Да би превазишао овај проблем, користи САСИнформисании формати.

Сазнајте више

Неформати се обично користе за читање или унос података из спољних датотека или равних датотека (попуттекстуалне датотеке или секвенцијалне датотеке). Информат упућује САС како да читаподаци у САС променљиве. САС има три врсте информација:знак, број и датум / време. Неформати се именују према следећемструктура синтаксе:

  • Информат карактера: $ ИНФОРМАТв.
  • Нумерички обавештени: ИНФОРМАТв.д
  • Датум / време информисања: ИНФОРМАТв.

Ознака „$“ означава информативни знак. ИНФОРМАТ се односи на понекад необавезнаНазив САС информата. Ознака ‘в’ означава ширину (бајтова или број колона)променљива. Ознака „д“ се користи за нумеричке податке за одређивање броја цифара десно оддецимално место. Сви неформатори морају садржати децималну тачку (.) Како би САС могао
разликовати информацију од САС променљиве.

Вратимо се нашем претходном коду и видимо да ли нам информације о датуму / времену помажу. Дакле, променимо код у складу с тим и додајте му информацију о датуму на следећи начин:

ПОДАЦИ Запослени_Инфо унос Емп_ИД Емп_Наме $ Емп_Вертицал $ ДОЈ ИНФОРМАТ ДОЈ ддммии10. даталинес 101 Мак СКЛ 18/08/2013 102 Рама САС 25/06/2015 103 Прииа Јава 21/02/2010 104 Картхик Екцел 19/05/2007 105 Мандееп САС 11/09/2016 Рун ПРОЦ ПРИНТ ДАТА = Емплоиее_Инфо Рун

Ред број 3 у коду упућује САС да прочита променљиву „датум придруживања“ (ДОЈ) користећи датум
информат ММДДИИв. За свако поље са датумом заузима 10 простора, квалификатор „в.“ Јепостављено на 10.

Излаз кода би изгледао на следећи начин.

Резултат показује да још увек немамо жељени резултат, већ ДОЈ колона садржи неке нумеричке вредности, а не датуме које смо навели. Зашто је то? Па, када се датум прочита са информацијом о датуму, САС га чува као број. То значи да се чита као број дана између датума и 1. јануара 1960. (На пример: 15.3.1994. Чува се као 12492).

Разлог томе је што САС има три одвојена бројача који прате датуме и време. Ови бројачи датума почели су на нули 1. јануара 1960. Стога датуми пре 1/1/1960 имају негативне вредности, а сваки датум после има позитивну вредност. Сваког дана у поноћ бројач датума увећава се за један.

Једна прича каже да су оснивачи САС-а желели да користе приближни датум рођења система ИБМ 370 и изабрали су 1. јануар 1960. године као лако упамтивну апроксимацију.

Сада када знате разлог зашто је колона ДОЈ приказала те бројеве, покушајмо да решимо овај проблем. Да бисмо превазишли овај проблем користимо формат.

Формат

Неформати су упутства за читање података, док су формати упутства која се користе за приказ илиизлазни подаци.Дефинисање формата за променљиву је начин на који кажете САС-у да прикаже вредности у променљивој. Формати су груписани у исте три класе као и неформатори (знакови, бројеви и датум-време) и такође увек садрже тачку.

Општи облик изјаве о формату је:

  • ФОРМАТ име променљиве ФОРМАТ-НАМЕ.

Вратимо се нашем коду који има скуп података Емплоиее_Инфо да бисмо видели да ли можемо правилно приказати датум помоћу наредбе ФОРМАТ.

ПОДАЦИ Запослени_Инфо унос Емп_ИД Емп_Наме $ Емп_Вертицал $ ДОЈ ИНФОРМАТ ДОЈ ддммии10. ФОРМАТ ДОЈ ддммии10. даталинес 101 Мак СКЛ 18/08/2013 102 Рама САС 25/06/2015 103 Прииа Јава 21/02/2010 104 Картхик Екцел 19/05/2007 105 Мандееп САС 11/09/2016 Рун ПРОЦ ПРИНТ ДАТА = Емплоиее_Инфо Рун

Користили смо наредбу ФОРМАТ у реду број 4 у горњем коду. Следећи излазни екран ће нам дати жељени излаз.

Успешно смо приказали скуп података помоћу наредбе Формат датума. Надам се да сте разумели како се користе формат и информат.Кренимо даље са нашим блогом за програмирање САС и погледајмо још један важан концепт.

САС Лоопс

Док радимо САС програмирање, можемо се сусрести са ситуацијама у којима више пута морамо да извршимо аблок кода неколико пута. Незгодно је понављати исти низ изјава изнова и изнова. Овде се петље појављују у слици. У САС-у се наредба До користи за примену петљи. Такође је познат као До Лооп. Слика испод приказујеопшти облик наредби петље До у САС-у.

Следе типови ДО петљи у САС-у:

  • Индекс : Петља се наставља од почетне вредности до зауставне вредности променљиве индекса.
  • Док : Петља се наставља све док и Док стање постаје нетачно.
  • Све док : Петља се наставља до Све док услов постаје Истина.

Направите индексну петљу

Користимо индексну променљиву као почетну и зауставну вредност за Направите индексну петљу . САС изрази се извршавају више пута док променљива индекса не достигне коначну вредност.
Синтакса:

Урадите индеквариабле = почетну вредност до коначну вредност САС изјаве Крај

Погледајмо узорак кода да бисмо разумели До Индек Лооп. У доњем коду, ВАР је индексна променљива.

ПОДАЦИ СамплеЛооп СУМ = 0 Да ли ВАР = 1 до 10 СУМ = СУМ + ВАР ЕНД ПРОЦ ПРИНТ ДАТА = СамплеЛооп Рун

Када извршите горњи код, добићете следећи излаз.

како се користи цхарат у јави

До Вхиле Лооп

Тхе До Вхиле петља користи ВХИЛЕ услов. Ова петља извршава блок кода када је услов тачан и наставља га извршавати све док услов не постане лажан. Једном када услов постане нетачан, петља се прекида.

Синтакса:

Да ли док (услов) САС изјаве Крај

Следећи узорак кода ће вам помоћи да разумете петљу ДО ВХИЛЕ.

ПОДАЦИ СамплеЛооп СУМ = 0 ВАР = 1 Урадити док (ВАР<15) SUM = SUM + VAR VAR+1 END PROC PRINT DATA = SampleLoop Run 

Горњи код ће вам дати следећи излаз.

До До Лооп

Петља До До користи Све док цондитион.Тхис Лооп извршава блок кода када је услов фалсе и наставља га извршавати све док услов не постане тачан. Једном када услов постане тачан, петља се прекида.

Синтакса:

Урадити до (услов) САС изјаве ЕНД

Погледајмо пример програма.

ПОДАЦИ СамплеЛооп СУМ = 0 ВАР = 1 До (ВАР> 15) СУМ = СУМ + ВАР ВАР + 1 КРАЈ ПРОЦ.

Код има следећи излаз.

Тако смо завршили концепт петљи у САС програмирању. Све теме које смо до сада проучавали говориле су о основама САС програмирања уопште.

Сада ћемо погледати неке статистичке поступке. Ови поступци чиниће основу за напредне аналитички поступци.

Претплатите се на наш иоутубе канал да бисте добијали нова ажурирања ..!

Основни статистички поступци који користе САС

ПРОЦ СРЕДСТВА

Овај поступак се користи за израчунавање аритметичке средине и стандардне девијације. Људима који су нови у статистици може бити тешко да разумеју ове појмове. Дакле, пре него што започнемо са кодирањем и употребом ове процедуре. Покушаћу да објасним шта ови појмови значе.

Почнимо са аритметичком средином и погледајте како се ПРОЦ МЕАНС користи у САС програмирању за његово израчунавање.

Аритметичко значење

Збир вредности нумеричких променљивих подељен бројем променљивих даје вам аритметичко значење . Такође је познат као средња вредност и мерило је централне тенденције. Мера централне тенденције је једна вредност која покушава да опише скуп података идентификовањем централне позиције унутар тог скупа података.

У САС програмирању за израчунавање аритметичке средине користите ПРОЦ МЕАНС. Овај поступак вам омогућава да пронађете средњу вредност свих променљивих или неколико променљивих у скупу података. Такође можете формирати групе и израчунати средину променљивих специфичних за ту групу.

Синтакса:

ПРОЦ ЗНАЧИ ПОДАТКЕ = ДАТАСЕТ Варијабле класе Вар променљиве
  • Променљиве : Варијабле у горњој синтакси означавају променљиве из скупа података чија се средња вредност израчунава.

Просек скупа података

ако тидоставите само име скупа података без икаквих променљивих, можете израчунати средину свих променљивих у скупу података.

Погледајмо пример кода. Размотрио сам унапред дефинисани САС скуп података који се назива „аутомобили“. Следећа команда ће приказати скуп података.

ПРОЦ ПРИНТ подаци = сасхелп.ЦАРС Покрени

Слика испод приказује излаз горњег кода.


Сада ћемо користити овај код скупа података и израчунати средину сваке променљиве у скупу података'аутомобили'.

ПРОЦ ЗНАЧИ ПОДАТКЕ = сасхелп.ЦАРС Средња СУМ МАКСДЕЦ = 2 Трчање

Слика испод приказује средњу вредност свих променљивих у скупу података до две децимале.

Средње вредности изабраних променљивих

Давањем имена у опцији Вар можете добити средњу вредност наведених променљивих. Молимо погледајте доњи код.

ПРОЦ ЗНАЧИ ПОДАТКЕ = сасхелп.ЦАРС значи СУМ МАКСДЕЦ = 2 вар коњске снаге цилиндра

Меан Би Цласс

Средње вредности нумеричких променљивих можете пронаћи тако што ћете их организовати у групе помоћунеки параметар за груписање.Размотрите следећи узорак кода. Хајде да сазнамо средњу коњску снагу за различите групе категорисане по класама „израда“ и „тип“ различитих аутомобила.

ПРОЦ ЗНАЧИ ПОДАТКЕ = сасхелп.ЦАРС ЗНАЧИ СУМ МАКСДЕЦ = 2 класа маке типе вар хорсеповер Рун

Слика испод приказује излаз горњег кода.

Наставимо са нашим блогом САС програмирања и погледајмо још један важан статистички концепт.

Стандардна девијација

Стандардна девијација (СД) је мера колико су различити подаци у датом скупу података. Математички, говори вам колико је близу свака тачка података средњој вредности скупа података. Ако је вредност стандардне девијације близу 0, то значи да су тачке података врло близу средње вредности скупа података, а висока стандардна девијација указује на то да су тачке података распоређене у широком опсегу вредности.

У САС-у можете израчунати вредност стандардне девијације помоћу два поступка. Су:

  • ПРОЦ СРЕДСТВА
  • ИСТРАЖИВАЊА

Стандардна девијација помоћу ПРОЦ СРЕДСТАВА

Стандардно одступање можете измерити помоћу средстава проц, морате да изаберете САТИ опција у кораку ПРОЦ. Приказаће вредности стандардног одступања за сваку нумеричку променљиву у скупу података.

Синтакса:

ПРОЦ ЗНАЧИ ПОДАТКЕ = скуп података СТД

Размотрите овај узорак кода, креирајмо још један скуп података ЦАРС1 из скупа података ЦАРС у библиотеци САСХЕЛП. Да бисмо то урадили, препустили смо се процедури ПРОЦ СКЛ. Групирајмо податке помоћу „типа“ и „марке“ аутомобила и израчунајмо стандардну девијацију за изабране променљиве помоћу опције СТД са кораком ПРОЦ средства.

ПРОЦ СКЛ креира табелу ЦАРС1 као СЕЛЕЦТ марка, тип, коњска снага, цилиндри, тежина ОД САСХЕЛП.ЦАРС ВХЕРЕ маке ин ('Ауди', 'БМВ') ПОКРЕНИ ПРОЦ.

Горњи код ће дати стандардну девијацију за изабране променљиве. Следећа слика приказује излаз.

ПРОЦЕТНА ИСТРАЖИВАЊА

Овај поступак се користи за мерење стандардне девијације заједно са неким унапред карактеристикама попут мерења стандардне девијације за категоричке променљиве и варијансу.

Синтакса:

ПРОЦ СУРВЕИМЕАНС опције статистика-кључне речи По променљивим Варијабле класе Вар променљиве

Следи опис коришћених параметара:

  • Од стране користи се за означавање променљивих које се користе за стварање група посматрања.
  • Класа означава променљиве коришћене за категоричке променљиве.
  • Где означава променљиве за које ће се израчунати СД.

Погледајмо овај узорак кода који описује употребу параметра класе, који креира статистику за сваку од вредности у променљивој класе.

ПРОЦ ПРЕГЛЕДНИ ПОДАЦИ = ЦАРС1 СТД Тип класе Вар тип коњске снаге одс излазне статистике = правоугаоник Покрени ПРОЦ ПРИНТ ДАТА = правоугаоник Покрени

Слике испод приказују излаз горњег кода. Приказује дистрибуцију података за променљиву „Коњску снагу“ за интервал поверења од 95%. (Интервал поузданости означава опсег вредности тако дефинисан да постоји наведена вероватноћа да вредност параметра лежи у њему.)

Дакле, то нас доводи до краја САС блога за програмирање. У случају било какве сумње или проблема у вези са садржајем блога, оставите их у одељку за коментаре, најпре ћу их решити и одговорити вам.

Ако желите да научите САС и изградите каријеру у домену аналитике, погледајте наш који долази са обуком уживо коју воде инструктори и искуством у стварном животу. Овај тренинг ће вам помоћи да дубље разумете САС и да савладате различите концепте програмског језика САС.

Имате питање за нас? Молимо вас да то споменете у одељку за коментаре и јавићемо вам се.