R er et af de mest populære analyseværktøjer. Men bortset fra at blive brugt til analyse, er R også et programmeringssprog.Med sin vækst i IT-branchen er der en blomstrende efterspørgsel efter kvalificerede eller med en forståelse af R som begge, et dataanalyseværktøj og et programmeringssprog.I denne blog hjælper jeg dig med at forstå de forskellige grundlæggende aspekter af R-programmering. I vores s urolig Blog ,vi har diskuteret Hvorfor har vi brug for Analytics, hvad er Business Analytics, hvorfor og hvem bruger R.
I denne blog vil vi forstå nedenstående kernebegreber i R-programmering i følgende rækkefølge:
Du kan muligvis gennemgå webinaroptagelsen af R Programming Language, hvor vores instruktør har forklaret emnerne detaljeret med eksempler, der hjælper dig med at forstå R-programmering bedre.
R-programmering til begyndere | R Vejledning i programmeringssprog | Edureka
Så lad os gå videre og se på det første koncept med R-programmering - variabler.
R Programmering: Variabler
Variabler er intet andet end et navn til en hukommelsesplacering, der indeholder en værdi. En variabel i R kan gemme numeriske værdier, komplekse værdier, ord, matricer og endda en tabel. Overraskende, ikke?
Fig: Skabelseaf variabler
Ovenstående billede viser os, hvordan variabler oprettes, og hvordan de lagres i forskellige hukommelsesblokke. I R behøver vi ikke deklarere en variabel, før vi bruger den, i modsætning til andre programmeringssprog som Java, C, C ++ osv.
Lad os gå videre og prøve at forstå, hvad der er en datatype og de forskellige datatyper, der understøttes i R.
R Programmering: Datatyper
I R erklæres en variabel i sig selv ikke for nogen datatype, men den får datatypen for det R-objekt, der er tildelt den. Så R kaldes et dynamisk skrevet sprog, hvilket betyder, at vi kan ændre en datatype af den samme variabel igen og igen, når vi bruger den i et program.
Datatyper specificerer hvilken type værdi en variabel har, og hvilken type matematiske, relationelle eller logiske operationer, der kan anvendes på den uden at forårsage en fejl. Der er mange datatyper i R, men nedenfor er de mest anvendte:
Lad os nu diskutere hver af disse datatyper individuelt med udgangspunkt i vektorer.
Vektorer
Vektorer er de mest basale R-dataobjekter, og der er seks typer atomvektorer. Nedenfor er de seks atomvektorer:
Logisk : Det bruges til at gemme logisk værdi som SAND eller FALSK .
Numerisk : Det bruges til at gemme både positive og negative tal inklusive reelle tal.
F.eks .: 25, 7,1145, 96547
Heltal : Den indeholder alle heltalets værdier, dvs. alle de positive og negative heltal.
F.eks .: 45.479, -856.479, 0
Kompleks : Disse har formen x + yi, hvor x og y er numeriske, og i repræsenterer kvadratroden på -1.
F.eks .: 4 + 3i
Karakter : Det bruges til at gemme enten et enkelt tegn, en gruppe af tegn (ord) eller en gruppe af ord sammen. Tegnene kan defineres i enten enkelt anførselstegn eller dobbelt anførselstegn.
F.eks .: 'Edureka', 'R er sjovt at lære'.
Generelt defineres og initialiseres en vektor på følgende måde:
Vtr = c (2, 5, 11, 24) Eller Vtr<- c(2, 5, 11 , 24)
Lad os gå videre og forstå andre datatyper i R.
Liste
Lister ligner ret vektorer, men lister er R-objekter, der kan indeholde elementer af forskellige typer som & minus tal, strenge, vektorer og en anden liste inde i den.
For eksempel:
brug python i visual studio
Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist
Produktion:
[[1]] [1] 'Hej' 'Hej' 'Hvordan laver du '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] SAND
Matrix
Matrix er R-objektet, hvor elementerne er arrangeret i et todimensionalt rektangulært layout.
Den grundlæggende syntaks til oprettelse af en matrix i R er & minus
matrix (data, nrow, ncol, byrow, dimnames)
Hvor:
- data er inputvektoren, der bliver matrixens dataelementer.
- nu er antallet af rækker, der skal oprettes.
- ncol er antallet af kolonner, der skal oprettes.
- byrå er en logisk anelse. Hvis SAND, er inputvektorelementerne arrangeret efter række.
- dimname er de navne, der er tildelt rækkerne og kolonnerne.
Eksempel:
Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix
Produktion:
[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25
ARRAY
Arrays i R er dataobjekter, som kan bruges til at gemme data i mere end to dimensioner. Det tager vektorer som input og bruger værdierne i ingen parameter for at oprette en matrix.
Den grundlæggende syntaks til oprettelse af en matrix i R er & minus
array (data, dim, dimnames)
Hvor:
- data er inputvektoren, der bliver matrixens dataelementer.
- ingen er matrixens dimension, hvor du passerer antallet af rækker, kolonne og antallet af matricer, der skal oprettes af de nævnte dimensioner.
- dimname er de navne, der er tildelt rækkerne og kolonnerne.
Eksempel:
Myarray<- array( c(1:16), dim=(4,4,2)) Myarray
Produktion:
, , en [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16
Dataramme
En dataramme er en tabel eller en todimensionel matrixlignende struktur, hvor hver kolonne indeholder værdier på en variabel, og hver række indeholder et sæt værdiertilhver kolonne. Nedenfor er nogle af kendetegnene ved en dataramme, der skal overvejes, hver gang vi arbejder med dem:
- Kolonnenavnene skal være ikke-tomme.
- Hver kolonne skal indeholde den samme mængde dataelementer.
- Dataene, der er gemt i en dataramme, kan være af numerisk, faktor- eller karaktertype.
- Rækkens navne skal være unikke.
Eksempel:
emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' FoU ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data
Produktion:
emp_id emp_name dept 1100 John Salg 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D
Så nu hvor vi har forstået de grundlæggende datatyper for R, er det på tide, at vi dyber dybt ned i R ved at forstå begreberne for dataoperatører.
R Programmering: Dataoperatører
Der er hovedsagelig 4 dataoperatører i R, de er som vist nedenfor:
Aritmetiske operatører : Disse operatorer hjælper os med at udføre de grundlæggende aritmetiske operationer som addition, subtraktion, multiplikation osv.
Overvej følgende eksempel:
num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraktion num3 = num1 - num2 num3 #multiplikation num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modul num3 = num1 %% num2 num3 #eksponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # gulvopdeling num3 = num1% /% num2 num3
Produktion:
[1] 35 [femten [1] 300 [1] 0,75 [1] 15 [1] 125 [elleve
Relationelle operatører : Disse operatører hjælper os med at udføre de relationelle operationer som at kontrollere, om en variabel er større end, mindre end eller lig med en anden variabel. Outputtet fra en relationel operation er altid en logisk værdi.
Overvej følgende eksempler:
num1 = 15 num2 = 20 # er lig med num3 = (num1 == num2) num3 # ikke lig med num3 = (num1! = num2) num3 # mindre end num3 = (num1 num2) num3 # mindre end lig med num1 = 5 num2 = 20 num3 = (num1 = num2) num3
Produktion:
[1] FALSK [1] SAND [1] SAND [1] FALSK [1] SAND [1] FALSK
Opgaveoperatører: Disse operatorer bruges til at tildele værdier til variabler i R. Tildelingen kan udføres ved hjælp af enten tildelingsoperatøren(<-) eller er lig med operator (=). Værdien af variablen kan tildeles på to måder, venstre tildeling og højre tildeling.
LogiskOperatører: Disse operatører sammenligner de to enheder og bruges typisk med boolske (logiske) værdier såsom 'og', 'eller'og'ikke'.
R Programmering: Betingede udsagn
- Hvis erklæring: If-sætningen hjælper dig med at evaluere et enkelt udtryk som en del af flowet. For at udføre denne evaluering skal du bare skrive søgeordet If efterfulgt af det udtryk, der skal evalueres. Nedenstående flowdiagram giver en idé om, hvordan If-sætningen styrer strømmen af en kode: Overvej følgende eksempel:
num1 = 10 num2 = 20 hvis (num1<=num2){ print('Num1 is less or equal to Num2')
Produktion:
[1] 'Num1 er mindre eller lig med Num2'
- Ellers hvis udsagn: Else if-sætningen hjælper dig med at udvide grene til strømmen oprettet af If-sætningen og give dig mulighed for at evaluere flere betingelser ved at oprette nye grene af flow. Nedenstående flow giver dig en idé om, hvordan det andet hvis udsagn forgrener kodens flow:
Overvej følgende eksempel:Num1 = 5 Num2 = 20 hvis (Num1 Num2) {print ('Num2 er mindre end Num1')} ellers hvis ('Num1 == Num2) {print (' Num1 og Num2 er ens ')}
Produktion:
[1] 'Num1 er mindre end Num2'
- Else Statement: Andet-udsagnet bruges, når alle andre udtryk er kontrolleret og fundet ugyldige. Dette vil være den sidste erklæring, der bliver udført som en del af If - Else if filialen. Nedenstående flow giver dig en bedre idé om, hvordan Else ændrer strømmen af koden:
Overvej følgende eksempel:
Num1 = 5 Num2 = 20 hvis (Num1 Num2) {print ('Num2 er mindre end Num1')} ellers print ('Num1 og Num2 er ens')}
Produktion:
[1] 'Num1 og Num2 er ens'
R Programmering: sløjfer
En loop-sætning giver os mulighed for at udføre en erklæring eller gruppe af udsagn flere gange. Der er hovedsagelig 3 typer løkker i R:
- gentag Loop : Det gentager en erklæring eller gruppe af udsagn, mens en given betingelse er SAND. Gentag loop er det bedste eksempel på en exit-kontrolleret loop, hvor koden først udføres, og derefter kontrolleres tilstanden for at afgøre, om kontrollen skal være inde i loop eller exit fra den. Nedenfor er strømmen af kontrol i en gentagelsessløjfe:
Lad os se på eksemplet nedenfor for at forstå, hvordan vi kan bruge gentagelsessløjfe til at tilføje n tal, indtil summen når overstiger 100:x = 2 gentag {x = x ^ 2 print (x) hvis (x> 100) {break}
Produktion:
[1] 4 [1] 16 [1] 256
- mens Loop : jegt hjælper med at gentage en erklæring eller gruppe af udsagn, mens en given tilstand er SAND. Mens sløjfe sammenlignet med gentagelsessløjfen er lidt anderledes, er det et eksempel på en indgangsstyret sløjfe, hvor tilstanden først kontrolleres, og kun hvis betingelsen viser sig at være sand, leveres kontrollen inde i løkken for at udføre koden . Nedenfor er strømmen af kontrol i en while-loop:
Lad os se på eksemplet nedenfor for at tilføje summen af kvadrater for de første 10 tal og forstå, hvordan mens loop fungerer bedre:num = 1 sumn = 0 mens (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) }
Produktion:[elleve [femten [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
- til Loop : Det bruges til at gentage en sætning eller gruppe af et fast antal gange. I modsætning til gentagelse og mens loop bruges for-loop i situationer, hvor vi er opmærksomme på det antal gange, koden skal udføres på forhånd. Det svarer til while-sløjfen, hvor tilstanden først kontrolleres, og derefter udføres kun den kode, der er skrevet indeni. Lad os se strømmen af kontrol af for loop nu:
Lad os nu se på et eksempel, hvor vi bruger for-løkken til at udskrive de første 10 tal:
til (x i 1:10) {print (x)}
Produktion:
[elleve [1] 2 [1] 3 [1] 4 [femten [1] 6 [1] 7 [1] 8 [1] 9 [1] 10
R Programmering: Funktioner
En funktion er en blok med organiseret, genanvendelig kode, der bruges til at udføre en enkelt, relateret handling. Der er hovedsageligt to typer funktioner i R:
Foruddefinerede funktioner : Disse er indbyggede funktioner, der kan bruges af brugeren til at gøre deres arbejde letr. F.eks .: mean( x) , sum( x) , kvmt ( x ), toupper( x ), etc.
Brugerdefineret Funktioner: Disse funktioner oprettes af brugeren for at imødekomme et specifikt krav fra brugeren. Nedenfor er syntaksen for oprettelse af en funktion iR:
func tion_name <– fungere (arg_1, arg_2 og hellip){ // Funktionslegeme }
Overvej følgende eksempel på en simpel funktion til at generere summen af firkanterneaf2 tal:
sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4)
Output: [1] 25
Jeg håber, du har nydt at læse denne R-programmeringsblog. Vi har dækket alt det grundlæggende i R i denne vejledning, så du kan begynde at øve dig nu. Efter denne R-programmeringsblog vil jeg komme med flere blogs på R til Analytics, så hold dig opdateret.
Nu hvor du har forstået det grundlæggende i R, skal du tjekke af Edureka, et pålideligt online læringsfirma med et netværk på mere end 250.000 tilfredse elever spredt over hele kloden. Edurekas dataanalyse med R-træning hjælper dig med at få ekspertise inden for R-programmering, datamanipulation, sonderende dataanalyse, datavisualisering, dataudvinding, regression, sentimentanalyse og brug af RStudio til virkelige casestudier på detailhandel, sociale medier.
Har du et spørgsmål til os? Nævn det i kommentarfeltet på denne 'R-programmering' -blog, og vi vender tilbage til dig hurtigst muligt.