R

R-Programmier-Tutorial

R-Programmier-Tutorial
Sie möchten schnell vom Anfänger bis zum Experten R-Programmierer? R ist eine der besten Programmiersprachen für die Arbeit mit Statistik, Mathematik und Datenwissenschaft. Dieses Tutorial hilft Ihnen, R zu lernen und Ihr erstes Modell für maschinelles Lernen zu erstellen. Lass uns anfangen.

Kompilieren und Ausführen von R über die Befehlszeile

Die zwei Möglichkeiten, R-Programme auszuführen, sind: ein R-Skript, das weit verbreitet ist und am meisten bevorzugt wird, und das zweite ist R CMD BATCH, es ist kein häufig verwendeter Befehl. Wir können sie direkt über die Befehlszeile oder einen anderen Job-Scheduler aufrufen.

Sie können diese Befehle möglicherweise über eine in die IDE integrierte Shell aufrufen. Heutzutage enthält die RStudio-IDE Tools, die das R-Skript und die R CMD BATCH-Funktionen verbessern oder verwalten.

Die Funktion source() in R ist eine gute Alternative zur Verwendung der Befehlszeile. Diese Funktion kann auch ein Skript aufrufen, aber um diese Funktion zu verwenden, müssen Sie sich in der R-Umgebung befinden.

Integrierte Datensätze der Sprache R

Um die in R integrierten Datensätze aufzulisten, verwenden Sie den Befehl data(), suchen Sie dann nach dem Gewünschten und verwenden Sie den Namen des Datensatzes in der Funktion data(). Like-Daten (Funktionsname).

Datensätze in R . anzeigen

Das Fragezeichen (?) könnte verwendet werden, um um Hilfe für Datensätze zu bitten.

Um alles zu überprüfen, verwenden Sie die Zusammenfassung ().

Plot() ist auch eine Funktion, die verwendet wird, um Graphen zu zeichnen.

Lassen Sie uns ein Testskript erstellen und ausführen. Erstellen p1.R Datei und speichern Sie sie im Home-Verzeichnis mit folgendem Inhalt:

Code-Beispiel:

 # Einfacher Hello-World-Code in R print("Hello World!") print("LinuxHint") print(5+6) 

Hallo Welt laufen

R-Datenrahmen

Zum Speichern von Daten in Tabellen verwenden wir eine Struktur in R namens a Datenrahmen. Es wird verwendet, um Vektoren gleicher Länge aufzulisten. Die folgende Variable nm ist beispielsweise ein Datenrahmen mit den drei Vektoren x, y, z:

x = c(2, 3, 5) y = c("aa", "bb", "cc") z = c(TRUE, FALSE, TRUE) # nm ist ein Datenrahmen nm = data.Rahmen(n, s, b) 

Es gibt ein Konzept namens EingebautDatenrahmen auch in R. mtcars ist ein solcher eingebauter Datenrahmen in R, den wir zum besseren Verständnis als Beispiel verwenden werden. Siehe folgenden Code:

 > mtcars mpg cyl disp hp drat wt… Mazda RX4 21.0 6 160 110 3.90 2.62… Bus RX4 Wag 21.0 6 160 110 3.90 2.88… Datsun 710 22.8 4 108 93 3.85 2.32… 

mtcars bulitin-Datenrahmen

Die Kopfzeile ist die oberste Zeile der Tabelle, die die Spaltennamen enthält. Datenzeilen werden durch jede horizontale Linie gespendet; jede Zeile beginnt mit dem Namen der Zeile, gefolgt von den eigentlichen Daten. Das Datenelement einer Zeile wird als Zelle bezeichnet.

Wir würden die Zeilen- und Spaltenkoordinaten in einer einzelnen eckigen Klammer '[]' eingeben, um Daten in einer Zelle abzurufen. Um die Koordinaten zu trennen, verwenden wir ein Komma. Die Bestellung ist wichtig. Die Koordinate beginnt mit Zeile, dann Komma und endet dann mit der Spalte. Zellenwert von 2nd Reihe und 1st Spalte wird angegeben als:

 > mtcars[2, 2] [1] 6 

Anstelle von Koordinaten können wir auch Zeilen- und Spaltennamen verwenden:

 > mtcars["Bus RX4", "mpg"] [1] 6 

Die nrow-Funktion wird verwendet, um die Anzahl der Zeilen im Datenrahmen zu ermitteln.

 > nrow(mtcars) # Anzahl der Datenzeilen [1] 32 

Die ncol-Funktion wird verwendet, um die Anzahl der Spalten in einem Datenrahmen zu ermitteln.

 > ncol(mtcars) # Anzahl der Spalten [1] 11 

R Programmierschleifen

Unter bestimmten Bedingungen verwenden wir Schleifen, wenn wir einen Teil des Codes automatisieren oder eine Abfolge von Anweisungen wiederholen möchten.

For-Schleife in R

Wenn wir diese Jahresinformationen mehr als einmal ausdrucken möchten.

 print(paste("Das Jahr ist", 2000)) "Das Jahr ist 2000" print(paste("Das Jahr ist", 2001)) "Das Jahr ist 2001" print(paste("Das Jahr ist", 2002) ) "Das Jahr ist 2002" print(paste("Das Jahr ist", 2003)) "Das Jahr ist 2003" print(paste("Das Jahr ist", 2004)) "Das Jahr ist 2004" print(paste(" Das Jahr ist", 2005)) "Das Jahr ist 2005" 

Anstatt unsere Aussage immer wieder zu wiederholen, wenn wir verwenden zum Schleife wird es für uns viel einfacher sein. So was:

 for (Jahr in c(2000,2001,2002,2003,2004,2005)) print(paste("Das Jahr ist", Jahr)) "Das Jahr ist 2000" "Das Jahr ist 2001" "Das Jahr ist 2002" "Das Jahr ist 2003" "Das Jahr ist 2004" "Das Jahr ist 2005" 

While-Schleife in R

 while (Ausdruck)  Aussage  

Wenn das Ergebnis von Ausdruck WAHR ist, wird der Schleifenkörper eingegeben. Die Anweisungen innerhalb der Schleife werden ausgeführt und der Ablauf kehrt zurück, um den Ausdruck erneut zu bewerten assess. Die Schleife wiederholt sich, bis der Ausdruck FALSE ergibt. In diesem Fall wird die Schleife beendet.

Beispiel für while-Schleife:

 # i wird anfänglich auf 0 i = 0 initialisiert, während (i<5)  print (i) i=i+1  Output: 0 1 2 3 4 

In der obigen while-Schleife lautet der Ausdruck ich<5was zu WAHR misst, da 0 kleiner als 5 . ist. Daher wird der Schleifenkörper ausgeführt, und ich wird ausgegeben und inkrementiert. Es ist wichtig zu erhöhen ich innerhalb der Schleife, so dass es irgendwann die Bedingung erfüllt. In der nächsten Schleife wird der Wert von ich ist 1, und die Schleife wird fortgesetzt. Es wird sich wiederholen, bis ich gleich 5, wenn die Bedingung 5<5 reached loop will give FALSE and the while loop will exit.

R-Funktionen

Um ein zu erstellen Funktion Wir verwenden die Direktive-Funktion (). Konkret handelt es sich um R-Objekte der Klasse Funktion.

f <- function()  ##some piece of instructions  

Insbesondere könnten Funktionen als Argumente an andere Funktionen übergeben werden und Funktionen könnten verschachtelt sein, damit Sie eine Funktion innerhalb einer anderen Funktion bestimmen können.

Funktionen können optional einige benannte Argumente haben, die Standardwerte haben. Wenn Sie keinen Standardwert wünschen, können Sie seinen Wert auf NULL setzen.

Einige Fakten zu R-Funktionsargumenten:

#Definieren einer Funktion: f <- function (x, y = 1, z = 2, s= NULL)   

Erstellen eines logistischen Regressionsmodells mit integriertem Datensatz

Das glm() Funktion wird in R verwendet, um die logistische Regression anzupassen. Die Funktion glm() ähnelt der Funktion lm(), aber glm() hat einige zusätzliche Parameter. Sein Format sieht wie folgt aus:

 glm(X~Z1+Z2+Z3, family=binomial (link=”logit”), data=mydata) 

X ist abhängig von den Werten von Z1, Z2 und Z3. Das bedeutet, dass Z1, Z2 und Z3 unabhängige Variablen sind und X die abhängige Funktion ist. Die Funktion umfasst eine zusätzliche Parameterfamilie und hat den Wert binomial (link=“logit“), d. h. die Verknüpfungsfunktion ist logit und die Wahrscheinlichkeitsverteilung des Regressionsmodells ist binomial.

Angenommen, wir haben ein Beispiel für einen Studenten, bei dem er auf der Grundlage von zwei Prüfungsergebnissen zugelassen wird. Der Datensatz enthält die folgenden Elemente:

So zeigen Sie den FPS-Zähler in Linux-Spielen an
Linux-Gaming bekam einen großen Schub, als Valve 2012 die Linux-Unterstützung für den Steam-Client und seine Spiele ankündigte. Seitdem haben viele AA...
Herunterladen und Spielen von Sid Meier's Civilization VI unter Linux and
Einführung in das Spiel Civilization 6 ist eine moderne Version des klassischen Konzepts, das in der Reihe der Age of Empires-Spiele eingeführt wurde....
So installieren und spielen Sie Doom unter Linux
Einführung in Doom Die Doom-Serie entstand in den 90er Jahren nach der Veröffentlichung des ursprünglichen Doom. Es war sofort ein Hit und seitdem hat...