Einführung in die statistische Programmierung mit R

Inhaltsverzeichnis
R ist eine statistische Programmiersprache, sie ist kostenlos und Open Source. Es wird hauptsächlich für den Betrieb von Data-Mining oder Statistik, all dies mit dem Ziel, Anwendungen für die Analyse großer Datenmengen zu schaffen.
Die Befehlszeilenschnittstelle von R Anfangs kann es etwas einschüchternd wirken, aber dies wird überschattet, nachdem wir die Macht und die Möglichkeiten schätzen, die uns die Sprache bietet, um die Informationsanalyse zu teilen und zu reproduzieren.
R Es kann für alle heute existierenden kostenlosen Plattformen kostenlos heruntergeladen werden, wir haben die Möglichkeit, es in zu installieren Fenster, Linux und sogar Mac.
Für die Zwecke dieses Tutorials verwenden wir die Version für Fenster die wir auf der offiziellen Seite des Projekts unter folgendem Link finden. Nach dem Herunterladen und Installieren haben wir unsere funktionsfähige Kopie von R, wenn wir es ausführen, haben wir den Startbildschirm von R das sollte so aussehen:

R Es ermöglicht uns, schnell und effektiv mit Daten zu arbeiten, aber die Standardschnittstelle ist für diese Aufgabe nicht perfekt. Eines der Probleme ist, dass sich alles in separaten Fenstern öffnet, was die Arbeit erschwert und auch die Befehlszeilenschnittstelle nicht in allen Betriebssystemen gleich ist.
Obwohl es viele Schnittstellen gibt, um dieses Problem zu lösen, verwenden wir in diesem Tutorial RStudio die für alle Plattformen verfügbar ist, aber es ist wichtig zu erwähnen, dass es notwendig ist R vor der Installation installiert, um die Version von zu erhalten Fenster wir gehen auf den folgenden Link und laden die entsprechende Version herunter.
Nach der Installation führen wir aus RStudio und wir sollten die Hauptschnittstelle sehen:

RStudio gibt uns die Organisation aller Fenster von R innerhalb eines einzigen Panels und gibt uns zusätzlich Zugriff auf Funktionen, die schwer zu finden sind, darüber hinaus können wir weitere zusätzliche Vorteile nennen:
  • Unterteilen wir unsere Arbeit in Projekte wo jedes von diesen sein Arbeitsverzeichnis, seine Historie und seine Quelldateien hat.
  • Integration mit GitHub.
  • Ermöglicht Ihnen, eine Geschichte grafisch zu speichern.
  • Sie können die Grafiken in verschiedenen Formaten und Größen exportieren.
  • Es ermöglicht uns, Code mit dem Tabellenschlüssel zu vervollständigen.
  • Dank bestimmter Pakete können Sie interaktive Diagramme erstellen.
Wie wir sehen RStudio ist eine ziemlich optimale Art, damit zu arbeiten REs gibt jedoch andere Lösungen auf dem Markt, es ist jedem selbst überlassen, diese zu untersuchen und zu bewerten, ob sie besser an die Bedürfnisse jeder Person angepasst sind.
Es gibt mehrere Möglichkeiten, damit zu arbeiten R wo das erste, was wir ansprechen werden, ist die R-KonsoleObwohl wir die hier geleistete Arbeit nicht speichern können, ist es durchaus sinnvoll, einige Funktionen zu testen und sich mit der Sprache vertraut zu machen.
Die Arbeit mit der Konsole ist ziemlich einfach, wir geben einen Befehl ein und R gibt uns die Ausgabe davon, versuchen wir eine einfache Additionsoperation wie die folgende:
> 10 + 7

Wir drücken Eintreten und automatisch R In der folgenden Zeile gibt es uns die Antwort auf unsere Operation:

Wie wir im Bild sehen können, enthält die erste Zeile den Befehl mit unserer Operation, es ist wichtig zu erwähnen, dass R es ist nicht erforderlich, das Semikolon zum Beenden der Zeile oder einen anderen Abschlussoperator zu verwenden. Wir sehen in der zweiten Zeile vor der Antwort die [1] dies zeigt die Art und Weise an, in der R führt arithmetische Operationen durch und verwendet Vektor, der eine bedeutet den Index des ersten Elements des Vektors, wobei wir hervorheben können, dass viele andere Sprachen die Indizes von Grund auf neu behandeln, aber R macht es aus dem einen.
Wie bereits erwähnt, ist die Konsole sehr nützlich, aber sie ist nicht die beste, um damit zu arbeiten, hauptsächlich weil sie nicht die Möglichkeit hat, unsere Befehle zu speichern und nur einen Befehl gleichzeitig einzugeben, etwas Ähnliches passiert mit Python, aber wir sollten uns da keine Sorgen machen RStudio gibt uns die Skriptfenster befindet sich im oberen Teil unserer Konsole, wenn wir es nicht finden, gehen wir zu Datei> Neue Datei> R-Skript oder drücke Umschalt + Befehl + N.
Grundsätzlich ist ein R-Skript Klartext mit der Erweiterung .R. Um zu sehen, wie es funktioniert, können wir unsere arithmetische Operation aus dem vorherigen Beispiel neu erstellen, indem wir ein neues Skript erstellen und mehrere zusätzliche Befehlszeilen hinzufügen.
 10 + 7 1:50 Druck ("Hello World") 

EIN R-Skript Sie können Zeile für Zeile mit der Option ausführen, die wir im oberen Menü namens . haben Laufen und wir werden die Ausgabe desselben in der Konsole sehen, sehen wir uns die Antwort für jede Zeile unseres Skripts an:

Wie können wir sehen, dass die erste Zeile das zuvor erhaltene Ergebnis liefert, die zweite Zeile eine Liste von Zahlen von 1 bis 50 erstellt, wobei die Zahl in Klammern der erste Index für diese Zeile ist und schließlich haben wir den Eindruck des Klassikers Hallo Welt.
Nachdem wir gesehen haben, wie wir mit Sprache arbeiten können, werden wir zu eher theoretischen Konzepten übergehen, um besser zu verstehen, was wir an Sprache für die Arbeit und die Durchführung unserer Projekte zur Verfügung haben.
Wie in allen Programmiersprachen, Variablen sind einer der wichtigsten Aspekte, um sie in R Wir müssen nur den Namen davon schreiben, ohne den Typ zu definieren. Wir nehmen das Aufgabenverwalter um der Variablen den Wert zu geben.
WichtigWir können den Wert einer Variablen mit dem Gleichheitszeichen zuweisen, aber das ist eine schlechte Praxis in R, um die richtige Zuordnung vorzunehmen, verwenden Sie den Operator <-.
Sehen wir uns an, wie es aussieht, einer Variablen einen Wert zuzuweisen und sie dann auszudrucken:
 x <- 58 x 

Wir können unseren Variablen auch mit der Verkettungsfunktion mehrere Werte zuweisen:
j <- c (5, 2, 11, 28, 17)

Wenn wir das Beispiel ausführen, sehen wir im rechten Panel, wie wir den Wert von haben x und der numerischen Liste zugeordnet zu Ja:

VERGRÖSSERN

Um eine Variable aus dem Arbeitsbereich zu entfernen, müssen wir außerdem nur die Funktion verwenden rm, wir können sogar den gesamten Arbeitsbereich bereinigen, mal sehen, wie wir das machen:
 rm (x) rm (Liste = ls ()) 

Mit der ersten Zeile eliminieren wir die Variable und mit der zweiten Zeile den gesamten Platz.
In der Sprache haben wir vier Datenstrukturen, die erkannt werden durch R:
Cartoon-VektorEin Vektor ist ein eindimensionales Array, in dem alle darin enthaltenen Daten vom gleichen Typ, Integer, Char usw. sein müssen. Außerdem ist zu beachten, dass dies das grundlegende Datenobjekt in . ist R.
Arrays und MatrizenEine Matrix ähnelt einem Vektor, bei dem die Daten vom gleichen Typ sein müssen, jedoch hat die Matrix zwei Dimensionen und die Informationen sind in Zeilen und Spalten organisiert. Das Array ähnelt dem Array, kann jedoch mehr als zwei Dimensionen haben.
DatenrahmenDie Datenrahmen sind eine Sammlung von Vektoren gleicher Länge, ähnlich der Matrix, aber die Besonderheit dieser Art von Struktur besteht darin, dass sie von gemischten Datentypen sein können, wobei die Vektoren sogar Namen haben können.
ListenDer generischste Strukturtyp in R, eine Liste, ist eine Sammlung von Elementen jeder Klasse, Länge oder Struktur, wir können sogar andere Listen haben.
Des Weiteren, R Es hat mehrere Funktionen, die es uns ermöglichen, einen Strukturtyp in einen anderen umzuwandeln, mal sehen:
als.Vektor ()Mit dieser Funktion können Sie Matrizen in eindimensionale Vektoren umwandeln.
as.matrix ()Sie können Datenstrukturen in ein Array konvertieren.
als.Datenrahmen ()Sie können Datenstrukturen in Datenrahmen konvertieren.
as.liste ()Sie können Datenstrukturen in Listen umwandeln.
Eine der Stärken von R ist, dass Sie Pakete hinzufügen können, die es uns ermöglichen, die Funktionalitäten der Sprache zu erweitern. In anderen Sprachen kommen diese Plugins in Bibliotheken, aber in R ist die Bibliothek der Ort, an dem alle Pakete gespeichert sind.
Das Pakete von R kann von zwei verschiedenen Orten kommen, manche kommen mit R standardmäßig, aber sie sind nicht aktiv und andere können in Online-Repositorys gefunden werden.
Um die aktuell installierten oder geladenen Pakete anzuzeigen, können wir die folgenden Funktionen ausführen:
 Bibliothek () Suche () 

Die Funktion Bibliothek () bringt uns eine Liste der Pakete, die derzeit installiert sind. Sehen wir uns einen Teil dessen an, was es uns zuwirft, wenn wir diese Zeile ausführen:

Die Funktion Suche () Andererseits zeigt es uns per Konsole die aktuell geladenen Pakete an, sehen wir im folgenden Bild, welche Pakete wir geladen haben:

Um Pakete zu installieren, können wir dies auf verschiedene Weise tun, die erste ist über die Option im oberen Menü Tools> Pakete installieren und dann haben wir durch Funktionen der Sprache, letztere ist die, die wir empfehlen, da sie so Teil unseres Skripts sein kann.
Um ein Paket zu installieren, verwenden wir install.pakete, danach müssen wir es einschließen, wir können es verwenden Bibliothek oder benötigen Dafür nutzt man aber am besten letzteres um Verwechslungen mit dem Funktionsumfang zu vermeiden, mal sehen wie wir das Paket installieren und einbinden ggplot2:
 install.packages ("ggplot2") erfordern ("ggplot2") 

Endlich ein Paket löschen, das wir verwenden können Pakete entfernen, mal sehen, wie es verwendet wird:
pakete entfernen ("ggplot2")

Damit beenden wir dieses Tutorial, mit dem wir bereits eine Vorstellung davon haben, wie man damit arbeitet R, zusätzlich zu klargestellten Punkten wie Variablen und Datenstrukturen, wesentliche Aspekte, die wir kennen müssen, um die Vorteile dieser mächtigen und effektiven Sprache voll auszuschöpfen.Hat dir dieses Tutorial gefallen und geholfen?Sie können den Autor belohnen, indem Sie diesen Knopf drücken, um ihm einen positiven Punkt zu geben

Sie werden die Entwicklung der Website helfen, die Seite mit Ihren Freunden teilen

wave wave wave wave wave