Swen Deobald
 - 23. Januar 2020

R – Programmiersprache & Umgebung

R ist eine Programmiersprache und Umgebung f√ľr statistische Berechnungen und Grafiken. Es ist ein GNU-Projekt, das der Sprache und Umgebung S √§hnlich ist, die an den Bell Laboratories (fr√ľher AT&T, jetzt Lucent Technologies) von John Chambers und Kollegen entwickelt wurde.

R kann als eine andere Implementierung von S betrachtet werden. Es gibt einige wichtige Unterschiede, aber viel f√ľr S geschriebener Code l√§uft unver√§ndert unter R.

R bietet eine gro√üe Vielfalt an statistischen (lineare und nichtlineare Modellierung, klassische statistische Tests, Zeitreihenanalyse, Klassifikation, Clustering, …) und grafischen Techniken und ist hochgradig erweiterbar. Die Sprache S ist oft das Mittel der Wahl f√ľr die Forschung in der statistischen Methodik, und R bietet einen Open-Source-Weg zur Teilnahme an dieser Aktivit√§t.

Eine der St√§rken von R ist die Leichtigkeit, mit der gut gestaltete Plots in Publikationsqualit√§t erstellt werden k√∂nnen, einschlie√ülich mathematischer Symbole und Formeln, falls n√∂tig. Gro√üe Sorgfalt wurde auf die Voreinstellungen f√ľr die kleineren Design-Auswahlen in den Grafiken verwendet, aber der Benutzer beh√§lt die volle Kontrolle.

Wozu benötige ich es?

R ist ein integriertes Softwarepaket zur Datenmanipulation, Berechnung und grafischen Darstellung. Sie umfasst

  • eine effektive Datenverarbeitung und -speicherung
  • eine Reihe von Operatoren f√ľr Berechnungen auf Arrays, insbesondere Matrizen
  • eine gro√üe, koh√§rente, integrierte Sammlung von Werkzeugen f√ľr die Datenanalyse
  • grafische M√∂glichkeiten zur Datenanalyse und -anzeige entweder auf dem Bildschirm oder auf Papier
  • eine gut entwickelte, einfache und effektive Programmiersprache, die Konditionalisierungen, Schleifen, benutzerdefinierte rekursive Funktionen und Ein- sowie Ausgabem√∂glichkeiten enth√§lt

Die Umgebung R

Viele Benutzer betrachten R als ein Statistiksystem. Wir ziehen es vor, es als eine Umgebung zu betrachten, in der statistische Techniken implementiert werden.

Der Begriff „Umgebung“ soll es als ein vollst√§ndig geplantes und koh√§rentes System charakterisieren, und nicht als eine inkrementelle Anh√§ufung sehr spezifischer und unflexibler Werkzeuge, wie es h√§ufig bei anderer Datenanalysesoftware der Fall ist.

R ist wie S um eine echte Computersprache herum konzipiert und erlaubt es dem Benutzer, zus√§tzliche Funktionalit√§t durch die Definition neuer Funktionen hinzuzuf√ľgen. Ein gro√üer Teil des Systems ist selbst im R-Dialekt von S geschrieben, was es den Benutzern leicht macht, den getroffenen algorithmischen Entscheidungen zu folgen. F√ľr rechenintensive Aufgaben kann C, C++ und Fortran-Code verkn√ľpft und aufgerufen werden. Fortgeschrittene Benutzer k√∂nnen einen C-Code schreiben, um R-Objekte direkt zu manipulieren.

R hat ein eigenes LaTeX-ähnliches Dokumentationsformat, das zur Bereitstellung einer umfassenden Dokumentation sowohl online in verschiedenen Formaten als auch in Papierform verwendet wird.

SAP Analytics Tools: On Premise vs. Cloud [E-Book]

Finden Sie hier notwendigen Informationen und einige Leitfragen, um pr√ľfen zu k√∂nnen, ob Sie Ihre Analytics-Anwendungen On-Premise oder in der Cloud betreiben wollen.

Unser E-Book zum Thema SAP Analytics Tools

Kommunizieren mit R

R hat mehrere Möglichkeiten, die Arbeit zu präsentieren und zu teilen, entweder durch ein Markdown-Dokument oder eine App. Alles kann in Rpub, GitHub oder auf der Website des Unternehmens gehostet werden.

Rstudio akzeptiert Markdown, um ein Dokument zu schreiben. Sie können die Dokumente in verschiedenen Formaten exportieren:

Dokument :

  • HTML
  • PDF/Latex
  • Wort
  • Pr√§sentation
  • HTML
  • PDF-Beamer

Von wem wird es genutzt

Wenn wir die Verwendung von R durch die Industrie untersuchen, sehen wir, dass die Akademiker an erster Stelle stehen. R ist eine Sprache, um Statistik zu machen. R ist die erste Wahl in der Gesundheitsbranche, gefolgt von Regierung und Beratung.

Warum R verwenden?

Die Datenwissenschaft pr√§gt die Art und Weise, wie Unternehmen ihr Gesch√§ft betreiben. Zweifellos wird die Abkehr von k√ľnstlicher Intelligenz und Maschinen das Unternehmen zum Scheitern bringen. Die gro√üe Frage ist, welches Werkzeug/Sprache Sie verwenden sollten.

Es gibt eine Vielzahl von Werkzeugen auf dem Markt, um Datenanalysen durchzuf√ľhren. Das Erlernen einer neuen Sprache erfordert eine gewisse Zeitinvestition, doch wenn Sie den besten Einblick in die Daten geben wollen, m√ľssen Sie einige Zeit damit verbringen, das entsprechende Werkzeug, n√§mlich R, zu erlernen.

Was benötige ich dazu

R ist als freie Software unter den Bedingungen der GNU General Public License der Free Software Foundation in Form von Quellcode verf√ľgbar. Es kompiliert und l√§uft auf einer Vielzahl von UNIX-Plattformen und √§hnlichen Systemen (einschlie√ülich FreeBSD und Linux), Windows und MacOS.

Die Mindestanforderungen

Der RAM sollte mindestens 8 GB betragen, da die meisten Daten im RAM gespeichert werden und die Datens√§tze leicht √ľber 2 GB erreichen (kleine Datens√§tze).

Da es sich um Single-Threading handelt, sollten Sie einen Prozessor haben, der eine gute Rechenleistung hat. Beachten Sie, dass Sie in R parallele Prozesse mit Snow, Parallel und anderen Paketen ausf√ľhren k√∂nnen.

GPU’s werden nicht ben√∂tigt, aber f√ľr die Datenwissenschaft ben√∂tigen Sie sie, wenn Sie sehr gro√üe Datens√§tze bearbeiten.

Daher sind die Mindestanforderungen:

  • 8 GB ARBEITSSPEICHER
  • 128GB SSD
  • i5-Prozessor

Wichtige Packages und Libraries

Ein Kernsatz von Paketen ist bei der Installation von R enthalten, mit mehr als 15.000 zus√§tzlichen Paketen (Stand September 2018), die im Comprehensive R Archive Network (CRAN), Bioconductor, Omegahat, GitHub und anderen Repositories verf√ľgbar sind.

R kann (einfach) √ľber Pakete erweitert werden. Es gibt etwa acht Pakete, die mit der R-Distribution geliefert werden und viele weitere sind √ľber die CRAN Familie von Internetseiten verf√ľgbar, die einen sehr gro√üen Bereich moderner Statistik abdecken.

R

Erweiterungspakete von R

Die Fähigkeiten von R werden durch vom Benutzer erstellten Paketen erweitert, die spezielle statistische Techniken, grafische Geräte, Import-/Exportfähigkeiten, Berichtswerkzeuge (Rmarkdown, Knitr, Sweave) usw. ermöglichen. Diese Pakete werden hauptsächlich in R entwickelt, manchmal auch in Java, C, C++ und Fortran. Das Paketsystem wird von Forschern auch dazu verwendet, Kompendien zu erstellen, um Forschungsdaten, Code und Berichtsdateien systematisch zu organisieren, um sie gemeinsam zu nutzen und öffentlich zu archivieren.

Task Views

Die Seite „Task Views“ (Themenliste) auf der CRAN Webseite listet eine gro√üe Auswahl an Aufgaben (in Bereichen wie Finanzen, Genetik, Hochleistungsrechnen, Maschinelles Lernen, Medizinische Bildgebung, Sozialwissenschaften und Raumstatistik) auf, f√ľr die R beantragt wurde und f√ľr die Pakete verf√ľgbar sind. Es wurde auch von der FDA als geeignet f√ľr die Interpretation von Daten aus der klinischen Forschung identifiziert.

Crantastic

Weitere R-Paket Ressourcen sind Crantastic, eine Community-Site zur Bewertung und √úberpr√ľfung aller CRAN Pakete, und R-Forge, eine zentrale Plattform f√ľr die gemeinsame Entwicklung von R-Paketen, R-bezogener Software und Projekten. R-Forge hostet auch viele unver√∂ffentlichte Beta-Pakete und Entwicklungsversionen von CRAN Paketen. Microsoft unterh√§lt einen t√§glichen Schnappschuss von CRAN, der bis zum 17. September 2014 zur√ľckreicht.

Bioconductor

Das Projekt Bioconductor stellt R-Pakete f√ľr die Analyse von genomischen Daten zur Verf√ľgung. Dazu geh√∂ren objektorientierte Datenhandhabungs- und Analysewerkzeuge f√ľr Daten von Affymetrix, cDNA-Mikroarrays und Hochdurchsatz-Sequenzierungsmethoden der n√§chsten Generation.

Nachteile im Vergleich zu Python

Python macht die Replizierbarkeit und Zug√§nglichkeit einfacher. Tats√§chlich ist Python die beste Wahl, wenn Sie die Ergebnisse Ihrer Analyse in einer Anwendung oder Website verwenden m√ľssen.

Und so ist die Realität, dass beide Sprachen wertvoll sind, und beide sind hier, um zu bleiben. Unsere Erfahrung bestätigt dies. Viele Data Science Teams sind heute zweisprachig und nutzen sowohl R als auch Python in ihrer Arbeit.

Nun haben sie sich einen √úberblick √ľber R und dessen K√∂nnen verschafft. Haben Sie dazu noch fragen oder ben√∂tigen Sie Hilfe? Dann buchen Sie jetzt Ihren R-Berater.

Swen Deobald

Swen Deobald

Mein Name ist Swen Deobald und ich bin begeisterter SAP Analytics Berater. Als Fachbereichsleiter von Compamind unterst√ľtze ich Sie mit meinem Team bei allen Fragen rund um SAP Analytics, Business Warehouse, BusinessObjects und der SAP Analytics Cloud.

Sie haben Fragen? Kontaktieren Sie mich!


Das könnte Sie auch interessieren:

E-Book SAP Analytics Tools
SAP Analytics

Das könnte Sie auch interessieren


Unsere Produkte zu R – Programmiersprache & Umgebung

Ihnen fehlt das interne Wissen um Anforderungen im BW umzusetzen? Unsere Entwickler √ľbernehmen 100% Ihrer Projektverantwortung – zum Festpreis!

Mehr Informationen

Ihre Analysen sind nichtssagend und Ihre Datenqualität miserabel? Wir analysieren Ihre Quellsysteme und geben Handlungsempfehlung, damit Sie sich auf Ihre Daten verlassen können!

Mehr Informationen

Analysehorizont, Mobilit√§t und Live-Reportings sind f√ľr Sie ein unerreichter Traum? Sie haben die Herausforderung ‚Äď wir die Mitarbeiter und das¬†Knowhow!

Mehr Informationen

Schreiben Sie einen Kommentar

Bitte f√ľllen Sie alle mit * gekennzeichneten Felder aus. Ihre E-Mail Adresse wird nicht ver√∂ffentlicht.





Angebot anfordern
Expert Session
Preisliste anfordern