R – Programmiersprache & Umgebung

R ist eine Programmiersprache und Umgebung fĂŒr statistische Berechnungen und Grafiken. Es ist ein GNU-Projekt, das der Sprache und Umgebung S Ă€hnlich ist, die an den Bell Laboratories (frĂŒher AT&T, jetzt Lucent Technologies) von John Chambers und Kollegen entwickelt wurde.

R kann als eine andere Implementierung von S betrachtet werden. Es gibt einige wichtige Unterschiede, aber viel fĂŒr S geschriebener Code lĂ€uft unverĂ€ndert unter R.

R bietet eine große Vielfalt an statistischen (lineare und nichtlineare Modellierung, klassische statistische Tests, Zeitreihenanalyse, Klassifikation, Clustering, …) und grafischen Techniken und ist hochgradig erweiterbar. Die Sprache S ist oft das Mittel der Wahl fĂŒr die Forschung in der statistischen Methodik, und R bietet einen Open-Source-Weg zur Teilnahme an dieser AktivitĂ€t.

Eine der StĂ€rken von R ist die Leichtigkeit, mit der gut gestaltete Plots in PublikationsqualitĂ€t erstellt werden können, einschließlich mathematischer Symbole und Formeln, falls nötig. Große Sorgfalt wurde auf die Voreinstellungen fĂŒr die kleineren Design-Auswahlen in den Grafiken verwendet, aber der Benutzer behĂ€lt die volle Kontrolle.

Wozu benötige ich es?

R ist ein integriertes Softwarepaket zur Datenmanipulation, Berechnung und grafischen Darstellung. Sie umfasst

  • eine effektive Datenverarbeitung und -speicherung
  • eine Reihe von Operatoren fĂŒr Berechnungen auf Arrays, insbesondere Matrizen
  • eine große, kohĂ€rente, integrierte Sammlung von Werkzeugen fĂŒr die Datenanalyse
  • grafische Möglichkeiten zur Datenanalyse und -anzeige entweder auf dem Bildschirm oder auf Papier
  • eine gut entwickelte, einfache und effektive Programmiersprache, die Konditionalisierungen, Schleifen, benutzerdefinierte rekursive Funktionen und Ein- sowie Ausgabemöglichkeiten enthĂ€lt

Die Umgebung R

Viele Benutzer betrachten R als ein Statistiksystem. Wir ziehen es vor, es als eine Umgebung zu betrachten, in der statistische Techniken implementiert werden.

Der Begriff „Umgebung“ soll es als ein vollstĂ€ndig geplantes und kohĂ€rentes System charakterisieren, und nicht als eine inkrementelle AnhĂ€ufung sehr spezifischer und unflexibler Werkzeuge, wie es hĂ€ufig bei anderer Datenanalysesoftware der Fall ist.

R ist wie S um eine echte Computersprache herum konzipiert und erlaubt es dem Benutzer, zusĂ€tzliche FunktionalitĂ€t durch die Definition neuer Funktionen hinzuzufĂŒgen. Ein großer Teil des Systems ist selbst im R-Dialekt von S geschrieben, was es den Benutzern leicht macht, den getroffenen algorithmischen Entscheidungen zu folgen. FĂŒr rechenintensive Aufgaben kann C, C++ und Fortran-Code verknĂŒpft und aufgerufen werden. Fortgeschrittene Benutzer können einen C-Code schreiben, um R-Objekte direkt zu manipulieren.

R hat ein eigenes LaTeX-Ă€hnliches Dokumentationsformat, das zur Bereitstellung einer umfassenden Dokumentation sowohl online in verschiedenen Formaten als auch in Papierform verwendet wird.

SAP Analytics Tools: On Premise vs. Cloud [E-Book]

Finden Sie hier notwendigen Informationen und einige Leitfragen, um prĂŒfen zu können, ob Sie Ihre Analytics-Anwendungen On-Premise oder in der Cloud betreiben wollen.

Kommunizieren mit R

R hat mehrere Möglichkeiten, die Arbeit zu prÀsentieren und zu teilen, entweder durch ein Markdown-Dokument oder eine App. Alles kann in Rpub, GitHub oder auf der Website des Unternehmens gehostet werden.

Rstudio akzeptiert Markdown, um ein Dokument zu schreiben. Sie können die Dokumente in verschiedenen Formaten exportieren:

Dokument :

  • HTML
  • PDF/Latex
  • Wort
  • PrĂ€sentation
  • HTML
  • PDF-Beamer

Von wem wird es genutzt

Wenn wir die Verwendung von R durch die Industrie untersuchen, sehen wir, dass die Akademiker an erster Stelle stehen. R ist eine Sprache, um Statistik zu machen. R ist die erste Wahl in der Gesundheitsbranche, gefolgt von Regierung und Beratung.

Warum R verwenden?

Die Datenwissenschaft prĂ€gt die Art und Weise, wie Unternehmen ihr GeschĂ€ft betreiben. Zweifellos wird die Abkehr von kĂŒnstlicher Intelligenz und Maschinen das Unternehmen zum Scheitern bringen. Die große Frage ist, welches Werkzeug/Sprache Sie verwenden sollten.

Es gibt eine Vielzahl von Werkzeugen auf dem Markt, um Datenanalysen durchzufĂŒhren. Das Erlernen einer neuen Sprache erfordert eine gewisse Zeitinvestition, doch wenn Sie den besten Einblick in die Daten geben wollen, mĂŒssen Sie einige Zeit damit verbringen, das entsprechende Werkzeug, nĂ€mlich R, zu erlernen.

Was benötige ich dazu

R ist als freie Software unter den Bedingungen der GNU General Public License der Free Software Foundation in Form von Quellcode verfĂŒgbar. Es kompiliert und lĂ€uft auf einer Vielzahl von UNIX-Plattformen und Ă€hnlichen Systemen (einschließlich FreeBSD und Linux), Windows und MacOS.

Die Mindestanforderungen

Der RAM sollte mindestens 8 GB betragen, da die meisten Daten im RAM gespeichert werden und die DatensĂ€tze leicht ĂŒber 2 GB erreichen (kleine DatensĂ€tze).

Da es sich um Single-Threading handelt, sollten Sie einen Prozessor haben, der eine gute Rechenleistung hat. Beachten Sie, dass Sie in R parallele Prozesse mit Snow, Parallel und anderen Paketen ausfĂŒhren können.

GPU’s werden nicht benötigt, aber fĂŒr die Datenwissenschaft benötigen Sie sie, wenn Sie sehr große DatensĂ€tze bearbeiten.

Daher sind die Mindestanforderungen:

  • 8 GB ARBEITSSPEICHER
  • 128GB SSD
  • i5-Prozessor

Wichtige Packages und Libraries

Ein Kernsatz von Paketen ist bei der Installation von R enthalten, mit mehr als 15.000 zusĂ€tzlichen Paketen (Stand September 2018), die im Comprehensive R Archive Network (CRAN), Bioconductor, Omegahat, GitHub und anderen Repositories verfĂŒgbar sind.

R kann (einfach) ĂŒber Pakete erweitert werden. Es gibt etwa acht Pakete, die mit der R-Distribution geliefert werden und viele weitere sind ĂŒber die CRAN Familie von Internetseiten verfĂŒgbar, die einen sehr großen Bereich moderner Statistik abdecken.

R

Erweiterungspakete von R

Die FÀhigkeiten von R werden durch vom Benutzer erstellten Paketen erweitert, die spezielle statistische Techniken, grafische GerÀte, Import-/ExportfÀhigkeiten, Berichtswerkzeuge (Rmarkdown, Knitr, Sweave) usw. ermöglichen. Diese Pakete werden hauptsÀchlich in R entwickelt, manchmal auch in Java, C, C++ und Fortran. Das Paketsystem wird von Forschern auch dazu verwendet, Kompendien zu erstellen, um Forschungsdaten, Code und Berichtsdateien systematisch zu organisieren, um sie gemeinsam zu nutzen und öffentlich zu archivieren.

Task Views

Die Seite „Task Views“ (Themenliste) auf der CRAN Webseite listet eine große Auswahl an Aufgaben (in Bereichen wie Finanzen, Genetik, Hochleistungsrechnen, Maschinelles Lernen, Medizinische Bildgebung, Sozialwissenschaften und Raumstatistik) auf, fĂŒr die R beantragt wurde und fĂŒr die Pakete verfĂŒgbar sind. Es wurde auch von der FDA als geeignet fĂŒr die Interpretation von Daten aus der klinischen Forschung identifiziert.

Crantastic

Weitere R-Paket Ressourcen sind Crantastic, eine Community-Site zur Bewertung und ÜberprĂŒfung aller CRAN Pakete, und R-Forge, eine zentrale Plattform fĂŒr die gemeinsame Entwicklung von R-Paketen, R-bezogener Software und Projekten. R-Forge hostet auch viele unveröffentlichte Beta-Pakete und Entwicklungsversionen von CRAN Paketen. Microsoft unterhĂ€lt einen tĂ€glichen Schnappschuss von CRAN, der bis zum 17. September 2014 zurĂŒckreicht.

Bioconductor

Das Projekt Bioconductor stellt R-Pakete fĂŒr die Analyse von genomischen Daten zur VerfĂŒgung. Dazu gehören objektorientierte Datenhandhabungs- und Analysewerkzeuge fĂŒr Daten von Affymetrix, cDNA-Mikroarrays und Hochdurchsatz-Sequenzierungsmethoden der nĂ€chsten Generation.

Nachteile im Vergleich zu Python

Python macht die Replizierbarkeit und ZugĂ€nglichkeit einfacher. TatsĂ€chlich ist Python die beste Wahl, wenn Sie die Ergebnisse Ihrer Analyse in einer Anwendung oder Website verwenden mĂŒssen.

Und so ist die RealitÀt, dass beide Sprachen wertvoll sind, und beide sind hier, um zu bleiben. Unsere Erfahrung bestÀtigt dies. Viele Data Science Teams sind heute zweisprachig und nutzen sowohl R als auch Python in ihrer Arbeit.

Nun haben sie sich einen Überblick ĂŒber R und dessen Können verschafft. Haben Sie dazu noch fragen oder benötigen Sie Hilfe? Dann buchen Sie jetzt Ihren R-Berater.


Das könnte Sie auch interessieren:


Unsere Produkte zu R – Programmiersprache & Umgebung

Das SAP Business Warehouse (BW) bietet Ihnen hervorragende Möglichkeiten, Ihre Daten zu historisieren und zu harmonisieren - an einem zentralen Ort. So schaffen Sie die Grundlage fĂŒr eine effektive BI- und Analytics-Umgebung und gehen den nĂ€chsten Schritt in Richtung Data Driven Company.  

Mehr Informationen

Analysen sind immer von Vorteil, allerdings ist dies nicht möglich wenn die DatenqualitÀt zu gering ist. Wie Sie dieses Problem langfristig lösen, erfahren Sie in unserem Inhouse Workshop.

Mehr Informationen

Das Produkt- und Technologieportfolio rund um die BI- und Analytics-Lösungen der SAP ist extrem vielfÀltig und unterliegt einem stÀndigen Wandel. Dies ist einerseits notwendig, um neue Anforderungen an Analysehorizont, Performance, MobilitÀt und Live-Reporting gerecht zu werden. Andererseits werden einige Unternehmen von dieser Geschwindigkeit der technologischen Weiterentwicklung abgehÀngt und verpassen die Vorteile. 

Mehr Informationen

Schreiben Sie einen Kommentar

Bitte fĂŒllen Sie alle mit * gekennzeichneten Felder aus. Ihre E-Mail Adresse wird nicht veröffentlicht.





Angebot anfordern
Expert Session
Preisliste anfordern