Datenwissenschaft

Python Seaborn-Tutorial

Python Seaborn-Tutorial
In dieser Lektion zur Python Seaborn-Bibliothek werden wir uns verschiedene Aspekte dieser Datenvisualisierungsbibliothek ansehen, die wir mit Python verwenden können, um schöne und intuitive Diagramme zu generieren, die Daten in einer Form visualisieren können, die das Unternehmen von einer Plattform erwartet. Um diese Lektion zu vervollständigen, werden wir die folgenden Abschnitte behandeln:

Das sieht nach viel zu decken aus. Lass uns jetzt anfangen.

Was ist die Python Seaborn-Bibliothek??

Die Seaborn-Bibliothek ist ein Python-Paket, mit dem wir Infografiken basierend auf statistischen Daten erstellen können. Da es auf Matplotlib basiert, ist es von Natur aus damit kompatibel. Darüber hinaus unterstützt es die Datenstruktur NumPy und Pandas, sodass das Plotten direkt aus diesen Sammlungen erfolgen kann.

Die Visualisierung komplexer Daten ist eine der wichtigsten Aufgaben von Seaborn. Wenn wir Matplotlib mit Seaborn vergleichen, kann Seaborn die Dinge einfach machen, die mit Matplotlib schwer zu erreichen sind. Es ist jedoch wichtig zu beachten, dass Seaborn ist keine Alternative zu Matplotlib, sondern eine Ergänzung davon. In dieser Lektion werden wir auch Matplotlib-Funktionen in den Codeschnipseln verwenden. Sie werden sich für die Zusammenarbeit mit Seaborn in den folgenden Anwendungsfällen entscheiden:

Nur eine Anmerkung vor dem Start ist, dass wir für diese Lektion eine virtuelle Umgebung verwenden, die wir mit dem folgenden Befehl erstellt haben:

python -m virtualenv seaborn
Quelle seaborn/bin/aktivieren

Sobald die virtuelle Umgebung aktiv ist, können wir die Seaborn-Bibliothek in der virtuellen Umgebung installieren, damit Beispiele, die wir als nächstes erstellen, ausgeführt werden können:

pip install seaborn

Sie können auch Anaconda verwenden, um diese Beispiele auszuführen, was einfacher ist. Wenn Sie es auf Ihrem Computer installieren möchten, sehen Sie sich die Lektion an, die beschreibt, wie man Anaconda Python unter Ubuntu 18 installiert.04 LTS“ und teilen Sie Ihr Feedback. Kommen wir nun zu verschiedenen Arten von Grundstücken, die mit Python Seaborn erstellt werden können.

Verwenden des Pokemon-Datensatzes

Um diese Lektion praxisnah zu halten, verwenden wir den Pokemon-Datensatz, der von Kaggle heruntergeladen werden kann. Um diesen Datensatz in unser Programm zu importieren, verwenden wir die Pandas-Bibliothek. Hier sind alle Importe, die wir in unserem Programm durchführen:

Pandas als pd importieren
aus Matplotlib importieren Sie pyplot als plt
import seaborn als sns import

Jetzt können wir den Datensatz in unser Programm importieren und einige der Beispieldaten mit Pandas anzeigen als:

df = pd.read_csv('Pokemon.csv', index_col=0)
df.Kopf()

Beachten Sie, dass zum Ausführen des obigen Code-Snippets der CSV-Datensatz im selben Verzeichnis wie das Programm selbst vorhanden sein sollte. Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe (im Notebook von Anaconda Jupyter):

Zeichnen der linearen Regressionskurve

Eine der besten Eigenschaften von Seaborn sind die intelligenten Plotting-Funktionen, die nicht nur den von uns bereitgestellten Datensatz visualisieren, sondern auch Regressionsmodelle darauf aufbauen. Zum Beispiel ist es möglich, ein lineares Regressionsdiagramm mit einer einzigen Codezeile zu erstellen. So geht's:

sns.lmplot(x='Angriff', y='Verteidigung', Daten=df)

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Im obigen Code-Snippet sind uns einige wichtige Dinge aufgefallen:

Haben Sie keine Angst, wenn Sie dachten, dass wir ohne diese Regressionslinie keine Handlung haben können. Wir können ! Versuchen wir es jetzt mit einem neuen Code-Snippet, ähnlich dem letzten:

sns.lmplot(x='Angriff', y='Verteidigung', data=df, fit_reg=False)

Diesmal werden wir die Regressionslinie in unserem Plot nicht sehen:

Das ist jetzt viel klarer (wenn wir die lineare Regressionsgerade nicht brauchen). Aber das ist noch lange nicht vorbei. Seaborn ermöglicht es uns, diese Handlung anders zu gestalten und das werden wir tun.

Erstellen von Boxplots

Eines der größten Features von Seaborn ist die einfache Akzeptanz der Pandas Dataframes-Struktur zum Plotten von Daten. Wir können einfach einen Datenrahmen an die Seaborn-Bibliothek übergeben, damit sie daraus einen Boxplot erstellen kann:

sns.Boxplot(data=df)

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Wir können die erste Lesung von total entfernen, da dies etwas umständlich aussieht, wenn wir hier tatsächlich einzelne Spalten zeichnen:

stats_df = df.drop(['Gesamt'], Achse=1)
# Neuer Boxplot mit stats_df
sns.Boxplot(data=stats_df)

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Schwarmplot mit Seaborn

Wir können mit Seaborn ein intuitives Design-Schwarm-Plot erstellen. Wir werden wieder den Datenrahmen von Pandas verwenden, den wir zuvor geladen haben, aber dieses Mal werden wir die show-Funktion von Matplotlib aufrufen, um den von uns erstellten Plot anzuzeigen. Hier der Codeschnipsel:

sns.set_context("Papier")
sns.swarmplot(x="Angriff", y="Verteidigung", data=df)
plt.Show()

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Durch die Verwendung eines Seaborn-Kontexts ermöglichen wir Seaborn, der Handlung eine persönliche Note und ein fließendes Design hinzuzufügen. Es ist möglich, diesen Plot noch weiter anzupassen, indem die benutzerdefinierte Schriftgröße für Beschriftungen im Plot verwendet wird, um das Lesen zu erleichtern. Dazu übergeben wir weitere Parameter an die Funktion set_context, die genau so funktioniert, wie sie sich anhört. Um beispielsweise die Schriftgröße der Etiketten zu ändern, verwenden wir font.Größenparameter. Hier ist der Codeausschnitt für die Änderung:

sns.set_context("paper", font_scale=3, rc="font.Größe":8,"Achsen.Etikettengröße": 5)
sns.swarmplot(x="Angriff", y="Verteidigung", data=df)
plt.Show()

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Die Schriftgröße für das Etikett wurde basierend auf den von uns bereitgestellten Parametern und dem mit der Schriftart verknüpften Wert geändert.Größenparameter. Seaborn ist Experte darin, die Handlung für die praktische Verwendung sehr intuitiv zu gestalten. Das bedeutet, dass Seaborn nicht nur ein Python-Übungspaket ist, sondern tatsächlich etwas, das wir in unseren Produktionsumgebungen verwenden können.

Hinzufügen eines Titels zu Plots

Es ist ganz einfach, unseren Plots Titel hinzuzufügen. Wir müssen nur einem einfachen Verfahren folgen, um die Funktionen auf Achsenebene zu verwenden, bei denen wir die set_title() Funktion, wie wir im Code-Snippet hier zeigen:

sns.set_context("paper", font_scale=3, rc="font.Größe":8,"Achsen.Etikettengröße": 5)
mein_plot = sns.swarmplot(x="Angriff", y="Verteidigung", data=df)
mein_plot.set_title("LH Schwarmplot")
plt.Show()

Sobald wir das obige Code-Snippet ausführen, sehen wir die folgende Ausgabe:

Auf diese Weise können wir unseren Plots noch viel mehr Informationen hinzufügen.

Seaborn gegen Matplotlib

Als wir uns die Beispiele in dieser Lektion angeschaut haben, können wir feststellen, dass Matplotlib und Seaborn nicht direkt verglichen werden können, aber als einander ergänzend angesehen werden können. Eine der Funktionen, die Seaborn einen Schritt voraus ist, ist die Art und Weise, wie Seaborn Daten statistisch visualisieren kann.

Um die Seaborn-Parameter optimal zu nutzen, empfehlen wir Ihnen dringend, sich die Seaborn-Dokumentation anzusehen und herauszufinden, welche Parameter Sie verwenden müssen, um Ihr Grundstück so nah wie möglich an die Geschäftsanforderungen anzupassen.

Fazit

In dieser Lektion haben wir uns verschiedene Aspekte dieser Datenvisualisierungsbibliothek angesehen, die wir mit Python verwenden können, um schöne und intuitive Diagramme zu generieren, die Daten in einer Form visualisieren können, die das Unternehmen von einer Plattform wünscht. Die Seaborm ist eine der wichtigsten Visualisierungsbibliotheken, wenn es um Data Engineering und die Präsentation von Daten in den meisten visuellen Formen geht.

Bitte teilen Sie Ihr Feedback zur Lektion auf Twitter mit @sbmaggarwal und @LinuxHint.

So installieren und konfigurieren Sie DNS unter Ubuntu
DNS ist eine kurze Abkürzung für Domain Neinein Ich SDienst, der die IP und den FQDN zuordnet (Fully Qualifiziert Domain Neinames) zueinander. Und dad...
So aktivieren Sie SSH in Ubuntu
SSH ist eine Abkürzung für Ssicher Schell oder manchmal heißt es Ssicher Socket SHölle, ein Netzwerkprotokoll, das verwendet wird, um eine sichere Ver...
So richten Sie einen Samba-Dateifreigabeserver unter Ubuntu ein
Haben Sie mehrere Maschinen mit mehreren Betriebssystemen?? Dann können Probleme beim Übertragen von Dateien zwischen diesen Computern auftreten. Es i...