Pandas

So verwenden Sie Boxplot in Python

So verwenden Sie Boxplot in Python
Ein Boxplot wird verwendet, um Datensätze mit der Box- und Whisker-Plot-Methode zusammenzufassen. Diese Funktion hilft Benutzern, die Datenzusammenfassung richtig zu verstehen. Boxplots können sehr nützlich sein, wenn wir wissen möchten, wie die Daten verteilt und verteilt sind. Im Boxplot werden drei Arten von Quartilen verwendet, um die Daten darzustellen. Zu diesen Werten gehören die statistischen Werte Median, Maximum, Minimum, oberes Quartil und unteres Quartil. Ein Boxplot fasst diese Daten im 25 . zusammendas, 50das, und 75das Perzentile. Dieses Tutorial zeigt Ihnen, wie Sie Boxplots basierend auf einem bestimmten Datensatz mit dem Pandas und Seegeboren Bibliotheken von Python.

Voraussetzung

Wenn Sie ein neuer Python-Benutzer sind, müssen Sie zuerst die Umgebung einrichten, um die Ausgabe des Boxplots anzuzeigen. Sie können jeden Python-Interpreter zum Ausführen des Codes verwenden. In diesem Tutorial verwende ich spyder3 um den Code auszuführen. Wenn Sie die installed nicht installiert haben Pandas und Seegeboren Bibliotheken vor, dann sollten Sie den folgenden Befehl vom Terminal aus ausführen, um diese Bibliotheken zu installieren:

$ pip3 installiere pandas seaborn

Boxplots mit Pandas

Das Box-Plot() Methode von Pandas wird verwendet, um Boxplot-Figuren basierend auf dem Datenrahmen zu generieren. Diese Methode enthält viele Argumente; Einige dieser Argumente werden in den folgenden Beispielen verwendet. Dieser Teil des Tutorials enthält zwei Beispiele, die Ihnen zeigen, wie Sie Boxplots in erstellen Pandas. Sie können zufällig generierte Daten in der NumPy-Bibliothek oder die Daten aus einer CSV-Datei verwenden, um einen Boxplot in zu generieren Pandas.

Beispiel 1: Boxplots basierend auf Zufallswerten

Die Boxplots im folgenden Beispiel wurden mit NumPy und Pandas. Die NumPy-Bibliothek wird im Skript verwendet, um ein Datenrahmenobjekt zu erstellen, indem ein zweidimensionales Array von Zufallswerten generiert wird, das 5 Zeilen und 5 Spalten enthält. Der Inhalt des Datenrahmens wird mit . gedruckt der Kopf() Methode. Als nächstes die Box-Plot() -Methode wird verwendet, um Boxplots mit blauer Farbe, Schriftgröße 10 und einem Drehwinkel von 30 Grad für die Anzeige der Spaltenwerte zu generieren.

#!/usr/bin/env python3
# Panda-Bibliothek importieren Import
Pandas als pd importieren
# Importieren Sie die NumPy-Bibliothek, um die Zufallszahlen für das Array zu erstellen
numpy als np importieren
"
Generieren Sie einen Datensatz basierend auf einem zufällig erstellten NumPy-Array
und fünf Spaltenwerte
"
Datenrahmen = pd.DataFrame(np.zufällig.randn(5,5), Spalten=['2016', '2017', '2018',
'2019', '2020'])
 
# Drucken Sie die Werte des Datenrahmens
drucken (Datenrahmen.Kopf())
# Zeigen Sie den Boxplot basierend auf den Datenrahmenwerten an
Datenrahmen.boxplot(grid='false', color='blue',fontsize=10, rot=30)

Ausgabe

Die folgende Ausgabe erscheint nach der Ausführung des Codes.

Beispiel 2: Boxplots basierend auf CSV-Daten

Die Boxplots im folgenden Beispiel wurden aus CSV-Daten generiert. Erstellen Sie eine CSV-Datei mit dem Namen Bank.csv unter Verwendung der folgenden Daten.

Bank.csv

SL,Kundenname,Kontotyp,Geschlecht,Guthaben
1, Maria Hernandez, Sparen, Weiblich, 120000
2,Mary Smith,Aktuell,Weiblich,40000
3,David Smith,Aktuell,Männlich,379000
4, Maria Rodriguez, Sparen, Weiblich, 56000
5, Mark Lee, Sparen, Männlich, 93500
6, Jonathan Bing, aktuell, männlich, 5900
7, Daniel Williams, Sparen, Männlich, 2300
8, Mike Brown, aktuell, männlich, 124888
9,Paul Smith,Aktuell,Männlich,59450
10, Maria Lopez, Sparen, Weiblich, 487600

Im folgenden Skript wird die matplotlib Bibliothek wurde verwendet, um die Abbildungsgröße des Boxplots einzustellen und die Ausgabe inline anzuzeigen. Alle Aufzeichnungen von die Bank.csv Datei wurden geladen mit dem read_csv() Methode von Pandas. Die ersten 8 Datensätze des Datenrahmens wurden dann mit dem Kopf() Methode. Das Box-Plot() -Methode wurde in der folgenden Anweisung verwendet, um die Boxplot-Figur mit roter Farbe basierend auf 'Konto Typ' mit der Spalte namens 'Balance.'

#!/usr/bin/env python3
# Pandas importieren, um Boxplots zu generieren
Pandas als pd importieren
# Matplotlib importieren, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (8,4)
# Laden Sie den Datensatz aus einer CSV-Datei
df = pd.read_csv("Bank.csv")
# Drucken Sie die ersten 8 Zeilen der geladenen Daten
drucken (df.Kopf(8))
# Zeigen Sie die Boxplots basierend auf den verwendeten Parametern an
df.boxplot(by ='Account_Type',grid='True',column =['Balance'], color='red')

Ausgabe

Die folgende Ausgabe erscheint nach der Ausführung des Codes.

Boxplots mit seaborn

Eine weitere Python-Bibliothek, die häufig zum Zeichnen von Boxplots verwendet wird, ist die Bibliothek Seegeboren.  Eine der wichtigen Funktionen dieser Bibliothek ist, dass sie über viele integrierte Beispieldatensätze verfügt, um verschiedene Aufgaben zu testen. In den nächsten beiden Beispielen wird die Verwendung von zwei verschiedenen Beispieldatensätzen zum Zeichnen von Boxplots unter Verwendung der Seegeboren Bibliothek.

Beispiel 3: Boxplots basierend auf x-Parameter

Im folgenden Beispiel wird ein Beispiel-Dataset mit dem Namen 'Diamanten,' von der Meeresgeborene Bibliothek zum Generieren des Boxplots. Hier wird der Rasterstil mit dem set_style() Methode. Das load_dataset() -Methode wird verwendet, um die Daten der 'Diamanten Datensatz. Die ersten fünf Datensätze werden aus dem Datensatz gedruckt und die Box-Plot() -Methode wird dann verwendet, um den Boxplot basierend auf der Spalte namens zu zeichnen 'Tiefe,'mit blauer Farbe.

# Importieren Sie die Seemannsbibliothek, um Boxplot zu erstellen
import seaborn als sns import
# Matplotlib importieren, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
# Richten Sie den Rasterstil ein
sns.set_style("whitegrid")
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (8,4)
# Laden Sie den Beispieldatensatz
diamond_dataset = sns.load_dataset('diamanten')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print(diamant_dataset.Kopf())
# Zeichnen Sie die Boxplot-Figur
sns.boxplot(x=diamond_dataset['depth'], color='blue')

Ausgabe

Die folgende Ausgabe erscheint nach der Ausführung des Codes.

Beispiel 4: Boxplots basierend auf x- und y-Parametern

Im folgenden Beispiel wird das Beispiel-Dataset mit dem Namen 'Flüge' um den Boxplot zu zeichnen. Hier sind sowohl die x- als auch die y-Parameter von das Boxplot () Methode werden verwendet, um die Figur zu zeichnen. Die anderen Aussagen ähneln dem vorherigen Beispiel.

# Importieren Sie die Seemannsbibliothek, um Boxplot zu erstellen
import seaborn als sns import
# Importieren Sie matplotlib, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
 
# Richten Sie den Rasterstil ein
sns.set_style("dunkelgrau")
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (12,4)
 
# Laden Sie den Beispieldatensatz
Flugdatensatz = sns.load_dataset('Flüge')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print(flight_dataset.Kopf())
 
# Zeichnen Sie die Boxplot-Figur
sns.boxplot(x='Monat', y='Passenger', data=flight_dataset, color='blue')

Ausgabe

Die folgende Ausgabe erscheint nach der Ausführung des Codes.

Fazit

Wenn Sie mit einer großen Datenmenge arbeiten, möchten Sie die Daten möglicherweise mithilfe eines Diagramms zusammenfassen, z. B. eines Boxplots. In diesem Tutorial wurden mehrere Beispiele verwendet, um Ihnen zu zeigen, wie Sie Boxplots mit zwei Python-Bibliotheken erstellen.

So ändern Sie die linke und rechte Maustaste auf einem Windows 10-PC
Es ist ganz normal, dass alle Computer-Maus-Geräte ergonomisch für Rechtshänder gestaltet sind. Es gibt aber auch Mausgeräte, die speziell für Linkshä...
Emulieren Sie Mausklicks, indem Sie den Mauszeiger mit der klicklosen Maus in Windows 10 bewegen
Die Verwendung einer Maus oder Tastatur in der falschen Haltung bei übermäßiger Nutzung kann zu vielen gesundheitlichen Problemen führen, einschließli...
Fügen Sie mit diesen kostenlosen Tools Mausgesten zu Windows 10 hinzu
In den letzten Jahren haben sich Computer und Betriebssysteme stark weiterentwickelt. Es gab eine Zeit, in der Benutzer Befehle verwenden mussten, um ...