Voraussetzung
Wenn Sie ein neuer Python-Benutzer sind, müssen Sie zuerst die Umgebung einrichten, um die Ausgabe des Boxplots anzuzeigen. Sie können jeden Python-Interpreter zum Ausführen des Codes verwenden. In diesem Tutorial verwende ich spyder3 um den Code auszuführen. Wenn Sie die installed nicht installiert haben Pandas und Seegeboren Bibliotheken vor, dann sollten Sie den folgenden Befehl vom Terminal aus ausführen, um diese Bibliotheken zu installieren:
$ pip3 installiere pandas seabornBoxplots mit Pandas
Das Box-Plot() Methode von Pandas wird verwendet, um Boxplot-Figuren basierend auf dem Datenrahmen zu generieren. Diese Methode enthält viele Argumente; Einige dieser Argumente werden in den folgenden Beispielen verwendet. Dieser Teil des Tutorials enthält zwei Beispiele, die Ihnen zeigen, wie Sie Boxplots in erstellen Pandas. Sie können zufällig generierte Daten in der NumPy-Bibliothek oder die Daten aus einer CSV-Datei verwenden, um einen Boxplot in zu generieren Pandas.
Beispiel 1: Boxplots basierend auf Zufallswerten
Die Boxplots im folgenden Beispiel wurden mit NumPy und Pandas. Die NumPy-Bibliothek wird im Skript verwendet, um ein Datenrahmenobjekt zu erstellen, indem ein zweidimensionales Array von Zufallswerten generiert wird, das 5 Zeilen und 5 Spalten enthält. Der Inhalt des Datenrahmens wird mit . gedruckt der Kopf() Methode. Als nächstes die Box-Plot() -Methode wird verwendet, um Boxplots mit blauer Farbe, Schriftgröße 10 und einem Drehwinkel von 30 Grad für die Anzeige der Spaltenwerte zu generieren.
#!/usr/bin/env python3# Panda-Bibliothek importieren Import
Pandas als pd importieren
# Importieren Sie die NumPy-Bibliothek, um die Zufallszahlen für das Array zu erstellen
numpy als np importieren
"
Generieren Sie einen Datensatz basierend auf einem zufällig erstellten NumPy-Array
und fünf Spaltenwerte
"
Datenrahmen = pd.DataFrame(np.zufällig.randn(5,5), Spalten=['2016', '2017', '2018',
'2019', '2020'])
# Drucken Sie die Werte des Datenrahmens
drucken (Datenrahmen.Kopf())
# Zeigen Sie den Boxplot basierend auf den Datenrahmenwerten an
Datenrahmen.boxplot(grid='false', color='blue',fontsize=10, rot=30)
Ausgabe
Die folgende Ausgabe erscheint nach der Ausführung des Codes.
Beispiel 2: Boxplots basierend auf CSV-Daten
Die Boxplots im folgenden Beispiel wurden aus CSV-Daten generiert. Erstellen Sie eine CSV-Datei mit dem Namen Bank.csv unter Verwendung der folgenden Daten.
Bank.csv
SL,Kundenname,Kontotyp,Geschlecht,Guthaben1, Maria Hernandez, Sparen, Weiblich, 120000
2,Mary Smith,Aktuell,Weiblich,40000
3,David Smith,Aktuell,Männlich,379000
4, Maria Rodriguez, Sparen, Weiblich, 56000
5, Mark Lee, Sparen, Männlich, 93500
6, Jonathan Bing, aktuell, männlich, 5900
7, Daniel Williams, Sparen, Männlich, 2300
8, Mike Brown, aktuell, männlich, 124888
9,Paul Smith,Aktuell,Männlich,59450
10, Maria Lopez, Sparen, Weiblich, 487600
Im folgenden Skript wird die matplotlib Bibliothek wurde verwendet, um die Abbildungsgröße des Boxplots einzustellen und die Ausgabe inline anzuzeigen. Alle Aufzeichnungen von die Bank.csv Datei wurden geladen mit dem read_csv() Methode von Pandas. Die ersten 8 Datensätze des Datenrahmens wurden dann mit dem Kopf() Methode. Das Box-Plot() -Methode wurde in der folgenden Anweisung verwendet, um die Boxplot-Figur mit roter Farbe basierend auf 'Konto Typ' mit der Spalte namens 'Balance.'
#!/usr/bin/env python3# Pandas importieren, um Boxplots zu generieren
Pandas als pd importieren
# Matplotlib importieren, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (8,4)
# Laden Sie den Datensatz aus einer CSV-Datei
df = pd.read_csv("Bank.csv")
# Drucken Sie die ersten 8 Zeilen der geladenen Daten
drucken (df.Kopf(8))
# Zeigen Sie die Boxplots basierend auf den verwendeten Parametern an
df.boxplot(by ='Account_Type',grid='True',column =['Balance'], color='red')
Ausgabe
Die folgende Ausgabe erscheint nach der Ausführung des Codes.
Boxplots mit seaborn
Eine weitere Python-Bibliothek, die häufig zum Zeichnen von Boxplots verwendet wird, ist die Bibliothek Seegeboren. Eine der wichtigen Funktionen dieser Bibliothek ist, dass sie über viele integrierte Beispieldatensätze verfügt, um verschiedene Aufgaben zu testen. In den nächsten beiden Beispielen wird die Verwendung von zwei verschiedenen Beispieldatensätzen zum Zeichnen von Boxplots unter Verwendung der Seegeboren Bibliothek.
Beispiel 3: Boxplots basierend auf x-Parameter
Im folgenden Beispiel wird ein Beispiel-Dataset mit dem Namen 'Diamanten,' von der Meeresgeborene Bibliothek zum Generieren des Boxplots. Hier wird der Rasterstil mit dem set_style() Methode. Das load_dataset() -Methode wird verwendet, um die Daten der 'Diamanten Datensatz. Die ersten fünf Datensätze werden aus dem Datensatz gedruckt und die Box-Plot() -Methode wird dann verwendet, um den Boxplot basierend auf der Spalte namens zu zeichnen 'Tiefe,'mit blauer Farbe.
# Importieren Sie die Seemannsbibliothek, um Boxplot zu erstellenimport seaborn als sns import
# Matplotlib importieren, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
# Richten Sie den Rasterstil ein
sns.set_style("whitegrid")
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (8,4)
# Laden Sie den Beispieldatensatz
diamond_dataset = sns.load_dataset('diamanten')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print(diamant_dataset.Kopf())
# Zeichnen Sie die Boxplot-Figur
sns.boxplot(x=diamond_dataset['depth'], color='blue')
Ausgabe
Die folgende Ausgabe erscheint nach der Ausführung des Codes.
Beispiel 4: Boxplots basierend auf x- und y-Parametern
Im folgenden Beispiel wird das Beispiel-Dataset mit dem Namen 'Flüge' um den Boxplot zu zeichnen. Hier sind sowohl die x- als auch die y-Parameter von das Boxplot () Methode werden verwendet, um die Figur zu zeichnen. Die anderen Aussagen ähneln dem vorherigen Beispiel.
# Importieren Sie die Seemannsbibliothek, um Boxplot zu erstellenimport seaborn als sns import
# Importieren Sie matplotlib, um die Figurengröße des Boxplots einzustellen
Matplotlib importieren.pyplot als plt
# Importieren Sie get_ipython, um die Ausgabe inline zu formatieren
aus IPython importieren get_ipython
get_ipython().run_line_magic('matplotlib', 'inline')
# Richten Sie den Rasterstil ein
sns.set_style("dunkelgrau")
# Stellen Sie die Figurengröße ein
plt.rcParams['Abbildung.Feigengröße'] = (12,4)
# Laden Sie den Beispieldatensatz
Flugdatensatz = sns.load_dataset('Flüge')
# Zeigen Sie die ersten 5 Datensätze des Datensatzes an
print(flight_dataset.Kopf())
# Zeichnen Sie die Boxplot-Figur
sns.boxplot(x='Monat', y='Passenger', data=flight_dataset, color='blue')
Ausgabe
Die folgende Ausgabe erscheint nach der Ausführung des Codes.
Fazit
Wenn Sie mit einer großen Datenmenge arbeiten, möchten Sie die Daten möglicherweise mithilfe eines Diagramms zusammenfassen, z. B. eines Boxplots. In diesem Tutorial wurden mehrere Beispiele verwendet, um Ihnen zu zeigen, wie Sie Boxplots mit zwei Python-Bibliotheken erstellen.