In diesem Artikel werden wir verschiedene Methoden zum Plotten von Daten untersuchen, indem wir den Pandas-Python verwenden. Wir haben alle Beispiele im Quellcode-Editor von pycharm mit der Matplotlib ausgeführt.pyplot-Paket.
Plotten in Pandas Python
In Pandas, die .plot() hat mehrere Parameter, die Sie je nach Bedarf verwenden können. Meistens können Sie mit dem Parameter 'kind' definieren, welche Art von Plot Sie erstellen möchten.
Die Syntax zum Plotten von Daten mit Pandas Python
Die folgende Syntax wird verwendet, um einen DataFrame in Pandas Python zu zeichnen:
# Pandas und Matplotlib importieren.pyplot-PaketePandas als pd importieren
Matplotlib importieren.pyplot als plt
# Bereiten Sie Daten vor, um DataFrame zu erstellen
data_frame =
'Spalte1': ['Feld1', 'Feld2', 'Feld3', 'Feld4',… ],
'Spalte2': ['Feld1', 'Feld2', 'Feld3', 'Feld4',… ]
var_df= pd.DataFrame(data_frame, column=['Column1', 'Column2])
drucken (variabel)
# Balkendiagramm zeichnen
var_df.Handlung.bar(x='Spalte1', y='Spalte2')
plt.Show()
Sie können den Plottyp auch wie folgt mithilfe des kind-Parameters definieren:
var_df.plot(x='Spalte1', y='Spalte2', kind='bar')Pandas DataFrames-Objekte haben die folgenden Plotmethoden zum Plotten:
- Streudiagramm: Handlung.streuen()
- Balkendarstellung: Handlung.Balken() , Plot.barh() wobei h für horizontale Balkendiagramme steht.
- Liniendarstellung: Handlung.Linie()
- Tortendarstellung: Handlung.Kuchen()
Wenn ein Benutzer nur die Methode plot() ohne Parameter verwendet, erstellt er das Standardliniendiagramm.
Anhand einiger Beispiele gehen wir nun auf einige wichtige Plottypen im Detail ein.
Streudiagramm in Pandas
In dieser Art der Darstellung haben wir die Beziehung zwischen zwei Variablen dargestellt. Nehmen wir ein Beispiel.
Beispiel
Zum Beispiel haben wir Korrelationsdaten zwischen zwei Variablen GDP_Growth und Oil_price. Um die Beziehung zwischen zwei Variablen darzustellen, haben wir den folgenden Code in unserem Quellcode-Editor ausgeführt:
Matplotlib importieren.pyplot als pltPandas als pd importieren
gdp_cal= pd.Datenrahmen(
'BIP_Wachstum': [6.fünfzehn.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Ölpreis': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame(gdp_cal, column=['Oil_Price', 'GDP_growth'])
drucken(df)
df.plot(x='Oil_Price', y='GDP_growth', kind = 'scatter', color= 'red')
plt.Show()
Liniendiagramme in Pandas Panda
Das Liniendiagramm ist eine grundlegende Art der Darstellung, bei der bestimmte Informationen in einer Datenpunktreihe angezeigt werden, die weiter durch Segmente von geraden Linien verbunden sind. Mit den Liniendiagrammen können Sie auch die Trends der Informationen über die Zeit anzeigen.
Beispiel
Im unten genannten Beispiel haben wir die Daten zur Inflationsrate des vergangenen Jahres genommen. Bereiten Sie zuerst die Daten vor und erstellen Sie dann DataFrame. Der folgende Quellcode zeichnet das Liniendiagramm der verfügbaren Daten:
Pandas als pd importierenMatplotlib importieren.pyplot als plt
infl_cal = 'Jahr': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(infl_cal, column=['Jahr', 'Infl_Rate'])
data_frame.plot(x='Jahr', y='Infl_Rate', kind='line')
plt.Show()
Im obigen Beispiel müssen Sie kind= 'line' für das Zeichnen von Liniendiagrammen setzen.
Methode 2# Plot verwenden.line()-Methode
Das obige Beispiel können Sie auch mit der folgenden Methode implementieren:
Pandas als pd importierenMatplotlib importieren.pyplot als plt
inf_cal = 'Jahr': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(inf_cal, column=['Inflation_Rate'], index=[2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.Handlung.Linie()
plt.title('Zusammenfassung der Inflationsrate der letzten 11 Jahre')
plt.ylabel('Inflation_Rate')
plt.xlabel('Jahr')
plt.Show()
Das folgende Liniendiagramm wird angezeigt, nachdem der obige Code ausgeführt wurde:
Balkendiagramm-Plot in Pandas
Das Balkendiagramm wird verwendet, um die kategorialen Daten darzustellen represent. Bei dieser Art von Plot werden die rechteckigen Balken mit unterschiedlichen Höhen basierend auf den gegebenen Informationen geplottet. Das Balkendiagramm kann in zwei verschiedenen horizontalen oder vertikalen Richtungen geplottet werden.
Beispiel
Im folgenden Beispiel haben wir die Alphabetisierungsrate mehrerer Länder genommen. DataFrames werden erstellt, in denen 'Country_Names' und 'literacy_Rate' die beiden Spalten eines DataFrame sind. Mit Pandas können Sie die Informationen in der Balkendiagrammform wie folgt darstellen:
Pandas als pd importierenMatplotlib importieren.pyplot als plt
lit_cal =
'Ländernamen': ['Pakistan', 'USA', 'China', 'Indien', 'UK', 'Österreich', 'Ägypten', 'Ukraine', 'Saudien', 'Australien',
'Malaysia'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
data_frame = pd.DataFrame(lit_cal, column=['Country_Names', 'litr_Rate'])
print(data_frame)
data_frame.Handlung.bar(x='Country_Names', y='litr_Rate')
plt.Show()
Sie können das obige Beispiel auch mit der folgenden Methode implementieren. Setzen Sie kind="bar" für das Plotten von Balkendiagrammen in dieser Zeile:
data_frame.plot(x='Country_Names', y='litr_Rate', kind='bar')plt.Show()
Zeichnen von horizontalen Balkendiagrammen
Sie können die Daten auch auf horizontalen Balken darstellen, indem Sie den folgenden Code ausführen:
Matplotlib importieren.pyplot als pltPandas als pd importieren
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame(data_chart, column=['litr_Rate'], index=['Pakistan', 'USA', 'China', 'India', 'UK', 'Österreich', 'Egypt', 'Ukraine', 'Saudiia' , 'Australien',
'Malaysia'])
df.Handlung.barh()
plt.title('Analphabetenrate in verschiedenen Ländern')
plt.ylabel('Country_Names')
plt.xlabel('litr_Rate')
plt.Show()
In df.Handlung.barh(), der barh wird für horizontales Plotten verwendet. Nachdem Sie den obigen Code ausgeführt haben, wird das folgende Balkendiagramm im Fenster angezeigt:
Kreisdiagramm-Plot in Pandas
Ein Kreisdiagramm stellt die Daten in einer kreisförmigen grafischen Form dar, in der die Daten basierend auf der angegebenen Menge in Segmenten angezeigt werden.
Beispiel
Im folgenden Beispiel haben wir die Informationen zu 'Earth_material' in verschiedenen Slices im Kreisdiagramm angezeigt displayed. Erstellen Sie zuerst den DataFrame und zeigen Sie dann mit den Pandas alle Details im Diagramm an.
Pandas als pd importierenMatplotlib importieren.pyplot als plt
material_per = 'Earth_Part': [71,18,7,4]
Datenrahmen = pd.DataFrame(material_per,columns=['Earth_Part'],index = ['Wasser','Mineral','Sand','Metalle'])
Datenrahmen.Handlung.pie(y='Earth_Part',figsize=(7, 7),autopct='%1.1f%%', Startwinkel=90)
plt.Show()
Der obige Quellcode zeichnet das Tortendiagramm der verfügbaren Daten:
Fazit
In diesem Artikel haben Sie gesehen, wie man DataFrames in Pandas Python plottet. Im obigen Artikel werden verschiedene Arten von Plotten durchgeführt. Zum Plotten weiterer Arten wie Box, Hexbin, Hist, Kde, Dichte, Fläche usw., Sie können den gleichen Quellcode verwenden, indem Sie einfach die Plotart ändern.