Datenwissenschaft

So erstellen Sie Pandas DataFrame in Python?

So erstellen Sie Pandas DataFrame in Python?

Pandas DataFrame ist eine 2D (zweidimensional) kommentierte Datenstruktur, in der Daten in tabellarischer Form mit verschiedenen Zeilen und Spalten ausgerichtet sind. Zum besseren Verständnis verhält sich der DataFrame wie eine Kalkulationstabelle, die drei verschiedene Komponenten enthält: Index, Spalten und Daten. Pandas DataFrames sind die gebräuchlichste Methode, um die Objekte des Pandas zu verwenden.

Pandas DataFrames können mit verschiedenen Methoden erstellt werden. Dieser Artikel erklärt alle möglichen Methoden, mit denen Sie Pandas DataFrame in Python erstellen können. Wir haben alle Beispiele mit dem pycharm-Tool ausgeführt. Beginnen wir die Implementierung jeder Methode nacheinander.

Grundsyntax

Befolgen Sie beim Erstellen von DataFrames in Pandas Python die folgende Syntax:

pd.DataFrame(Df_data)

Beispiel:Lass es uns mit einem Beispiel erklären. In diesem Fall haben wir die Daten der Schülernamen und Prozentsätze in einer 'Students_Data'-Variable gespeichert stored. Mit dem pd.DataFrame (), wir haben einen DataFrame erstellt, um das Ergebnis des Schülers anzuzeigen.

Pandas als pd importieren
Schüler_Daten =
'Name':['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Prozentsatz':[90,80,70,85]
Ergebnis = pd.DataFrame(Studenten_Daten)
drucken (Ergebnis)

Methoden zum Erstellen von Pandas DataFrames

Pandas DataFrames können mit den verschiedenen Methoden erstellt werden, die wir im Rest des Artikels besprechen werden. Wir drucken das Kursergebnis des Studenten in Form von DataFrames. Mit einer der folgenden Methoden können Sie also ähnliche DataFrames erstellen, die in der folgenden Abbildung dargestellt sind:

Methode # 01: Pandas DataFrame aus dem Verzeichnis der Listen erstellen

Im folgenden Beispiel werden DataFrames aus den Wörterbüchern von Listen erstellt, die sich auf die Kursergebnisse der Kursteilnehmer beziehen. Importieren Sie zuerst die Bibliothek eines Pandas und erstellen Sie dann ein Wörterbuch mit Listen. Die dict-Schlüssel repräsentieren die Spaltennamen wie "Student_Name", "Course_Title" und "GPA". Listen stellen die Daten oder den Inhalt der Spalte dar. Die Variable 'dictionary_lists' enthält die Daten von Schülern, die der Variable 'df1' weiter zugeordnet werden. Drucken Sie mit der print-Anweisung den gesamten Inhalt von DataFrames.

Beispiel:

# Bibliotheken für Pandas und Numpy importieren
Pandas als pd importieren
# Pandas Bibliothek importieren
Pandas als pd importieren
# Erstellen Sie ein Wörterbuch der Liste
Wörterbuchlisten =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Kurs_Titel': ['SQA','SRE','IT-Grundlagen', 'Künstliche Intelligenz'],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Erstellen Sie den DataFrame
dframe = pd.DataFrame(dictionary_lists)
drucken (dframe)

Nach dem Ausführen des obigen Codes wird die folgende Ausgabe angezeigt:

Methode # 02: Pandas DataFrame aus dem Wörterbuch des NumPy-Arrays erstellen

Der DataFrame kann aus dem Diktat von Array/Liste erstellt werden. Dazu muss die Länge allen Narrays entsprechen. Wenn ein Index übergeben wird, sollte die Indexlänge gleich der Länge des Arrays sein. Wenn kein Index übergeben wird, ist in diesem Fall der Standardindex ein Bereich (n). Hier steht n für die Länge des Arrays.

Beispiel:

numpy als np importieren
# Erstellen Sie ein numpy-Array
nparray = np.Array (
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'IT-Grundlagen','Künstliche Intelligenz'],
[3.1, 3.3, 2.8, 4.0]])
# Erstellen Sie ein Wörterbuch von nparray
Dictionary_of_nparray =
'Student_Name': nparray[0],
'Kurs_Titel': nparray[1],
'GPA': nparray[2]
# Erstellen Sie den DataFrame
dframe = pd.DataFrame(dictionary_of_nparray)
drucken (dframe)

Methode # 03: Pandas DataFrame mit der Liste der Listen erstellen

Im folgenden Code steht jede Zeile für eine einzelne Zeile.

Beispiel:

# Bibliothek importieren Pandas pd
Pandas als pd importieren
# Erstellen Sie eine Liste mit Listen
group_lists = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'IT-Grundlagen', 2.8],
['Sana', 'Künstliche Intelligenz', 4.0]]
# Erstellen Sie den DataFrame
dframe = pd.DataFrame(group_lists, column = ['Student_Name', 'Course_Title', 'GPA'])
drucken (dframe)

Methode # 04: Pandas DataFrame mit der Liste des Wörterbuchs erstellen

Im folgenden Code stellt jedes Wörterbuch eine einzelne Zeile und Schlüssel dar, die die Spaltennamen darstellen.

Beispiel:

# Bibliotheks-Pandas importieren
Pandas als pd importieren
# Erstellen Sie eine Liste mit Wörterbüchern
dict_list = [
'Student_Name': 'Samreena', 'Kurs_Titel': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Kurs_Titel': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Kurs_Titel': 'IT-Grundlagen', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Künstliche Intelligenz', 'GPA': 4.0]
# Erstellen Sie den DataFrame
dframe = pd.DataFrame(dict_list)
drucken (dframe)

Methode # 05: Pandas-Datenrahmen aus dem Diktat der Pandas-Serie erstellen

Die dict-Tasten repräsentieren die Namen von Spalten und jede Serie repräsentiert den Spalteninhalt. In den folgenden Codezeilen haben wir drei Arten von Serien genommen: Name_series, Course_series und GPA_series.

Beispiel:

# Bibliotheks-Pandas importieren
Pandas als pd importieren
# Erstellen Sie die Serie von Schülernamen
Name_series = pd.Serie(['Samreena', 'Raees', 'Sara', 'Sana'])
Course_series = pd.Serie(['SQA', 'SRE', 'IT-Grundlagen', 'Künstliche Intelligenz'])
GPA_series = pd.Serie([3.1, 3.3, 2.8, 4.0])
# Erstellen Sie ein Serienwörterbuch
Wörterbuch_von_nparray
\
'] = 'Name': Name_series, 'Age': Course_series, 'Department': GPA_series
# DataFrame-Erstellung
dframe = pd.DataFrame(dictionary_of_nparray)
drucken (dframe)

Methode # 06: Pandas DataFrame erstellen, indem Sie die Funktion zip() verwenden.

Verschiedene Listen können über die Funktion list(zip()) zusammengeführt werden. Im folgenden Beispiel werden Pandas DataFrame durch den Aufruf von pd . erstellt.DataFrame()-Funktion. Es werden drei verschiedene Listen erstellt, die in Form von Tupeln zusammengeführt werden.

Beispiel:

Pandas als pd importieren
# Liste1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# Liste2
Course_Title = ['SQA', 'SRE', 'IT-Grundlagen', 'Künstliche Intelligenz']
# Liste3
GPA = [3.1, 3.3, 2.8, 4.0]
# Nehmen Sie die Liste der Tupel aus drei Listen weiter und führen Sie sie mit zip() zusammen.
tuples = list(zip(Student_Name, Course_Title, GPA))
# Weisen Sie Tupeln Datenwerte zu.
Tupel
# Konvertieren der Tupelliste in Pandas Dataframe.
dframe = pd.DataFrame(tuples, column=['Student_Name', 'Course_Title', 'GPA'])
# Daten drucken.
drucken (dframe)

Fazit

Mit den oben genannten Methoden können Sie Pandas DataFrames in Python erstellen. Wir haben einen Kurs-GPA eines Studenten gedruckt, indem wir Pandas DataFrames erstellt haben. Hoffentlich erhalten Sie nützliche Ergebnisse, nachdem Sie die oben genannten Beispiele ausgeführt haben. Alle Sendungen sind zum besseren Verständnis gut kommentiert. Wenn Sie weitere Möglichkeiten haben, Pandas DataFrames zu erstellen, zögern Sie nicht, diese mit uns zu teilen. Danke für das Lesen dieses Tutorials.

So erstellen Sie einen neuen Sudo-Benutzer unter Debian 10 Buster
Sie können jedem vorhandenen Benutzer sudo-Rechte erteilen, indem Sie ihn zur sudo-Gruppe hinzufügen. Mit dem folgenden Befehl erstelle ich den Benutz...
Wie man ein Debian 10-System richtig herunterfährt oder neu startet Re
Obwohl der Netzschalter an Ihrem Computer die bequemste Möglichkeit zum Ausschalten oder Neustarten Ihres Systems zu sein scheint, ist dies sicherlich...
Installieren Sie Anaconda Python unter Debian 10
Anaconda ist eine Python-Distribution, die für Data Science, Machine Learning, Deep Learning usw. entwickelt wurde.  In diesem Artikel zeige ich Ihnen...