Cheat-Sheet für NumPy

NumPy wird häufig genutzt um Daten vorzubereiten für die Verarbeitung durch neuronale Netze.

1. Installation und Import von NumPy

pip install numpy
import numpy as np

2. Erstellen von Arrays

x = np.array([[1, 2, 3], [4, 5, 6]]) # 2D-Array erstellen

3. Normalisierung von Daten

x_normalized = x / np.max(x) # Werte auf [0,1] skalieren

4. Standardisierung (Z-Transformation)

x_standardized = (x - np.mean(x)) / np.std(x)

5. Reshape von Arrays

x_reshaped = x.reshape(-1, 1) # Umwandlung in ein Spaltenvektor

6. Erstellen von Zufallszahlen für Trainingsdaten

random_data = np.random.rand(100, 10) # 100x10 Matrix mit Zufallszahlen zwischen 0 und 1

7. Indizierung und Slicing

subset = x[:, :2] # Erste zwei Spalten auswählen

8. One-Hot-Encoding von Labels

y = np.array([0, 1, 2, 1]) y_one_hot = np.eye(np.max(y) + 1)[y] # One-Hot-Encoding mit Identitätsmatrix

9. Auffüllen von Arrays (Padding)

padded_array = np.pad(x, pad_width=1, mode='constant', constant_values=0) # Null-Rand hinzufügen

10. Mischen von Daten

np.random.shuffle(x) # Zeilen in zufälliger Reihenfolge anordnen

11. Splitten von Trainings- und Testdaten

split_ratio = 0.8 split_index = int(len(x) * split_ratio) 
x_train, x_test = x[:split_index], x[split_index:]

12. Berechnung von Mittelwert und Standardabweichung

mean_value = np.mean(x) std_value = np.std(x)

13. Elementweise mathematische Operationen

x_squared = np.square(x) # Quadrate der Elemente berechnen x_sqrt = np.sqrt(x) # Quadratwurzel berechnen

14. Filtern von Werten

filtered = x[x > 2] # Nur Werte größer als 2

15. Erzeugen von Sequenzen

sequence = np.linspace(0, 1, 10) # 10 Werte gleichmäßig zwischen 0 und 1 verteilen
Nach oben scrollen