NumPy wird häufig genutzt um Daten vorzubereiten für die Verarbeitung durch neuronale Netze.
1. Installation und Import von NumPy
pip install numpy
import numpy as np
2. Erstellen von Arrays
x = np.array([[1, 2, 3], [4, 5, 6]]) # 2D-Array erstellen
3. Normalisierung von Daten
x_normalized = x / np.max(x) # Werte auf [0,1] skalieren
4. Standardisierung (Z-Transformation)
x_standardized = (x - np.mean(x)) / np.std(x)
5. Reshape von Arrays
x_reshaped = x.reshape(-1, 1) # Umwandlung in ein Spaltenvektor
6. Erstellen von Zufallszahlen für Trainingsdaten
random_data = np.random.rand(100, 10) # 100x10 Matrix mit Zufallszahlen zwischen 0 und 1
7. Indizierung und Slicing
subset = x[:, :2] # Erste zwei Spalten auswählen
8. One-Hot-Encoding von Labels
y = np.array([0, 1, 2, 1]) y_one_hot = np.eye(np.max(y) + 1)[y] # One-Hot-Encoding mit Identitätsmatrix
9. Auffüllen von Arrays (Padding)
padded_array = np.pad(x, pad_width=1, mode='constant', constant_values=0) # Null-Rand hinzufügen
10. Mischen von Daten
np.random.shuffle(x) # Zeilen in zufälliger Reihenfolge anordnen
11. Splitten von Trainings- und Testdaten
split_ratio = 0.8 split_index = int(len(x) * split_ratio)
x_train, x_test = x[:split_index], x[split_index:]
12. Berechnung von Mittelwert und Standardabweichung
mean_value = np.mean(x) std_value = np.std(x)
13. Elementweise mathematische Operationen
x_squared = np.square(x) # Quadrate der Elemente berechnen x_sqrt = np.sqrt(x) # Quadratwurzel berechnen
14. Filtern von Werten
filtered = x[x > 2] # Nur Werte größer als 2
15. Erzeugen von Sequenzen
sequence = np.linspace(0, 1, 10) # 10 Werte gleichmäßig zwischen 0 und 1 verteilen