Integrierte Datensätze
Tensorflow/Keras bietet eine ganze Reihe von unterschiedlichen Datensätzen an, die man für eigene Experimente nutzen kann (siehe auch https://keras.io/api/datasets/). Diese können wir folgt importiert werden:
pip install tensorflow-datasets
import tensorflow_datasets as tfds
# Zeigt alle verfügbaren Datensätze in tfds
print(tfds.list_builders())
Computer Vision
Stein, Schere, Papier (CGI):
https://laurencemoroney.com/datasets.html
Pferde, Menschen (CGI):
https://laurencemoroney.com/datasets.html
Mehr als 600 verschiedene Datensätze zum Experimentieren:
https://archive.ics.uci.edu/datasets
Alphabet als Handzeichen
https://www.kaggle.com/datasets/datamunge/sign-language-mnist
Natural Language Processing (NLP)
Artikel mit Überschriften und Inhalt sowie einem „Sarkamus ja/nein“-Flag
https://www.kaggle.com/datasets/rmisra/news-headlines-dataset-for-sarcasm-detection
IMDB Filmreviews
https://ai.stanford.edu/~amaas/data/sentiment/
BBC News Artikel
https://www.kaggle.com/c/learn-ai-bbc/overview
Anderes
Energieeffizenz von Häusern
https://archive.ics.uci.edu/dataset/242/energy+efficiency