Datensätze für eigene KNN-Experimente

Integrierte Datensätze

Tensorflow/Keras bietet eine ganze Reihe von unterschiedlichen Datensätzen an, die man für eigene Experimente nutzen kann (siehe auch https://keras.io/api/datasets/). Diese können wir folgt importiert werden:

pip install tensorflow-datasets
import tensorflow_datasets as tfds

# Zeigt alle verfügbaren Datensätze in tfds
print(tfds.list_builders())

Computer Vision

Stein, Schere, Papier (CGI):
https://laurencemoroney.com/datasets.html

Pferde, Menschen (CGI):
https://laurencemoroney.com/datasets.html

Mehr als 600 verschiedene Datensätze zum Experimentieren:
https://archive.ics.uci.edu/datasets

Alphabet als Handzeichen
https://www.kaggle.com/datasets/datamunge/sign-language-mnist

Natural Language Processing (NLP)

Artikel mit Überschriften und Inhalt sowie einem „Sarkamus ja/nein“-Flag
https://www.kaggle.com/datasets/rmisra/news-headlines-dataset-for-sarcasm-detection

IMDB Filmreviews
https://ai.stanford.edu/~amaas/data/sentiment/

BBC News Artikel
https://www.kaggle.com/c/learn-ai-bbc/overview

Anderes

Energieeffizenz von Häusern
https://archive.ics.uci.edu/dataset/242/energy+efficiency

Nach oben scrollen