Methoden, die mehrere Variablen aus großen Datensets zu Gruppen (sog. features) zusammenfassen. Dadurch nimmt die zu verarbeitende Datenmenge ab, ohne dass relevante Informationen verloren gehen. Wird z.B. beim unüberwachten Lernen, in der Computerlinguistik (Natural Language Processing) oder bei der Bilderkennung (Image Processing) zur Erkennung von Mustern in den Daten verwendet.