Review Note
Last Update: 05/11/2023 09:07 AM
Current Deck: Semester 6::Neue Konzepte::Data Science
New Card (Unpublished)Currently Published Content
Vorderseite
Rückseite
No published tags.
Pending Suggestions
Field Change Suggestions:
Vorderseite
Commit #2710
Erkläre die Daten-Bereitstellung im CRISP-DM Data Mining Prozess
Rückseite
Commit #2710Datenerhebung
- Daten sollten unbiased sein
- Um genug Daten zu erheben können sich Branchen zusammenschließen
Datenanalyse
- Analysemethoden erfordern bestimmte Datenformate um bessere Ergebnisse zu erzielen.
- Datenaufbereitungstechniken: Konvertierung von Daten in ein Tabellenformat / Entfernen oder Ableiten fehlender Werte / Konvertierung von Daten in verschiedene Typen.
- Normalisierung oder Skalierung von numerische Werten für Vergleichszwecke
- Herausforderung: "Lecks": Informationen, die in historischen Daten erscheinen, aber zum Zeitpunkt der Entscheidungsfindung nicht verfügbar ist => kann zu ungenauen Ergebnissen führen