Review Note
Last Update: 05/11/2023 08:52 AM
Current Deck: Semester 6::Neue Konzepte::Data Science
New Card (Unpublished)Currently Published Content
Vorderseite
Rückseite
No published tags.
Pending Suggestions
Field Change Suggestions:
Vorderseite
Commit #2709
Erkläre das Daten Verständnis im CRISP-DM Data Mining Prozess
Rückseite
Commit #2709- Daten sind das Rohmaterial für die Lösung von Geschäftsproblemen.
- Es ist wichtig, die Stärken und Grenzen von Daten zu verstehen, da sie möglicherweise nicht genau mit dem Problem übereinstimmen.
Mögliche Datenprobleme:
- Historische Daten können für das Geschäftsproblem irellevante Zwecke gesammelt worden sein
- Die Kosten und Nutzen von Daten können variieren und müssen abgeschätzt werden
- Die Zusammenführung von Daten aus verschiedenen Quellen kann aufgrund von Unterschieden in der Datenqualität und -struktur zusätzlichen Aufwand erfordern.
- Als Reaktion auf das Datenverständnis können sich die Lösungswege ändern
- Unterschiedliche Geschäftsprobleme können unterschiedliche Data-Mining-Aufgaben erfordern, und es kann notwendig sein, deren Lösungen zu kombinieren.
- Die Erkennung von Betrug ist ein schwieriges Problem, und verschiedene Arten von Betrug erfordern unterschiedliche Ansätze.
- Kreditkartenbetrug kann mit überwachten Data-Mining-Techniken angegangen werden, da zuverlässige Kennzeichnungen für betrügerische und rechtmäßige Transaktionen verfügbar sind.
- Betrug im Bereich der medizinischen Versorgung hingegen erfordert unüberwachte Ansätze wie Profiling, Clustering, Anomalieerkennung und Co-Occurrence-Grouping, da es keine zuverlässige Zielvariable gibt, die auf Betrug hinweist.