Review Note

Last Update: 05/11/2023 08:52 AM

Current Deck: Semester 6::Neue Konzepte::Data Science

New Card (Unpublished)

Currently Published Content


Vorderseite
Rückseite

No published tags.

Pending Suggestions


Field Change Suggestions:
Vorderseite
Commit #2709
Erkläre das Daten Verständnis im CRISP-DM Data Mining Prozess
Rückseite
Commit #2709
  • Daten sind das Rohmaterial für die Lösung von Geschäftsproblemen.
  • Es ist wichtig, die Stärken und Grenzen von Daten zu verstehen, da sie möglicherweise nicht genau mit dem Problem übereinstimmen.
Mögliche Datenprobleme:
  • Historische Daten können für das Geschäftsproblem irellevante Zwecke gesammelt worden sein
  • Die Kosten und Nutzen von Daten können variieren und müssen abgeschätzt werden
  • Die Zusammenführung von Daten aus verschiedenen Quellen kann aufgrund von Unterschieden in der Datenqualität und -struktur zusätzlichen Aufwand erfordern.
  • Als Reaktion auf das Datenverständnis können sich die Lösungswege ändern
  • Unterschiedliche Geschäftsprobleme können unterschiedliche Data-Mining-Aufgaben erfordern, und es kann notwendig sein, deren Lösungen zu kombinieren.
Beispiele:
  • Die Erkennung von Betrug ist ein schwieriges Problem, und verschiedene Arten von Betrug erfordern unterschiedliche Ansätze.
  • Kreditkartenbetrug kann mit überwachten Data-Mining-Techniken angegangen werden, da zuverlässige Kennzeichnungen für betrügerische und rechtmäßige Transaktionen verfügbar sind.
  • Betrug im Bereich der medizinischen Versorgung hingegen erfordert unüberwachte Ansätze wie Profiling, Clustering, Anomalieerkennung und Co-Occurrence-Grouping, da es keine zuverlässige Zielvariable gibt, die auf Betrug hinweist.