Beschreibung
Ausreißer-Erkennung mit einem neuen hybriden Ansatz auf gemischten Datensätzen
Data Mining ist ein Prozess, bei dem versteckte und nützliche Informationen aus den Daten extrahiert werden. Die Erkennung von Ausreißern ist ein grundlegender Teil des Data Mining und genießt in letzter Zeit große Aufmerksamkeit in der Forschungsgemeinschaft. Ein Ausreißer ist ein Datenobjekt, das von anderen Beobachtungen abweicht. Die Erkennung von Ausreißern hat wichtige Anwendungen bei der Datenbereinigung sowie beim Mining von abnormalen Punkten für die Erkennung von Betrug, Börsenanalyse, Intrusion Detection, Marketing, Netzwerksensoren. Die meisten der bestehenden Forschungsbemühungen konzentrieren sich auf numerische Datensätze, die nicht direkt auf kategorische Datensätze anwendbar sind, bei denen es wenig Sinn macht, die Daten zu ordnen und Abstände zwischen Datenpunkten zu berechnen. Darüber hinaus benötigen einige der aktuellen Ausreißer-Erkennungsmethoden quadratische Zeit in Bezug auf die Größe des Datensatzes und benötigen in der Regel mehrere Scans der Daten; diese Eigenschaften sind unerwünscht, wenn die Datensätze groß sind. In dieser Arbeit wird ein Ansatz zur Ausreißererkennung fokussiert und experimentell evaluiert, der auf kategoriale Datensätze ausgerichtet ist. Außerdem handelt es sich um einen einfachen, skalierbaren und effizienten Algorithmus zur Ausreißererkennung, der den Vorteil hat, Ausreißer in kategorialen oder numerischen Datensätzen zu entdecken, indem er per
EAN: 9786203604948