Erste Anwendungen künstlicher Intelligenz im Dienst der Sicherheit
Das Phänomen Deep Learning bleibt ein spannendes Thema in der IT-Branche und hat jetzt auch erste Anwendungen in der Sicherheitstechnik z.B. in der Videoanalytik. Mittlerweile hat ...
Das Phänomen „Deep Learning“ bleibt ein spannendes Thema in der IT-Branche und hat jetzt auch erste Anwendungen in der Sicherheitstechnik z.B. in der Videoanalytik. Mittlerweile hat die Leistungsfähigkeit von Rechnern ein Niveau erreicht, das einen sinnvollen Einsatz ermöglicht. Wenn es um die Anwendung dieser Technologie in der Überwachungsbranche und darüber hinausgeht, war Hikvision schon immer an vorderster Front. Das Unternehmen hat zudem bereits erste Produkte auf den Markt gebracht, in denen eine leistungsfähige künstliche Intelligenz (KI) zum Einsatz kommt.
Für das Konzept des Deep Learning stand die Funktionsweise des menschlichen Gehirns Pate. Man könnte das Gehirn als hoch komplexes Deep-Learning-Modell betrachten. Die neuronalen Netzwerke des Gehirns bestehen aus Milliarden miteinander verbundener Nervenzellen. Deren Struktur wird bei Deep Learning nachgeahmt. Dabei werden in mehrschichtigen Netzen Daten gesammelt und analysiert, um anschließend anhand der Analyseergebnisse entsprechende Aktionen durchzuführen.
In den letzten zwei Jahren hat die Technologie unter anderem im Bereich Spracherkennung, Interpretation von Bildern (Computer Vision) und sprachaktivierte Übersetzung enorme Fortschritte gemacht. So hat sie im Bereich der Gesichtserkennung und Bildklassifizierung sogar menschliche Fähigkeiten übertroffen. Aus diesem Grunde wird sie in der Überwachungsbranche und vor allem bei der Videoüberwachung sehr geschätzt.
Ihre Fähigkeit zur Erkennung von Personen – beispielsweise die Unterscheidung von Mensch und Tier – macht die Technologie angesichts einer Fehlalarmquote, die laut den Statistiken von Polizei und Feuerwehr zwischen 94 % und 99 % liegt, im Arsenal der Sicherheitstechniken besonders wertvoll.
Funktionsweise von Deep Learning
Deep Learning unterscheidet sich deutlich von anderen Algorithmen. Anhand der folgenden Aspekte wird ersichtlich, wie es die Unzulänglichkeiten herkömmlicher Algorithmen hinter sich lässt.
Das algorithmische Modell für Deep Learning besitzt im Vergleich zu herkömmlichen Algorithmen eine weitaus tiefgreifendere Struktur. In Einzelfällen umfasst sie mehr als einhundert Ebenen und ermöglicht damit die Verarbeitung einer großen Datenmenge in komplexen Klassifikationen. Das Deep Learning ähnelt sehr dem menschlichen Lernprozess und wendet ein Abstraktionsverfahren an, bei dem die Daten Ebene für Ebene verarbeitet werden. Auf jeder Ebene findet eine andere „Gewichtung“ statt und diese spiegelt wider, was bereits über die „Komponenten“ der Bilder gelernt wurde. Je höher die Ebene angesiedelt ist, desto spezifischer die Komponenten. Genau wie beim menschlichen Gehirn durchläuft das ursprüngliche Signal beim Deep Learning verschiedene Verarbeitungsebenen. Im nächsten Schritt entwickelt sich aus einem teilweisen, oberflächlichen Verständnis eine allgemeine, umfassende Abstraktion wodurch Deep Learning das Objekt wahrnehmen kann.
Für Deep Learning ist kein manueller Eingriff mehr erforderlich. Stattdessen extrahiert ein Computer selbstständig die entsprechenden Merkmale. Auf diese Weise kann das System möglichst viele Merkmale des Ziels extrahieren, darunter auch abstrakte Eigenschaften, die unmöglich oder nur sehr schwer zu beschreiben sind. Je höher die Anzahl dieser Merkmale, desto genauer die Erkennung und Klassifizierung. Zu den unmittelbaren Vorteilen der Deep-Learning-Algorithmen zählen eine mit menschlichen Fähigkeiten vergleichbare oder sogar höhere Genauigkeit bei der Mustererkennung, eine sehr hohe Unempfindlichkeit gegenüber Störungen sowie die Fähigkeit tausende Merkmale zu erkennen und zu klassifizieren.
Probleme vorhandener Systeme
Herkömmliche Überwachungssysteme bieten meist nur die Erkennung sich bewegender Ziele, jedoch keine weitergehende Analyse. Selbst intelligente IP-Kameras können einer Form jeweils nur einzelne Punkte zuordnen, wodurch die Kalibrierung mancher Merkmale (z. B. Stirn oder Wange) schwierig wird und die Präzision sinkt.
So werden für den Perimeterschutz meist andere Technologien eingesetzt, um eine umfassende Sicherheit zu gewährleisten. Sie alle besitzen jedoch gewisse Nachteile. Infrarotdetektoren lassen sich beispielsweise „überspringen“, sind jedoch auch anfällig für Fehlalarme, die von Tieren ausgelöst werden. Elektrozäune können eine Gefahrenquelle darstellen und sind in bestimmten Bereichen nicht einsetzbar. Zudem sind manche dieser Lösungen durchaus teuer und nur schwer zu installieren.
Da Tiere, Licht und Objekte wie Blätter einen Fehlalarm auslösen können, ist die Fähigkeit zur Identifizierung menschlicher Umrisse eine deutliche Verbesserung für die Genauigkeit der Videoanalyse-Funktionen für den Perimeterschutz. Für Endbenutzer sind häufige Fehlalarme immer ein Ärgernis, da jeder einzelne überprüft werden muss. Dies verzögert die Reaktion und beeinträchtigt die Effizienz.
Weniger Fehlararme, bessere Akzeptanz
Nehmen wir als Beispiel ein relativ ruhiges Szenario bei Nacht, mit nur wenig Auto- und Fußgängerverkehr. Selbst unter diesen Umständen können in einer Nacht bis zu 50 Fehlalarme auftreten. In unserem Beispiel gehen wir davon aus, dass die Überprüfung eines Fehlalarms zwei bis drei Minuten dauert und dass nur drei der 50 Alarme näher untersucht werden müssen (jeweils 15 Minuten). Entweder muss ein Mitarbeiter des Wachpersonals das System kontrollieren und sich die Aufzeichnung des Alarms ansehen oder es wird jemand zur Anlage geschickt, um sich dort umzusehen und zu überprüfen, ob sich jemand unerlaubt Zugang verschafft hat. In den meisten Unternehmen muss dies schriftlich festgehalten werden, was den Zeitaufwand für die Bearbeitung des Fehlalarms zusätzlich erhöht. Insgesamt gingen in einem solchen Szenario pro Nacht mehr als zwei Stunden für die 50 Fehlalarme verloren.
Mit Deep Learning verändert sich die Situation jedoch grundlegend. Dank einer großen Menge qualitativ hochwertiger Daten von Überwachungskameras und aus anderen Quellen, beispielsweise dem Hikvision Research Institute, sowie durch die Arbeit von mehr als 100 Teammitgliedern für die Datenbereinigung und zur Kennzeichnung von Videobildern konnten wir Beispieldaten mit Millionen von Kategorien innerhalb der Branche zusammentragen. Dieses gewaltige Volumen an Schulungsdaten für die Videoüberwachung ermöglicht eine stetige Verbesserung der Präzision von Erkennungsmodellen für Menschen, Fahrzeuge und Objekte.
Mithilfe einer Reihe von Experimenten konnte die Erkennungsgenauigkeit der Lösungen mit dem Deep-Learning-Algorithmus um 38 Prozent verbessert werden. Auf unser vorheriges Beispiel bezogen ließe sich somit jede Nacht fast eine Stunde einsparen. Damit besitzt die Deep-Learning-Technologie einen großen Vorteil als Lösung für den Perimeterschutz, da sie eine präzisere TripWire-Funktion, Intrusion Detection und Bereichseingangs- / Bereichsausgangserkennung ermöglicht.
Sonstige Einsatzmöglichkeiten
Die Deep-Learning-Technologie erweist sich auch über die traditionellen Einsatzgebiete in der Überwachungsbranche hinaus als vorteilhaft. So lässt sich beispielsweise anhand der Bewegungsprofile von Personen erkennen, ob sie sich verdächtig lange in einem Bereich aufhalten und in Zukunft eventuell eine Bedrohung darstellen. Als Grenzwert ließe sich ein Bewegungsradius von fünf Metern oder eine zehnsekündige Verweildauer am gleichen Ort festlegen. Wird durch das Verhalten der Person einer der beiden Grenzwerte überschritten, könnte das System einen Alarm auslösen. Die Lösung überwacht die Person und überprüft anhand eines Datenbankvergleichs, ob hier ein bekanntes Muster vorliegt.
Eine weitere denkbare Anwendung wäre ein Szenario, in dem Stürze eine Bedrohung darstellen können, beispielsweise in einem Pflegeheim für Senioren. Bei einem Höhengrenzwert von 0,5 Metern und einer Dauer von 10 Sekunden könnte die Lösung beispielsweise erkennen, ob eine Person stürzt (ihre Position verändert sich auf eine Höhe von unterhalb 0,5 Metern) und sich dabei möglicherweise verletzt hat (falls sie länger als 10 Sekunden am Boden liegen bleibt). Anhand der festgelegten Parameter führt die Lösung einen Vergleich mit der Datenbank durch und löst gegebenenfalls einen Alarm aus.
Fazit
Angesichts dieser Merkmale und Vorteile lässt sich gut erkennen, dass sich die Deep-Learning-Technologie für viele weitere intelligente Anwendungen eignet.
Im Forschungs- und Entwicklungszentrum von Hikvision arbeiten rund 10.000 Mitarbeiter kontinuierlich an neuen Möglichkeiten für Überwachungslösungen, die dem Kunden noch mehr Vorteile bieten. Das Potenzial der künstlichen Intelligenz ist gewaltig und Hikvision prüft ständig neue Möglichkeiten für den Einsatz dieser spannenden Technologie in der Sicherheitsbranche und darüber hinaus.