Individuelle ProjektpreiseÜber 25 Jahre ErfahrungPersönlicher KontaktTrusted Advisor
BitInfo logo

Rufen Sie uns kostenlos an

0800 - 248 46 36
JETZT BERATEN LASSEN

Christian Wegener

28.05.2018

Lesezeit: 10 min

Data Analytics wird durch NLP verändert

Data Analytics wird durch NLP verändert

Die Datenmengen auf der Welt werden immer größer. Es fehlt allerdings an effizienten Möglichkeiten die Datenberge abzuarbeiten und zu analysieren. Natural Language Processing (NLP) ist ein sich immer weiter entwickelnder Ansatz, um die Data Analytics zu verbessern.

Die großen Datenmengen entstehen vor allem durch das Anwachsen von digitaler Kommunikation. Diese Daten sind dezentral verteilt. Einerseits liegen sie auf internen Speichersystemen und beinhalten Informationen bei Unternehmen über Kunden, Zahlungen, Transaktionsdaten oder andere Dokumente. Andererseits gibt es externe Speicherorte wie Open-Source-Informationen oder Social Media. Bei diesem Teil von Big Data handelt es sich fast ausschließlich um Text in natürlicher Sprache. Allerdings fallen Daten im Audioformat ebenfalls in dieses Gebiet, denn auch hierbei handelt es sich um natürliche Sprache.

Diese riesigen Mengen können mit einem Tool wie NLP besser nutzbar gemacht werden. Mit NLP ist es für Computer möglich Text zu lesen, zu sprechen, zu interpretieren und abzuschätzen welche Teile relevant und wie sie verbunden sind.

Zunächst ist es wichtig zu verstehen, was NLP überhaupt bedeutet. Die Abkürzung steht in der IT-Welt für Natural Language Processing. Allerdings gibt auch die Bedeutung Neuro-Linguistic Programming. Dieser Ansatz kommt aus der Psychotherapie und wird seit den 1970er-Jahren diskutiert. Es geht dabei nicht um das Programmieren von Code, sondern um ein Modell, dass neurologische Vorgänge, Sprachhandlungen und Verhaltensweisen kombiniert.

Im weitesten Sinne unternimmt Natural Language Processing einen ähnlichen Versuch, wenn auch mit einem anderen Ziel. Natural Language Processing ist jene Disziplin, die versucht natürliche Sprachen für Maschinen verfügbar und verstehbar zu machen.

Wenn es darum geht Big Data zu analysieren, eignet sich NLP hervorragend, um eine Kommunikation zwischen dem Anwender und dem Gerät zu verbessern. Dabei ist es mit NLP möglich die großen Datenmengen zu strukturieren oder kategorisieren oder Verbindungen und Trends festzustellen.

Darum geht es bei Natural Language Processing

Natural Language Processing kommt bereits auf vielen Gebieten zum Einsatz. Bekannte Anwendungen für Sprachsteuerung heißen Siri, Cortana, Alexa oder Google Assistant und suchen preisgünstige Flugverbindungen, buchen Bahn-Tickets, können Befehle auf den Geräten ausführen und bald sogar Anrufe tätigen. Die Anwendungsmöglichkeiten von Natural Language Processing sind vielfältig und keineswegs nur auf diese Beispiele beschränkt. Zum Beispiel wird NLP bei automatischen Kundengesprächen am Telefon verwendet, wo Chatbots zum Einsatz kommen. Bei der Deutschen Kreditbank können sich Kunden vom Bot Herbie über Kredite bis zu einer Höhe von 50000 Euro beraten lassen.

Insgesamt ist NLP ein wichtiges Teilgebiet bei der Mensch-Maschinen-Interaktion und kann dabei behilflich sein, dass sich beide besser verstehen. Die Computersprache für die meisten Menschen unverständlich und der Computer spricht weder Spanisch, Englisch oder Chinesisch noch eine andere natürliche Sprache.

Kommunikation zwischen Mensch und Maschine

Um das Ziel zu erreichen, dass sich Mensch und Maschine verstehen, bedient sich NLP bei Methoden des Machine Learning, Deep Learning, künstlicher Intelligenz und der Statistik. Es gibt viele verschiedene Ansätze, wie die Performance der Maschinen verbessert werden kann. Dies wird dadurch erschwert, dass sich Text- und Sprachdaten sehr stark voneinander unterscheiden.

Eine Basis-NLP führt verschiedene Aufgaben durch, um Text oder Sprache für die Maschine verständlich zu machen. Die Aufgaben umfassen das Setzen von Tokens, Parsing, also des Zerteilens der Daten, Part-of-Speech-Tagging, Spracherkennung und Identifikation von semantischen Beziehungen.

Die Maschine übersetzt einen Text in Computersprache, teilt den Text in sinnvolle Teile, wie Morphe oder Phone, und analysiert diese Teile hinsichtlich Sprache und Inhalt. Dazu erkennt die Maschine Beziehungen zwischen den Teilen und versucht nachzuvollziehen, wie diese Teile zusammenpassen und einen Sinn ergeben.

Die Aufgaben, die mit den grundlegenden Methoden von Natural Language Processing erledigt werden, sind sehr zahlreich. Dazu zählen Content-Kategorisierungen, Themenerfassung und Themenmodellierung, kontextuelle Extraktion, Stimmungsanalyse, Speech-to-Text und Text-to-Speech, Dokumenten-Zusammenfassung und Maschinenübersetzung.

In allen Fällen ist es das Ziel einen rohen, unbearbeiteten Input mit linguistischen Ansätzen und Algorithmen zu transformieren und den Text derart anzureichern, dass er von einem höheren Wert ist.

NLP und Data Analytics

Die möglichen Einsatzgebiete für NLP bei der Datenanalyse sind ebenfalls enorm zahlreich. Denn Datenanalyse von Texte ist in sehr vielen Branchen ein häufig genutztes Werkzeug. Sogenannte Textanalyse spielt im Finanz- und Versicherungswesen, in den Medien, im Rechtsraum und in der Industrie, aber auch bei öffentlichen Institutionen eine wichtige Rolle.

Eine typische Anwendung für Textanalyse im Finanzwesen fokussiert sich auf Compliance und Betrugsprävention. Banken müssen alle elektronische Kommunikation monitoren, um die Risiken zu minimieren. Dadurch wollen sie verhindern, dass Marktmanipulation, Betrugskonten, Anti-Trust oder illegale politische Gelder vorkommen. Außerdem sollen die privaten Daten der Nutzer besser geschützt werden. In diesem Fall wird NLP verwendet, um zu erfassen, dass Compliance-Regeln eingehalten wurden und ein Betrug auszuschließen ist. Weiterhin versuchen Banken mittels NLP Geldwäsche zu bekämpfen. Dabei wird allerdings lediglich der Verwendungszweck mit NLP analysiert.

Im Versicherungssektor sind Rechnungen, Call-Center-Anrufe oder Kundenbriefe an der Tagesordnung. Und er benötigt viel Zeit, das angesammelte Material zu erfassen und hinsichtlich aktueller Entwicklungen zu verstehen. Das NLP hilft ein besseres Verständnis der Versicherungsnehmer zu haben, indem etwa durch Textanalyse die Erwartungen oder Behandlungen der Kunden herausgefiltert werden. Eine maschinelle Textanalyse der Daten kann Probleme mit den Produkten und Prozessen sehr effektiv feststellen.

Auch im Rechtsraum spielt NLP eine Rolle. Anwälte und Gerichte verfügen über eine große Anzahl an Daten, die Dokumente, E-Mails, Fallakten, Gerichtsbeschlüsse, Urteile und Gesetzestexte umfassen. Diese Daten können ebenfalls mittels NLP effizienter analysiert werden.

Vielfältige Einsatzgebiete

Bisher können noch nicht alle im gleichen Maße von den Vorteilen profitieren, die eine Datenanalyse mit NLP bietet. Denn es sind schlicht nicht sehr viele Anwendungen für die Analyse großer Datenmengen verfügbar. Und die Datenanalyse der großen IT-Konzerne, Banken und Versicherungen findet weitestgehend hinter verschlossenen Türen statt.

Die Gebiete Sprachsteuerung und Chatbots sind hingegen für den Endverbraucher greifbarer. Entwicklungen und Verbesserungen von NLP haben hier direkten Einfluss auf die Performance der Anwendungen.

Bei allen Einsatzgebieten von NLP bei der Datenanalyse geht es darum, eine große Menge Text- oder Sprachdaten von Maschinen bearbeiten zu lassen. Die Entwicklung ist allerdings noch nicht sehr weit fortgeschritten und es kommt immer wieder zu Verständigungsproblemen. Allerdings werden NLP-Anwendungen besser. Sie lernen schneller und verstehen selbst komplizierte Sprachen oder Sprachsegmente.

Vieles hängt davon ab, in welchem Gebiet NLP zum Einsatz kommt und wie gut die NLP-Anwendung funktioniert, damit der Einsatz zum Erfolg kommt. Wenn die Voraussetzungen bekannt sind und die technischen Systeme zueinander passen, ist es möglich mit Natural Language Processing einige wichtige Aufgaben automatisch zu erledigen. Bei der Data Analytics trifft das, aufgrund der immer weiterwachsenden Datenmenge, in besonderem Maße zu.

Sind Ihre IT-Workloads
Cloud-ready?

Wir analysieren Ihre Infrastruktur.

Kommentar hinzufügen