Neue Wege in der Wissenserkennung und Computerlinguistik

Semantik einfach verstehen und anwenden

Seit Jahren wird viel über Semantik, Semiotik, Daten intelligent nutzen und Wissenserkennung gesprochen. Doch – was bedeutet dies eigentlich? Wie können Kunden von diesen Prinzipien, die eigentlich schon seit vielen Jahren bekannt sind, profitieren und einen Nutzen daraus ziehen?

Um einen maximalen Nutzen aus Daten – die oft vorhanden sind – ziehen zu können, ist es notwendig, den Kontext zu kennen und die Einbettung der jeweiligen Textpassage zu berücksichtigen.

 

Semiotik und Semantik

In der Literatur wird viel von Semantik und semantischen Lösungen, dem Semantik Web, Web 3.0, geschrieben. Dahinter steht die Grundidee, Wissen über das Internet zu vermitteln, aber auch automatisch Wissen aus dem Internet zu generieren sowie Inhalte und Bedeutung zu erkennen und zu beurteilen. Eigentlich sind fast alle Informationen im Internet oder in elektronisch verfügbaren Daten vorhanden, wir müssen diese nur finden und verstehen.

Semantik ist die Lehre der Bedeutung von Zeichen. Die Zeichen bilden Worte in der Sprache und diese Worte bilden Sätze. Mit den Sätzen wird eine Bedeutung gebildet. Man kann die Sätze in drei unterschiedliche Typen unterteilen: Fragen, Befehle oder Aussagen.

Die Vollständigkeit und Klarheit eines Satzes ist wichtig, damit ein Empfänger die Informationen versteht. Die Bedeutung eines Satzes ist durch die inhaltliche Information definiert Die semantische Analyse eines Satzes führt demnach über die Bedeutung der Worte und deren Anordnung im Satz zu einer inhaltlichen Aussage im Satz. Kombiniert man dieses Wissen noch mit dem Ort und mit der Zeit, wo eine Information zur Verfügung gestellt worden ist, so hat man ein semiotisches System.

Martin_1

Abbildung 1: Die drei Dimensionen von Semiotik

Ein solches Umweltmodell-Konzept verbindet Syntax, Semantik und Pragmatik (Realwelt). Damit wird ein System fähig, dynamisch auf Inhalte und Bedeutungen zu reagieren.

 

Erkennen von dynamischen Mustern

Zur Erkennung von dynamischen Mustern ist es notwendig neben der Bedeutung der Worte im näheren Textumfeld auch die relationalen Assoziationen der Worte zwischen einzelnen Texten und Artikeln zu erkennen. Das System muss erkennen können, ob ein Wort generell mit wichtigen, unwichtigen, negativen oder positiv benutzten Worten assoziiert ist und wie häufig es benutzt wird.

Martin_2

Abbildung 2: Semantischer Fingerprint

Die Kombination aus der Wichtigkeit im Satz oder Text und der relationalen Verwandtschaft wird semantischer Fingerprint genannt.

 

Inhaltliche Muster finden

Mittels eines semantischen Fingerprints ist es möglich, auch inhaltliche Muster in unterschiedlichen Texten zu finden.

Mit dem Wort „Gold“ assoziiert sind zum Beispiel: wertvoll, gelb, Zahlungsmittel, sportlicher Erfolg, Rohstoff, Geld, Wertanlage, Fluchtmittel etc…

Damit alle Personen, welche die Worte wertvoll, gelb, Zahlungsmittel, Geld, Absicherung, Wertanlage lesen, an das gleiche denken, nämlich an „Gold“, bedingt es die Voraussetzung, dass alle Leser das gleiche Wissen haben. Unterschiedliches Wissen und individuelle Erfahrungen würden zu divergierenden Antworten führen.

Martin_3

Abbildung 3: Inhaltliche Muster finden

Mit der Möglichkeit unscharfe Muster zu vergleichen und einander zuzuordnen, können vollständige oder ähnliche Muster (wenn zum Beispiel 2 oder 3 Worte fehlen oder anders geschrieben sind) erkannt und einander zugeordnet werden.

 

Umsetzung in der Praxis

Dieser Ansatz bringt Unternehmen in die Lage, durch das Ausnützen von semantischen Fingerprints mehr Nutzen aus Daten zu generieren. Viele Start-ups und auch Suchmaschinen Anbieter wie Google nutzen heute schon teilweise sehr weit entwickelte Systeme. Spannend ist zu beobachten, wie vor allem in Apps und mobilen Anwendungen die dynamische Nutzung der Daten oft akzeptiert wird. Eine Nutzung von ähnlichen Methoden für den eigenen wirtschaftlichen Erfolg fassen aber viele Firmen nicht ins Auge, da ihnen der Ansatzpunkt fehlt. Dieser liegt aber bei allen Firmen auf der Hand: Analyse der täglich vorhandenen Daten, Definition einer Zielsetzung und individuelle Umsetzung um so einen Marktvorteil zu erzielen.

 

 

 

 

Hinterlasse eine Antwort