Big Data – Nutzen Sie, was uns die Daten sagen!

Big Data ist bei vielen Unternehmen ein Thema, welches mit sehr gemischten Gefühlen verbunden ist. Mit Big Data öffnen sich verschiedenste neue Wege, wie wir Daten aus dem Markt holen können, und so proaktiv zukünftige Trends und Entwicklungen nutzen können. Andererseits besteht aber eine gewisse Angst, wie wir in diesem immer grösser werdenden Datenvolumen navigieren können – und das Datenvolumen wird auch immer grösser, wie z.B. eine Studie von Statista zeigt:

Bild1_Martin

In den vergangenen Jahren haben sich viele Spezialisten damit beschäftigt, wie wir mit Ansätzen von künstlicher Intelligenz und verschiedensten mathematischen Algorithmen diese wachsende Datenflut nutzen können. Es gibt immer wieder Erfolgsmeldungen, die zeigen, wie innerhalb eines bestimmten Segments Frühwarnsysteme oder sonst sehr nützliche Informationen generiert werden können.

Die meisten heute bekannten Systeme gehen vom Prinzip aus, dass mit ausgeklügelten Prozessen und Modellen Lösungen für vorhersehbare Problemstellungen entwickelt werden können. Bei strukturierten Datenanalysen funktioniert das auch in den meisten Fällen hervorragend. Der Umgang mit unstrukturierten Daten bringt hingegen weniger gute Resultate, obwohl auch hier ab und zu ein Durchbruch gelingt. Wo die meisten Ansätze hingegen scheitern ist, wenn sowohl aus strukturierten als auch aus unstrukturierten Daten eine Lösung entwickelt werden soll. Durch die rasch wachsende Datenmenge ändern sich Umfang und Art der unstrukturierten Daten dermassen, dass die für eine gute Analyse notwendigen Modelle gar nicht rasch genug angepasst resp. entwickelt werden können.

Dabei wäre die Lösung doch relativ einfach: Die Daten in sich selber haben ja immer ein Muster. Nur können wir dieses nicht zum Vornherein schon kennen. Wenn wir uns vom Gedanken lösen, dass wir ein Modell immer beherrschen müssen, stehen plötzlich sehr interessante Wege offen.

Agenten, welche zu verschiedenen Themen ein Wissen aufbauen, das nur auf den effektiven Inhalten basiert (ohne vorgegebene Ontologie oder sonstigen Mustervorgaben), können in sich ändernden Umfeldern hervorragend navigieren. Sie abstrahieren die Kernaussagen, so genannte Fingerprints, unabhängig wie schwülstig oder trocken ein Text geschrieben ist.

Dadurch, dass solche Agenten auch ‚nur’ mit bisherigem Textwissen ausgestattet sind, erkennen diese auch nur, was wirklich im Text selber steht. Der Mensch hat oft die Tendenz, sein Wissen aus der Vergangenheit in einen Text hinein zu interpretieren. Ein Agent, der nur sein Wissen aufgrund von wirklichen Daten hat, macht diesen Fehler nicht. Verschiedene Tests haben gezeigt, dass so die Erkenntnisse viel schärfer sind.

Solche Fingerprints können auch aus verschiedenen Datenquellen entwickelt werden, so dass z.B. Textdaten, Wetterdaten und Gesundheitsdaten kombiniert werden können.

Mit dem skizzierten Ansatz wird plötzlich aus der Gefahr Big Data die grosse Chance Big Data, da die wachsende Datenmenge nicht bekämpft, sondern die Entwicklung genutzt werden kann.

 

Hinterlasse eine Antwort