Wisdom Beyond Data
Mit Bayesianischer Datenmodellierung zu mehr Planungs- und Erkenntnissicherheit.
Unser Ansatz
Als eigene Denkrichtung der angewandten Statistik vereinigt die Bayesianische Inferenz Methoden der Statistik und des maschinellen Lernens, um überprüfbare Modelle an die Anforderungen der unterschiedlichsten Fragen anzupassen.
Unser Auftrag ist die erhebliche Kürzung von Datenerhebungsprozessen, die Nutzbarmachung von qualitativem Fachwissen und die Vermittlung von nachvollziehbaren Einsichten in Geschäftsprozesse für Prognose- und Optimierungszwecke.
Bayesianische Methoden eignen sich besonders im Bereich der Biostatistik. Mehr dazu auf unserer Life Science Seite.
Anwendungen
Experimental Design
Produktentwicklung
Planung, Steuerung, Kontrolle
Risikosteuerung
Prozessoptimierung
Datenstrategie
Innovationen
Datensparsamkeit
Ist Ihre Datenerhebung kostenaufwendig oder sind weitere Erhebungen praktisch nicht durchführbar?
Problem:
- In der klassischen Statistik führt die Festlegung der optimalen Stichprobengröße häufig zu einer zu kleinen oder zu großen Datenmenge, wodurch unzuverlässige Ergebnisse oder erhebliche Zusatzkosten entstehen
Deep Learning Methoden erfordern eine sehr große Datenmenge
- Zusätzliche Informationen aus unvollständigen oder fehlerhaften Daten werden häufig vernachlässigt
Lösung:
- Mit Bayesverfahren kann die Datenerhebung parallel zur Auswertung erfolgen, sodass der Erhebungsprozess zu einem optimalen Zeitpunkt beendet werden kann
- Modellstrukturen werden vorgegeben und nicht aus den Daten gelernt, wodurch der Datenbedarf verringert wird
- Bayesverfahren ermöglichen es, unvollständige Datenpunkte mit in die Analyse einfließen zu lassen, um den Informationsverlust zu begrenzen
Nutzen:
- Schnellere Einsichten durch Verkürzung der Datenerhebung
- Kosteneinsparungen bei der Erhebung von Daten
- Verbesserte Planung von weiteren Experimenten und Datenerhebungen
Nachvollziehbarkeit
Spielt Nachvollziehbarkeit bei Ihren datengetriebenen Lösungen eine zentrale Rolle?
Problem:
- Besonders bei Deep Learning Ansätzen ist der Zusammenhang zwischen der Ein- und Ausgabe häufig kaum ersichtlich. Solche Ansätze sind für viele Problemstellungen nicht geeignet
Lösung:
- Bayesianische Modelle können so gestaltet werden, dass die Parameter interpretierbar und verständlich sind
Nutzen:
- Verständliche Begründungen von Entscheidungen, vor allem um Rechenschaft über diese abzulegen
- Einsichten zu Planungs-, Optimierungs- und Argumentationszwecken
Flexibilität
Sie vermuten, dass Ihre individuellen Bedürfnisse durch Standardmethoden nicht erfüllt werden können?
Problem:
- Mit steigender Komplexität der Fragestellungen erhöhen sich die Anforderungen an die verwendeten datenanalytischen Methoden
- Standardmethoden basieren häufig auf Annahmen, die für spezifische Fragestellungen nicht zutreffen
- Durch den Einsatz von statistischen Methoden von der Stange lassen sich kaum gewinnbringende Lösungen für nicht-standardisierte Probleme finden
Lösung:
- Bayesianische Modelle werden individuell aufgebaut und iterativ an die Problemstellung angepasst
- Die Modellkomplexität kann beliebig variiert werden
Nutzen:
- Genauere und verlässlichere Ergebnisse
- Vermeidung falscher Rückschlüsse aufgrund zu einfacher oder unsachgerechter Annahmen
- Tiefergehende Einsichten
Expertenwissen nutzen
Sie oder Ihre Mitarbeiter verfügen über relevantes Wissen, das nicht in den Daten enthalten ist?
Problem:
- In der klassischen Statistik lässt sich Vorwissen nur schwer in die Auswertung mit einbringen
- Bei fachlichen Einschätzungen oder Bauchgefühl darf das Ausmaß an Unsicherheit nicht vernachlässigt werden
Lösung:
- In der Bayesianischen Statistik ist das Vorwissen ein wesentlicher Bestandteil der Modellierung
- Sogenannte weiche Daten wie Intuitionen oder nicht in Daten enthaltenes Wissen können so mit den bestehenden Daten verknüpft werden
- Durch die Darstellung mittels Wahrscheinlichkeitsverteilungen lässt sich die Unsicherheit des Vorwissens berücksichtigen
Nutzen:
- Prognosequalität kann entscheidend verbessert werden
- Zuverlässigere Schlussfolgerungen aus den Datenmodellen
Unsicherheiten verstehen
Treffen Sie Entscheidungen auf Grundlage datenanalytischer Auswertungen?
Problem:
- Wird eine Entscheidung unter falscher Risikoeinschätzung getroffen, können gravierende Schäden entstehen
- Ohne ein ausführliches Verständnis über die Unsicherheit der Vorhersagen lassen sich die potenziellen Risiken einer Entscheidung nicht genau einschätzen
- Konventionelle Methoden liefern vermeintlich Punktgenaue Ergebnisse bieten jedoch meist keine verlässliche Einschätzung der Unsicherheit in den verwendeten Modellen
Lösung:
- Die Bayesianische Statistik verlässt sich nicht auf Genauigkeitsmaße wie Konfidenzintervalle und Standardfehler oder p-Werte
- Durch Markov Chain Monte Carlo Verfahren werden a-posteriori Wahrscheinlichkeitsverteilungen simuliert, die ein umfassendes Bild der Unsicherheit vermitteln
Nutzen:
- Ausführliches Verständnis von Unsicherheiten der Ergebnisse bei gegebener Datenlage
- Auswertungsergebnisse können guten Gewissens mit in das Entscheidungskalkül aufgenommen werden
- Berücksichtigung von Tail-Risiken
Robustheit
Prüfen Sie Ihre datenanalytischen Auswertungen im Hinblick auf ihre Verlässlichkeit und Replizierbarkeit?
Problem:
- Datenanalystische Methoden liefern auch Ergebnisse, wenn sie eigentlich nicht für die Problemstellung geeignet sind
- Unbegründetes Vertrauen in die eingesetzten Methoden vermittelt ein falsches Gefühl von Sicherheit, wodurch irreführende Interpretationen und Handlungsempfehlungen entstehen können
- Die Verwendung von p-Wert basierten Testverfahren führt in vielen Fällen zu fälschlich signifikanten Ergebnissen oder übersehenen Zusammenhängen
Lösung:
- Bayesianische Modelle sind generativ, das heißt, es lassen sich Daten unter den Annahmen des Modells simulieren. Durch einen Vergleich der simulierten Daten mit den tatsächlich beobachteten Daten können Schwachstellen des Modells offengelegt und iterativ verbessert werden
Nutzen:
- Hohes Maß an Verlässlichkeit
- Gute Argumente für die Rechtfertigung der verwendeten Methoden und damit auch der daraus abgeleiteten Handlungsempfehlungen
- Sicherheit, dass die Methoden zur Problemstellung passen
Lösung neuer Fragestellungen
Haben Sie eine Fragestellung, zu der es keine passenden Ansätze in Ihrem Methodenkatalog gibt?
Klassische Methoden stoßen unter manchen Bedingungen schnell an ihre Grenzen, zum Beispiel:
- wenn die Anzahl der Variablen deutlich größer ist als die Anzahl der Beobachtungen. Durch Vorwissen und regularisierende Modelle können Probleme mit der Identifizierbarkeit umgangen und flexibler modelliert werden.
- bei hoher Korrelation zwischen den Prädiktoren (Multikollinearität). Variablen, die stark mit anderen Variablen korrelieren, werden bei klassischen Methoden häufig von der Analyse ausgeschlossen. Dadurch können wertvolle Informationen verloren gehen.
- bei Daten mit Gruppen- oder Hierarchiestruktur. Klassische Methoden betrachten bei Daten mit Gruppenstruktur entweder alle Gruppe getrennt voneinander ("no-pooling"), oder alle Beobachtungen gemeinsam ("complete pooling"). Bayesianische Modelle erlauben es, einen Zwischenweg zu finden, bei dem das Modell die in den Daten erhaltene Information zwischen den Gruppen verknüpft kann, Gruppen bei Bedarf aber trotzdem getrennt betrachtet. Dadurch können Daten gespart und genauere Ergebnisse ermöglicht werden.
Unterstützung
Athenata wird im Rahmen des EXIST-Programms durch das Bundesministerium für Wirtschaft und Energie und den Europäischen Sozialfonds gefördert.
Zusätzlich werden wir mit unserem Sitz im Technologiezentrum Wuppertal durch das W-tec Gründernetzwerk unterstützt.
Kontaktieren Sie uns gerne!
kontakt@athenata.com
Telefon: +49 1573 4858376
Mail: kontakt@athenata.com