Die Revolution der Cashflow-Analyse: Von starren Regeln zu intelligenter Vektorisierung

Die präzise Analyse von Finanztransaktionen ist für eine effektive Finanzplanung unerlässlich. Doch gerade die Identifizierung von regelmäßig wiederkehrenden Zahlungen, wie etwa Abonnements, war lange Zeit eine Herausforderung. Traditionelle, regelbasierte Ansätze sind bei komplexen und dynamischen Finanztransaktionen schnell überfordert. wealthAPI hat eine Lösung entwickelt, die diese Grenzen überwindet. Durch den Einsatz von künstlicher Intelligenz und Vektorisierung verwandeln wir rohe Transaktionsdaten in wertvolle Erkenntnisse. Unser System geht weit über einfache Regelwerke hinaus. Es ermöglicht eine präzise und zuverlässige Identifizierung wiederkehrender Zahlungen, selbst bei kleinen Abweichungen oder neuen Zahlungsanbietern.

wealthapi-blog-vektorisierung-body

Regelbasierte Systeme: Die Grenzen traditioneller Ansätze

Die Cashflow-Analyse unseres Budgetplaners erkennt und unterscheidet zuverlässig zwischen regelmäßigen und unregelmäßigen Transaktionen. Häufige, aber unregelmäßige Transaktionen werden dabei zuverlässig ignoriert. Gleiches gilt für besonders große Transaktionen, die kein regelmäßiges Ausgabeverhalten widerspiegeln.

Die Identifizierung von regelmäßig wiederkehrenden Transaktionen ist dabei aus technischer Sicht nicht banal. Auch wir hatten die Herausforderung, wiederkehrende Zahlungen in der Banktransaktionshistorie eindeutig zu identifizieren. Der Grund: Die bisher verwendeten regelbasierten Systemen arbeiten mit klar definierten Regeln, um Zahlungen anhand bestimmter Kriterien zu identifizieren.

Ein Beispiel für die regelbasierte Identifikation eines Netflix-Abonnements

Die Regeln: 

  • Betrag: Jede Zahlung muss einen Betrag von genau 15,99 € aufweisen.
  • Häufigkeit: Die Zahlungen müssen monatlich, am ersten Werktag des Monats, erfolgen.
  • Empfänger: Der Empfänger muss „Netflix“ lauten.
  • Währung: Die Währung muss Euro sein.

Das System durchsucht die Transaktionshistorie nach Zahlungen, die alle oben genannten Regeln erfüllen. Wenn eine Zahlung gefunden wird, die alle Kriterien erfüllt, wird sie als Netflix-Abonnement identifiziert.

Das Problem: Diese Methode ist sehr starr. Sie funktioniert nur, wenn die Zahlungen exakt den definierten Regeln entsprechen. Schon kleine Abweichungen, wie eine Gebührenerhöhung oder eine verspätete Zahlung, führt dazu, dass Transaktionen nicht richtig erkannt werden. Dazu kommt: Bei einer großen Anzahl von verschiedenen Abonnements und Zahlungsanbietern muss eine Vielzahl von Regeln erstellt und gepflegt werden. Außerdem führen Änderungen bei den Zahlungsmodalitäten (zum Beispiel Preiserhöhungen, Wechsel des Zahlungsdatums) dazu, dass Regeln angepasst werden müssen.

So ein regelbasiertes System ist nicht flexibel genug. Es kann mit der Vielfalt an Zahlungsarten und -anbietern nicht umgehen und die vielfältigen Konstellationen von Zahlungen abbilden. Insbesondere die Suche nach exakten Übereinstimmungen ist problematisch. Bereits kleine Schreibabweichungen wie „Netflix“ versus „Netflix Inc.“ führen dazu, dass wiederkehrende Zahlungen unerkannt bleiben. Kurzum: Eine auf starren Regeln basierende Identifikation ist nicht in der Lage, die Komplexität und Dynamik moderner Finanztransaktionen abzubilden. Es kann keine zuverlässige Erkennung wiederkehrender Zahlungen gewährleisten.

Vektorisierung: Transaktionen als Datenpunkte

Für uns bei wealthAPI ein nicht hinzunehmender Zustand. Deshalb haben wir eine Lösung entwickelt, bei der rohe Transaktionsdaten mithilfe von KI in verwertbare Erkenntnisse umwandelt werden. Dafür verwendet unser System Vektoren, um Transaktionen in wiederkehrende Zahlungsmuster zu gruppieren beziehungsweise einzubetten. 

Stellen Sie sich jede Transaktion als einen Punkt in einem mehrdimensionalen Raum vor. Dieser Raum hat viele Dimensionen: beispielsweise für den Betrag, für den Händler und für das Datum. Je ähnlicher zwei Transaktionen sind, desto näher liegen sie in diesem Raum beieinander. Unser System wandelt diese Transaktionen in sogenannte Vektoren um. Ein Vektor entspricht einem Zahlencode, der alle relevanten Informationen über eine Transaktion enthält. Diese Vektoren ermöglichen es uns, Ähnlichkeiten zwischen Transaktionen auf mathematische Weise zu berechnen. Die Vektorisierung ist vergleichbar mit dem Erstellen eines digitalen Fingerabdrucks für jede Transaktion.

Durch das vektorbasierte System erreichen und gewährleisten wir eine sehr hohe Genauigkeit – gerade bei wiederkehrenden Zahlungseingängen mit kleinen Merkmalsunterschieden. Von Abonnements bis hin zu Versicherungszahlungen liefert unser System zuverlässige Ergebnisse. Gleichzeitig bietet es die Geschwindigkeit und Skalierbarkeit, die unsere Partner benötigen.

Astra DB: Die perfekte Heimat für unsere Vektoren

Um diese Vektoren effizient zu speichern und zu durchsuchen, nutzen wir DataStax Astra DB. Diese Datenbank ist speziell dafür ausgelegt, große Mengen von Daten mit hoher Geschwindigkeit zu verarbeiten. Sie ermöglicht es uns, blitzschnell ähnliche Transaktionen zu finden und zu gruppieren. Astra DB ist wie eine hochmoderne Bibliothek, in der jedes Buch (in unserem Fall: jeder Vektor) einen eindeutigen Platz hat und schnell gefunden werden kann.

Ein Netflix-Abo könnte beispielsweise durch folgende Merkmale charakterisiert werden:

  • Betrag: 15,99 €
  • Händler: Netflix
  • Häufigkeit: Monatlich
  • Zahlungsdatum: Anfang des Monats
  • Beschreibung: Streamingdienst

Diese Merkmale werden in einen Vektor umgewandelt. Wenn eine neue Transaktion eingeht, wird ihr Vektor mit den bereits gespeicherten Vektoren verglichen. Wenn ein Vektor eine hohe Ähnlichkeit aufweist, wird die neue Transaktion dem entsprechenden Cluster, zum Beispiel „Netflix-Abo“, zugeordnet.

Und so funktioniert es:

  • Datenaufnahme: Wenn Banktransaktionen beispielsweise durch einen Datenimport eingehen, veröffentlicht das WealthAPI-Backend sie in einer Nachrichtenwarteschlange zur asynchronen Verarbeitung.
  • Einbettungserstellung: Jede Transaktion wird im nächsten Schritt mithilfe der Vektorisierungsfunktion in einen numerischen Vektor (zum Beispiel [0.12, 0.65, 0.78, …, 0.23]) umgewandelt.
  • Vektorspeicherung und -suche in der Datenbank: Die Einbettungen werden darauf hin in der Datenbank gespeichert. Die Vektorähnlichkeitssuchen ermöglicht es dem System, ähnliche Transaktionen zu finden und zu clustern.
  • Regelmäßigkeitsanalyse: Die Cluster werden analysiert, um wiederkehrende Zahlungen zu identifizieren und sie in Verträge wie „Netflix – Streamingdienst – monatlich“ oder „Auslandskrankenversicherung – Gesundheit – jährlich“ einzuordnen.

Astra DB stellt sicher, dass der gesamte Prozess skalierbar und reaktionsschnell ist, selbst bei großen Datenmengen. Außerdem werden strenge Datensicherheitsmaßnahmen eingehalten. So wird sichergestellt, dass Endbenutzer*innen und ihre Transaktionen anonym bleiben und vor externem Zugriff geschützt sind.

Umgang mit großen Datenmengen

Täglich verarbeiten wir Tausende von Transaktionen. Um dieser hohen Datenlast gerecht zu werden, benötigten wir eine Datenbank, die sowohl schnell als auch flexibel ist. Astra DB, basierend auf Apache Cassandra, erfüllt diese Anforderungen umfassend und lässt sich zudem in KI-Workflows integrieren. Astra DB ermöglicht es uns, große Datenmengen zu verarbeiten und gleichzeitig hochpräzise Ähnlichkeitssuchen durchzuführen.

Davon profitieren aber nicht nur wir und unsere Partner, sondern auch die Endnutzer*innen. Sie können eine Suchfunktion nutzen, um nach bestimmten Ausgaben zu suchen, ohne dass sie genaue Kategorien kennen müssen. Gibt ein*e Nutzer*in beispielsweise das Wort „Gesundheit“ ein, werden alle Transaktionen angezeigt, die mit Gesundheitsausgaben in Verbindung stehen. Das können etwa Versicherungsbeiträge oder Fitnessstudio-Mitgliedschaften sein.

Ermöglicht wird das, weil unser System die Suchanfrage des*der Nutzers*in ebenfalls in einen Vektor umwandelt. Anschließend sucht es in der Datenbank nach den ähnlichsten Vektoren. So bieten wir präzise Antworten auf semantische Suchanfragen und eine intuitive, leistungsstarke Suchfunktion. Die Vektorsuchfunktion macht diese Art der semantischen Suche schnell und genau.

Fazit: Mit Vektoren zu einer intelligenten Cashflow-Analyse

Die Vektorisierung von Transaktionsdaten hat die Cashflow-Analyse unseres Budgetplaners auf ein neues Level gehoben. Durch die Umwandlung von Transaktionen in Vektoren können wir Ähnlichkeiten zwischen Zahlungen berechnen und Ausgabenmuster identifizieren.

Unser System, das auf der leistungsstarken Datenbank Astra DB basiert, bietet zahlreiche Vorteile:

  • Hohe Genauigkeit: Selbst bei kleinen Abweichungen in den Transaktionsdaten werden wiederkehrende Zahlungen zuverlässig erkannt.
  • Skalierbarkeit: Unser System kann große Datenmengen effizient verarbeiten und ist für zukünftiges Wachstum gerüstet.
  • Flexibilität: Das System passt sich automatisch an neue Zahlungsanbieter und -modelle an.
  • Intuitive Suche: Endnutzer*innen können nach Begriffen suchen und erhalten präzise Ergebnisse, ohne genaue Kategorien kennen zu müssen.

Mit unserer Lösung ermöglichen wir es Verbrauchern und Verbraucher*innen, ihre Finanzen besser zu verstehen und zu verwalten. Die präzise Identifizierung von wiederkehrenden Zahlungen ist ein wichtiger Schritt hin zu einer intelligenten und personalisierten Finanzplanung. Und der Anfang eines auf soliden Beinen stehenden Wealth-Managements