Wie man die Suchgeschwindigkeit mit natürlicher Sprachverarbeitung beschleunigt

Wie man die Suchgeschwindigkeit mit natürlicher Sprachverarbeitung beschleunigt

Für diesen Kunden waren die Rohdaten zahlreiche staatliche Verträge, die mit wenig oder keiner Konsistenz in Sprache, Formulierung, thematischer Organisation oder Formatierung verfasst wurden. Die Wörter, die zur Formulierung vertraglicher Anforderungen verwendet wurden, können ähnlich sein, aber sie sind oft anders organisiert und kombiniert. EY-Teams verwendeten NLP, um einen Algorithmus anzulernen, der Anforderungen extrahieren sollte, die dann eine zentrale Datenbank bevölkerten, damit die Analysten des Unternehmens schnell nach Schlüsselwörtern, Phrasen und Zeichen sowohl nach staatlicher Zuständigkeit als auch nach Geschäftsfunktion suchen konnten. Die durchsuchbaren Geschäftsbereiche umfassen unter anderem Schadenszentren, Call-Center, Einsprüche und Beschwerden sowie andere mit Compliance-Implikationen.

In der ersten Phase identifizierten die EY-Teams gemeinsame, relevante Absatz- und Satzstrukturen, die Phrasen wie “Im Fall von” und “ist verpflichtet zu” markierten. Sie klassifizierten auch Zeichen wie Bullets und römische Zahlen. Da diese Sonderzeichen je nach staatlichem Vertrag variieren können, waren unterschiedliche Kombinationen erforderlich, damit der NLP-Algorithmus die individuellen Verträge und Anforderungen erlernen konnte. In einigen Fällen waren die staatlichen Verträge nur im PDF-Format verfügbar, was die Anwendung von Texterkennungssoftware erforderte, um Bilder von Wörtern in lesbare Zeichen umzuwandeln, bevor dem NLP beigebracht werden konnte, wonach gesucht werden sollte.

Die Teams tauchten dann tief in die syntax- und semantische Sprache ein, um ein Wörterbuch von etwa 450 kritischen Suchbegriffen zur Fokussierung des Algorithmus zu erstellen. Die Schlüsselwörter beziehen sich hauptsächlich auf formale Verpflichtungen und Anforderungen. Wörter wie “erfordert”, “soll” und “muss” weisen auf Verpflichtungen hin, während “innerhalb” eine quantitative Anforderung signalisiert, wie z.B. “innerhalb von 48 Stunden”. Verben wie “erfüllen”, “ausführen” und “wohnen” spielten eine große Rolle in den speziell für die staatlichen Verträge des MCO entwickelten NLP-Anwendungswörterbüchern und Bibliotheken.

Der NLP-Algorithmus benötigte etwa vier Monate, um entwickelt und feinabgestimmt zu werden, durch einen gestuften Prozess, der seine Genauigkeit von 50 % auf 84 % und schließlich fast auf 100 % erhöhte, durch wiederholte Tests, Ergänzungen und Klarstellungen der durchsuchbaren Bibliothek. Insgesamt wurden etwa 170.000 Compliance-Anforderungen identifiziert und nach den Wörtern und Zeichen klassifiziert, die sie in den staatlichen Medicaid-Verträgen beschreiben. Traci Gusher, EY Americas Data and Analytics Leader, sagt: “Unstrukturierte Daten sind die größte Datenart in Organisationen heute, dennoch bleibt sie weitgehend ungenutzt für Erkenntnisse und kann eine fortlaufende Belastung bei der Verwaltung darstellen.” “Der Einsatz moderner Künstlicher Intelligenz verändert unsere Fähigkeit, schnell auf diese wirkungsvolle Art von Informationen zuzugreifen und Wert daraus zu generieren.”