Automatisierter Produktvergleich

Transparenz im Life-Science-Markt durch automatisierten Vergleich natürlich sprachlicher Prduktdaten

Gerfördert durch


Förderkennzeichen: 16KN063702

Problemstellung

Es ist ein gängiges Geschäftsmodell als Hersteller Produkte lizenziert von verschiedenen Vertriebspartners vertreiben zu lassen. Dieses Projekt hat einen Fokus auf den Markt mit Antikörpern. Hier führt diese Praxis führt im wissenschaftlichen Bereich allerdings zu verschiedenen Problemen:

  • es kann nur umständlich oder gar nicht geprüft ob unterschiedliche Komponenten genutzt werden, dadurch werden Versuchsergebnisse verfälscht.
  • es wird ein zu teures Produkt gekauft, da günstige Alternativen nicht als solche erkannt werden
  • usw.

Ziel dieses Projekt ist es Methoden zu entwickeln um in diesem Markt die Herkunft von Produkten automatisiert zu bestimmen.

Ansatz

 

Der verwendete Ansatz unterteilt sich in drei Ebenen.

Informationsbeschaffung und -aktualisierung

Zunächst werden die Produktbeschreibungen der verschiedenen Anbieter automatisiert gefunden (Market Web Scanner). Im Anschluss wird geprüft ob der Anbieter sein Angebot aktualisiert hat (Delta Finder). Falls das untersuchte Produkt noch nicht in der eigenen Produktdatenbank verfügbar ist, oder sich Änderungen an diesem ergeben haben, wird die Produktbeschreibungen in einem allgemeinen Format heruntergeladen (Adaptive Web Crawler).

Integration in gemeinsames Produktdatenmodell

 Zunächst wird eine Produktkategorie bestimmt (Classification Estimator), da sich die Zieldatenformate entsprechend unterschieden. Verschiedene Extraktoren analysieren die Beschreibung hinsichtlich relevanter Informationen (Information Extractors). Anschließend werden die Informationsbausteine in einem Ziedatenformat zusammengefasst (Product Modell Mapper). Abschließend werden die extrahierten Informationen bzgl. der angenommenen Produktkategorietät bewertet (Extraction Evaluator). Dieser Schritt soll die Datenqualität sichern. 

Unscharfe Entscheidungsfindung

In diesem Schritt werden Produktbeschreibungen eindeutigen Produkten zugeordnet. Es wird also automatisiert entschiednen ob zwei oder mehrere Produktbeschreibungen das selbe Produkt beschreiben.

 

Menü schließen