What`s new in Microsoft Syntex – mind the gap

Yeay, es gibt News zum Content Management mit Microsoft Technologien.

Einige kennen den Gap nur aus der britischen U-Bahn, es gibt ihn allerdings auch im Content Management im Microsoft Umfeld: wo es viele Apps für die Anwender gab, werden jetzt eine Reihe an Funktionen ergänzt, die bisher nur über externe Anbieter realisiert werden konnten. Die stehen natürlich weiterhin zur Auswahl, Einblick auf die Microsoft Produktpalette lohnt sich trotzdem – die kann sich zeigen lassen.

Tagging, Tagging, Tagging – alles sollte Metadaten haben

Bisher können Metadaten automatisch an Dokumente vergeben werden, sobald eine KI unseren Regeln entsprechend den Inhalt analysiert und auswertet. Ich selbst habe da eine Grenze entdeckt, die jetzt erweitert wird: Wir haben eingescannte Dokumente im PDF Format, deren Inhalt dank fehlendem OCR nicht analysiert werden konnten. Das war auch mit Bildern der Fall. Ärgerlich, aber Vergangenheit :-)

Syntex unterstützt jetzt OCR (Optical Character Recognition), worüber digital gedruckte, handgeschriebene Schriften aus PDFs und Bildern extrahiert werden. Dazu zählen beispielsweise Screenshots, gescannte Dokumente und fotografierte Bilder. Erkannte Wörter werden in den Metadaten abgelegt, sodass die Inhalte durch die Suche erkannt, indiziert („registriert“) und damit gefunden und gefiltert werden können. Na dann sind wir mal gespannt, welche Handschrift eine gute Trefferrate erreicht – ich übe fleißig Schönschrift (ohne Tastatur :-/).

Das gleiche gilt für Bilder: Viele Unternehmen speichern Bilder und die sind fester Bestandteil von Prozessen (z.B. Produktschilder, Typ- bzw. Artikelschilder, Informationstafeln, etc.). Was bringt das? Wenn ein Bild „20231112_16250010.png“ heißt, was genau sagt das über den Inhalt aus? Richtig: Nichts. Erst durch den Ablageort erhält das Bild eine Bedeutung und einige können etwas damit anfangen. Durch die automatische Zuordnung von Metadaten zu Bildern ist es wie mit gescannten Dokumenten: Sie werden durchsuchbar und filterbar – wir finden sie schneller.

Außerdem wird endlich der Term Store (Terminologiespeicher) mit einbezogen! Anhand der von uns definierten Regeln zum Finden von Metadaten im Dokumenteninhalt kann Syntex die bereits vordefinierten Werte aus dem Term Store nutzen. Das macht einiges einfacher, denn bisher konnten wir extrahierte Metadaten „nur“ als Text, Datum usw. abspeichern, aber nicht aus einer Liste vorhandener Werte auswählen.

Pay as you go Lizensierung – nur noch das bezahlen, was wir wirklich verbrauchen

Durch die Umstellung aller Syntex Funktionen auf die pay as you go (also auf die verbrauchsbasierte Abrechnung) haben auch kleine Unternehmen die Chance, von Syntex zu profitieren – wo sie ansonsten mit der Seat-basierten Lizensierung viele AnwenderInnen für einige wenige Aktionen mit Syntex hätten lizensieren müssen.

Mehr zur Lizensierung kann in der offiziellen Microsoft Syntex Dokumentation nachgelesen werden.

Syntex und Copilot – auch hier kann die KI unterstützen

Copilot hält auch Einzug in Microsoft Syntex und möchte hier den ein oder anderen Use Case verbessern. Gelingt es?

Zum Beispiel lassen sich Dokumentenbibliotheken mit natürlicher Sprache durchsuchen, sodass wir am Ende eine Liste aller Dokumente erhalten, die unsere Frage „beantworten“. Dazu wird der Dokumenteninhalt durchsucht und die passende Antwort auf unsere Frage ausgegeben. Wir können also ein Dokument fragen, zu welchem Kunden es gehört („Wer ist der Kunde?“) und Copilot liefert uns die Antwort.

Contoso Screenshot Syntex und Copilot für Content Management mit SharePoint

Highlight: Autofill columns – Wenn sich die Metadaten automatisch anhand einer natürlichen Frage füllen

Anstatt Metadaten mit Typ, max. Anzahl an Zeichen und ggf. Quellwerten festzulegen, reicht es jetzt aus, eine natürliche Frage zu formulieren und ein Dokument anzugeben, in dem die Antwort erwartet wird. Syntex wird das Dokument sorgfältig lesen, auswerten und den gewünschten Wert in eine Spalte schreiben – für alle hochgeladenen Dokumente.

Meine persönliche Empfehlung für die nächste Version: Warum müssen wir ein Dokument angeben, wenn da schon so viele in SharePoint liegen, die eine Antwort parat haben? Vielleicht findet sich die Antwort auch in Seiten/Pages, damit auch das unternehmensinterne Wiki als Wissensquelle genutzt werden kann…Liebes Microsoft Team: Bitte denkt darüber nach.

Document Processing 2.0 – Innovation der Innovation

Das Document Processing in Microsoft Syntex ist noch gar nicht so alt und viele haben noch gar nicht davon gehört. Plötzlich stehen schon wieder Neuerungen an und wir können von einer Version 2.0 sprechen!

Wo wir bisher ein Modell zur Extraktion von Metadaten aus allen Dokumenten in einer Bibliothek festlegen konnten, ist es jetzt möglich, Regeln festzulegen. Nicht alle Dokumente müssen immer mit dem gleichen Vorgehen ausgewertet werden. Ein Dokument unternimmt eine lange Reise durch verschiedene Fachabteilungen und die brauchen unterschiedliche Metadaten aus unterschiedlichen Abschnitten des Dokuments.

Manchmal geht es auch nicht immer nur um Metadaten, sondern um Aktionen wie dem Verschieben oder Kopieren von Dokumenten an einen anderen Ort. Der Klassiker hier ist sicherlich die Trennung zwischen Arbeitsdateien und bereitgestellten Dateien – wir nennen das kollaborative und redaktionelle Inhalte – und die sollten nach Möglichkeit nicht gemeinsam abgelegt sein.

Sehr spannend ist auch das Festlegen des Inhaltstypen anhand des Dateinamens und der Dateiendung! Da gewinnt der Dateiname neben der Auffindbarkeit im ewig weitern Intranet ja noch einmal mehr an Bedeutung.

Wer hätte das gedacht!

Dokumente übersetzen – wenn Mehrsprachigkeit zählt

Ein Dokument „einfach so“ in eine andere Sprache übersetzen, wie smart wäre das denn? Syntex kann helfen: Dokument hochladen, die Zielsprache auswählen und kurze Zeit später taucht das übersetzte Dokument auf. Dieses Feature braucht denke ich keine weitere Erklärung, diejenigen Unternehmen, die es betrifft, sehen den Mehrwert ohne Bilder und Erläuterungen.