Die technische Seite von Adobe Scan

Adobe Scan

Visitenkarten sind noch immer eine wichtige Währung, wenn wir zusammenarbeiten. Aber wer will noch mühsam Papierkärtchen sammeln, die in Taschen und Schubladen in Vergessenheit geraten? Die neueste Innovation in Adobe Scan verwandelt physische Visitenkarten nun schnell und einfach in digitale Kontakte auf Ihrem Smartphone. Das scheint eine einfache Funktion zu sein, aber im Hintergrund wird hart gearbeitet. Aus der Sicht des Machine Learning ist die Herstellung von mobilen Apps wie Adobe Scan eine recht komplexe Herausforderung.

Ingenieure in unserem globalen Hauptsitz in San Jose und in unseren Büros in Noida in Indien haben Adobe Sensei, unsere Plattform für künstliche Intelligenz, dafür benutzt, eine Reihe von komplizierten Herausforderungen im Bereich des Machine Learning zu lösen, die Adobe Scan mit sich bringt. Funktionen wie die Erkennung, welche Art von Dokument gescannt wird, und festzustellen, ob die Information auf einer Visitenkarte ein Name oder eine Telefonnummer ist, erfordern ausgereiftes Machine Learning, das unser Team immer wieder begeistert und fordert.

Ist das eine Visitenkarte oder eine Rechnung?

Eine Visitenkarte zu scannen scheint eine einfache Aufgabe zu sein. Zielen, klicken, scannen. Doch woher weiß Adobe Scan, dass Sie eine Visitenkarte und nicht eine Rechnung, einen Vertrag oder eine andere Art von Dokument eingelesen haben? Hier kommt Adobe Sensei ins Spiel. Ein ausgeklügelter Algorithmus rund um die Klassifikation von Dokumenten läuft bei Adobe Scan im Hintergrund. Wir füttern den Algorithmus mit unterschiedlichen Beispielen von Dokumenten, damit er lernen kann, die verschiedenen Arten von Dokumenten zu unterscheiden. In diesem Fall ist es eine Visitenkarte.

Aber Adobe Sensei kann mehr als nur die Art des gescannten Dokuments feststellen. Mithilfe der fortschrittlichen Bildverarbeitungstechniken von Adobe, gestützt durch Adobe Sensei, kann Adobe Scan den digitalen Text auf einer Visitenkarte in einem sicheren und verlässlichen PDF extrahierbar, weiterverwendbar und durchsuchbar machen. Es entfernt sogar unerwünschte Objekte von Ihrem Scan, wie etwa den Finger, mit dem Sie die Karte halten. Dies ist gar nicht so einfach, da Visitenkarten nicht alle gleich sind. Sie haben unterschiedliche Farben, Schriften und werden mit unterschiedlichem Hintergrund gescannt.

Namen sind Schall und Rauch! Ein heuristischer Ansatz

Bei der Einbindung von Adobe Sensei in Adobe Scan haben wir einen langen Weg hinter uns. Ein Beispiel ist die Erkennung verschiedener Felder einer Visitenkarte wie Name, Telefonnummer, Adresse und E-Mail.

Wir nutzen die Wissenschaft der Heuristik oder Mustererkennung für jedes der Felder auf einer Visitenkarte. In einer E-Mail-Adresse kommt beispielsweise Endungen wie „.com“, „.edu“ oder „.gov“ vor. Durch den Einsatz heuristischer Prinzipien bei Adobe Scan kann die App mit hoher Sicherheit erkennen, dass es sich bei joe.smith@adobe.com um eine E-Mail-Adresse handelt. Unser Team arbeitet weiter an neuen Modellen von Adobe Sensei in Adobe Scan, um weitere Felder wie Unternehmensnamen und Adressen mit höherer Genauigkeit erkennen zu können.

Für Kunden, von Kunden

Egal wie ausgeklügelt die künstliche Intelligenz und das Machine Learning sind, wenn sie nicht benutzerfreundlich sind, ist alles nutzlos. Unsere Partner im Product Marketing werten laufend sowohl internes als auch externes Feedback aus, um die Nutzbarkeit von Adobe Scan zu verbessern. Manchmal sind die Mitarbeitenden von Adobe die besten Beta-Tester! Wir haben Beta-Versionen von Adobe Scan auf den Geräten unserer Kollegen installiert, die in Bereichen wie Business Development und Vertriebsmanagement tätig sind. In diesen Bereichen häufen sich die Visitenkarten im Laufe eines Jahres. Wir haben sie gebeten, uns Feedback zu Fragen zu geben, wie etwa: Was sind die wichtigsten Elemente einer Visitenkarte? War der Ablauf vom Scan bis zur Übermittlung an die Kontakte schnell, intuitiv und nahtlos? Wir haben auch grundlegende Fragen gestellt wie: „Ist diese Funktion im täglichen Gebrauch besonders nützlich?“

Was lernen wir daraus?

Besonders spannend bei dem Einsatz von Adobe Sensei in Adobe Scan ist die Tatsache, dass die Möglichkeiten endlos sind und die Arbeit daher nicht ausgeht. Die Teams der Ingenieure in San Jose und Noida untersuchen weitere Möglichkeiten wie zum Beispiel den Einsatz von OCR innerhalb eines bestimmten Geräts statt in der Cloud. Wenn OCR direkt am Gerät läuft, bedeutet das eine direktere Übertragung von physischem Text in digitalen Text. Und was wäre, wenn Adobe Scan ein Dokument, nachdem Sie es gescannt haben, als Formular erkennen und Sie fragen würde, ob Sie es ausfüllen möchten, und Ihnen Vorschläge anbietet?

Die bereits geleistete Arbeit an Adobe Scan mit Machine Learning zeigt deutlich, dass unsere Entwicklungsteams hinter diesem Projekt begeistert davon sind, was möglich ist, und wie weit man im mobilen Scan noch gehen kann. Einstweilen können Sie das aktuelle Adobe Scan im Einsatz sehen und es selbst testen.

Autor: Akhil Chugh
Akhil Chugh is a Group Product Manager at Adobe. He has 15 years of experience managing and innovating on large scale, consumer mobile products. Akhil has an MBA from the Indian Institute of Management, Lucknow and a B. Tech from IIIT Allahabad where he studied product management, strategic marketing, business development, and sales.

Adobe Scan

Posted on 06-19-2018


Join the discussion