News

Xerox untersucht neue Nummernvertauschungs-Funde

Im zweiten Presse-Statement von Xerox hat Rick Dastin, Vice President at Xerox Corporation, gesagt: „You will not see a character substitution issue when scanning with the factory default settings.“ In Xerox' offiziellem Technischen Statement zum Thema werden diese factory default settings definiert: Gemeint sind der Kompressionsmodus „higher“ und eine Auflösung von mindestens 200 dpi. Für diesen Kompressionsmodus (und den darüber) sind auch keine „character substitution“-Hinweise in den Bedienungsanleitungen oder Admin-Panels; zumindest nicht in denen, die ich kenne.

Heute im Laufe des Tages konnte ich nun das Nummernvertauschungsproblem auf einem Xerox WorkCentre 7545 reproduzieren, und zwar unter Benutzung des „higher“-Kompressionsmodus, mit noch großzügiger gewählten 300 dpi Auflösung. Wie ihr euch alle vorstellen könnt, könnte das auf ein sehr ernstes Problem hindeuten. Nicht nur würde das Zahlenvertauschen auch mit den Fabrikeinstellungen vorkommen und damit alle betreffen, auch Xerox' Pressestatements wären nicht akkurat gewesen, wenn auch sicher wohlgemeint.

Hätte es wirklich so einfach sein können, Xerox?

Ich bekomme Kommentare und Mails, die etwas sehr interessantes sagen. Kann es sein, dass im hier verwendeten JBIG2-Algorithmus direkt ein „Lossless“-Flag eingebaut ist, der den ganzen Mist hätte verhindern können, wenn man ihn nur angestellt hätte? Diese Pressemeldung sagt das zumindest (danke, Flavio). Money Quote:

supports traditional “lossless” compression, but also a new „lossy“ type of image compression, whereby the compression factor is increased on average by a factor of about 3 to 10, without noticeable visual differences compared with the lossless mode.

Die „lossy“-Variante ist das, was die Fehler hier verursacht. Das wichtige ist, wie der Auszug zu lesen ist. Der Faktor 3-10 bezieht sich auf die Lossy-Variante. Insgesamt heißt das, dass JBIG 2 wohl im lossless mode etwas kleinere Dokumente produziert als andere Kompressionsverfahren, und im lossymode noch mal massiv kleinere, aber u.U. auf Kosten der Datenintegrität.

Nummern-Veränderungen vielleicht nicht nur ein Xeroxproblem?

Die Frage, ob die Scanfehler nur ein Xeroxproblem sind, könnte beantwortet worden sein. Ich habe eine Mail von einem Brother-Kunden erhalten, der den Fehler auf einem Brother MFC-9140CDN reproduzieren konnte. Angehängt an die Mail war eine ausgedruckte und eingescannte Seite meines Zahlen-TestPDFs, wo mindestens eine 6 ersetzt wurde durch eine schöne, saubere 8. Anfrage bei Brother steht aus.

Edit: Brother hat sich gemeldet, und gesagt, dass sie vom Problem nicht betroffen sind. Auf den ersten Blick sieht es so aus, als würde der Brother weniger Ziffern ersetzen als die Xerox-Geräte. Aber, Vorsicht: Ich habe diesen Fehler nicht selbst reproduziert, und leider steht die Geräte-ID auch nicht im PDF, sondern dort steht „Paperport 12“, also kann ich auch nicht wissen, auf welche weise die Daten jetzt wo genau durch die Mangel gedreht wurden. Es könnte auch die empfangende Software gewesen sein. Nehmt es als Hörensagen und seid verantwortungsvoll, wenn ihr irgendwas verbreitet. Diese Meldungen schlagen im Moment so ein, dass man niemals sicher sein kann, dass irgendeine potentielle Sensationsmail in meiner Box nicht Bestandteil einer Spindoctorkampagne ist. Nichtsdestotrotz nehme ich gerne weitere Geräte in meine „Hörensagenliste möglicherweise betroffener Geräte“ auf. 8-)

Xerox kündigt Softwarepatch an

Einen Tag nach dem ersten Statement, das im wesentlichen bereits bekannte Informationen enthielt, gibt es nun ein weiteres Statement von Xerox.

Darin kündigt Xerox einen Softwarepatch an, der den fraglichen Kompressionsmodus komplett abstellt. Das ist die absolute Radikallösung, denn der Modus wurde immerhin in den Hochglanzprospekten als High-end-Feature hervorgetan. Wie ich hier ja schon mehrfach geschrieben habe, ist patch based lossy compression in einem Dokumentenscanner eher fehl am Platze.

Speicherknappheit ist nicht mehr verbreitet, und wenn man bei keinem der gescannten Dokumente Rechtssicherheit hat, oder Angst haben muss die Rentenkasse zu entlasten, indem man der eigenen Oma die Medikamentendosierung mit Xerox-Geräten scannt, ist das sicherlich auch nicht im Sinne des Erfinders.