Informatik, Photos, und Ameisen in einem Terrarium.

David ist Informatiker mit biologischem Interesse. Ihn faszinieren dezentral organisierte Systeme. Er arbeitet als Systemingenieur bei der IVU Traffic Technologies AG an Themen im Umfeld von Continuous Delivery und DevOps.




Xerox-Scanprobleme voll bestätigt, tatsächlich Software-Bug

Heute Nacht gibt es gute Neuigkeiten: Rick Dastin und Francis Tse haben gerade angerufen. Lange Rede, kurzer Sinn:

  • Es war in der Tat ein Bug,
  • in der Tat können alle Kompressionsmodi Zahlen vertauschen, über eine ganze Masse an Gerätetypen hinweg,
  • am wichtigsten, sie haben den Bug gefunden,
  • ein Patch wird gerade entwickelt,
  • und sie wollen, dass ich ihn teste (das ist eine Ehre, herzlichen Dank!).

Hier ist ihre Presseerklärung. Dann gehe ich ja doch nicht in die Geschichte ein als der Typ, der zu doof war, die Anleitung zu lesen. 8-)

Alle drei Kompressionsstufen vertauschen Zahlen (Xerox WorkCentre 7545, laut Leser auch 7655)

Wie ihr wahrscheinlich mittlerweile alle wisst, haben die Xerox WorkCentres drei Scan-Kompressionsmodi: Normal, higher und highest. Xerox hatte im Questions and Answers-Papier angegeben, dass der „normal“-Modus der nummernvertauschende wäre, und alles ab „higher“ ab 200dpi sicher wäre.

Vor ein paar Tagen hatte ich bemerkt, dass auch der „higher“-Modus auf einem Xerox WorkCentre 7545 in meiner Heimatstadt Bonn vertauschte Zahlen produzierte, selbst mit einer großzügig gesetzten Auflösung von 300 dpi. Ich gab diese Ergebnisse an Xerox weiter, und nachdem sie es auf einem 7545 in den USA getestet und ebenfalls vertauschte Zahlen gesehen hatten, gab es hier einen detaillierten Artikel.

Das alles stand bereits im starken Kontrast zu den Bildschirmmitteilungen, den Anleitungen (zumindest zu denen, die ich kenne) und sogar zu Xerox' aktuellen Pressestatements – alle diese haben nur Ersetzungswarnungen mit Blick auf den Modus „normal“ ausgesprochen und sogar gesagt, der Rest wäre sicher.

Xerox untersucht neue Nummernvertauschungs-Funde

Im zweiten Presse-Statement von Xerox hat Rick Dastin, Vice President at Xerox Corporation, gesagt: „You will not see a character substitution issue when scanning with the factory default settings.“ In Xerox' offiziellem Technischen Statement zum Thema werden diese factory default settings definiert: Gemeint sind der Kompressionsmodus „higher“ und eine Auflösung von mindestens 200 dpi. Für diesen Kompressionsmodus (und den darüber) sind auch keine „character substitution“-Hinweise in den Bedienungsanleitungen oder Admin-Panels; zumindest nicht in denen, die ich kenne.

Heute im Laufe des Tages konnte ich nun das Nummernvertauschungsproblem auf einem Xerox WorkCentre 7545 reproduzieren, und zwar unter Benutzung des „higher“-Kompressionsmodus, mit noch großzügiger gewählten 300 dpi Auflösung. Wie ihr euch alle vorstellen könnt, könnte das auf ein sehr ernstes Problem hindeuten. Nicht nur würde das Zahlenvertauschen auch mit den Fabrikeinstellungen vorkommen und damit alle betreffen, auch Xerox' Pressestatements wären nicht akkurat gewesen, wenn auch sicher wohlgemeint.

Hätte es wirklich so einfach sein können, Xerox?

Ich bekomme Kommentare und Mails, die etwas sehr interessantes sagen. Kann es sein, dass im hier verwendeten JBIG2-Algorithmus direkt ein „Lossless“-Flag eingebaut ist, der den ganzen Mist hätte verhindern können, wenn man ihn nur angestellt hätte? Diese Pressemeldung sagt das zumindest (danke, Flavio). Money Quote:

supports traditional “lossless” compression, but also a new „lossy“ type of image compression, whereby the compression factor is increased on average by a factor of about 3 to 10, without noticeable visual differences compared with the lossless mode.

Die „lossy“-Variante ist das, was die Fehler hier verursacht. Das wichtige ist, wie der Auszug zu lesen ist. Der Faktor 3-10 bezieht sich auf die Lossy-Variante. Insgesamt heißt das, dass JBIG 2 wohl im lossless mode etwas kleinere Dokumente produziert als andere Kompressionsverfahren, und im lossymode noch mal massiv kleinere, aber u.U. auf Kosten der Datenintegrität.

Nummern-Veränderungen vielleicht nicht nur ein Xeroxproblem?

Die Frage, ob die Scanfehler nur ein Xeroxproblem sind, könnte beantwortet worden sein. Ich habe eine Mail von einem Brother-Kunden erhalten, der den Fehler auf einem Brother MFC-9140CDN reproduzieren konnte. Angehängt an die Mail war eine ausgedruckte und eingescannte Seite meines Zahlen-TestPDFs, wo mindestens eine 6 ersetzt wurde durch eine schöne, saubere 8. Anfrage bei Brother steht aus.

Edit: Brother hat sich gemeldet, und gesagt, dass sie vom Problem nicht betroffen sind. Auf den ersten Blick sieht es so aus, als würde der Brother weniger Ziffern ersetzen als die Xerox-Geräte. Aber, Vorsicht: Ich habe diesen Fehler nicht selbst reproduziert, und leider steht die Geräte-ID auch nicht im PDF, sondern dort steht „Paperport 12“, also kann ich auch nicht wissen, auf welche weise die Daten jetzt wo genau durch die Mangel gedreht wurden. Es könnte auch die empfangende Software gewesen sein. Nehmt es als Hörensagen und seid verantwortungsvoll, wenn ihr irgendwas verbreitet. Diese Meldungen schlagen im Moment so ein, dass man niemals sicher sein kann, dass irgendeine potentielle Sensationsmail in meiner Box nicht Bestandteil einer Spindoctorkampagne ist. Nichtsdestotrotz nehme ich gerne weitere Geräte in meine „Hörensagenliste möglicherweise betroffener Geräte“ auf. 8-)

Recent changes RSS feed Creative Commons License Donate Minima Template by Wikidesign Driven by DokuWiki