╔═════════════════════════════════════════════════════════════════════╗
║ Dateierweiterungsberichtigungsaufruf                                ║
║ Dienstag,  7. August 2018, 14:03                      errorpriester ║
╚═════════════════════════════════════════════════════════════════════╝
Es passiert mir in letzter Zeit sehr oft, daß ich Excel-Dateien bekomme. Ich glaube, daß ich Excel-dateien bekomme. Was ich bekomme sind Textdateien mit der Endung .xls. Und das ist eine furchtbare Unsitte. Ich habe nichts gegen Excel, als Viewer für kleine bis mittelgroße Tabellen kann man das schon nehmen. Ernsthaft arbeiten kann bzw. will ich damit nicht, aber darum geht es gar nicht.

Natürlich müssen Onlinetools wie ID-Konverter tabellarische Daten einlesen wie ausgeben. Über den Krampf das für die jeweilige Seite korrekte Eingabeformat hinzubekommen dreht sich dieser Rant auch nicht, das bin ich gewöhnt und solange dasteht, was sie haben wollen (nein, das ist leider nicht immer der Fall) bekomme ich das auch hin.

Und dann kommt die Ausgabe. Schlimmstenfalls als HTML-Tabelle über meherere Seiten, also völlig wertlos bzgl. Weiterverarbeitung. Bestenfalls als Datei. Das Format ist mir da egal, ob XML, JSON, CSV, BED, GFF, VCF oder eins der hundert anderen Standardformate. Krieg ich schon eingelesen, kein Ding. Meinetwegen auch XLS, XLSX, ODS oder DBase III. Aber verdammt nocheins, bezeichnet die Datei korrekt.

Ja, Excel öffnet Tab-separated Text ohne Kommentar, wenn die Datei .xls hinten heißt. Aber mein Excel-Parser für R haut mir das dann (zu recht!) um die Ohren. Und auch bei Excel kommt es zu Problemen, sobald mal der Dezimaltrenner ein anderer ist oder ein String aussieht wie ein Datum. Also immer.

Ich glaube, die meisten Dienste bieten "Results as Excel-file" an, weil sie Angst haben, daß die armen Nutzer mit einer .csv-Datei überfordert sind. Obwohl Excel auch die problemlos öffnet und man dann sogar noch Importoptionen anpassen kann.

Das ist doch völliger Stuss! Lasst das alle mal sein. Nennt es .txt wenn es Text ist. Oder .csv oder von mir aus auch .tsv wenn es nicht comma- sondern tab-delimited ist.

Ja, ich höre die Schlauberger schon unken, »Hurr Durr, eine Datei an der Endung zu erkennen ist naiv«. Stimmt. Und es ist nun keine unlösbare Aufgabe daraus geworden, aber es ist einfach falsch.

Auch etwas in der Art habe ich schon in freier Wildbahn gesehen und es schmerzt. Sehr.

$ file /tmp/foo.png
/tmp/foo.png: JPEG image data, JFIF standard 1.01


TL;DR: Online-dienste, benennt eure Dateien korrekt, verdammt.