Post by Andreas BoruttaPost by HC AhlmannPost by Andreas Borutta* auch verbundene Zellen müssen korrekt übertragen werden
* Zahlen dürfen nicht umgewandelt werden
Beispieltabelle: https://borumat.de/-/test
[...]
Post by HC AhlmannHast Du ein Probelm mit der Übertragung oder mit dem Ergebnis als Datum?
Am geposteten Ergebnisscreenshot kannst Du die beiden Knackpunkte
sehen.
Die Information, welche Zellen verbunden sind, geht beim Einfügen in
Excel verloren.
Gelangt diese Information durch copy in die Zwischenablage?
Falls nicht, müsste statt "Aachen" mit einem Tab der Ortsname mit zwei
Tabs in Excel eingefügt werden, damit "Essen" in Spalte D steht – das
geht nicht in der Zwischenablage, aber mit dem Umweg über einen
Texteditor, search&replace und einem zweiten copy&paste.
Post by Andreas BoruttaPost by HC AhlmannDie Spalten C und E interpretieren die Dezimalzahlen als Datum – 3.2 als
03. Feb und 1.9 als 01. Sep – das ist durch das Zahlenformat der Spalten
zu beheben (Umwandlung von Dezimalpunkt in Dezimalkomma geht auch, aber
nicht in der Zwischenablage).
Und für das Problem der unerwünschten Umwandlung der Dezimalzahlen mit
Dezimalpunkt in ein Datum habe ich auch keine Lösung.
Wenn der Zwischenschritt mit einem Texteditor gewählt würde, wäre auch
der Dezimalpunkt durch ein Dezimalkomma zu ersetzen.
Vielleicht gibt meine Lösung bei einem vergleichbaren Problem unter
MacOS mit Applescript, Automator und Handarbeit eine konzeptionelle
Anregung. Darin übernehmen Applescript und Automator die stumpfsinnigen
Aufgaben des Downloads, Kopierens und Veränderns, während manuell
Kontrolle, Auswahl und abschließende Sicherung stattfinden:
• Durch ein permanent laufendes Applescript mit einer Schleife und
Zeitbedingung, das vier Automator-Programme aufruft, werden täglich vier
Textextrakte von vier Webseiten in je eine Textdatei geschrieben,
schematisch benannt und einen Ordner "Rohdaten" verschoben (ergibt 16
Textdateien à 3kB pro Tag).
• Ein weiteres Applescript dupliziert den Ordner "Rohdaten", entfernt
durch einen applescript-fähigen Texteditor unerwünschte Strings
(Disclaimer, Cookie-Warner, Fülltext usw.) aus den Textdateien in
"Rohdaten Kopie" und wandelt Strings der Art "1.24 9" in das gewünschte
Format "1,249" um (das betrifft die Temperaturen oder den zu
verdoppelnden Tabulator Deines Problems). Meist bleibt eine Zeile aus
vier bis sieben tabulator-separierten Wort- und Wertepaaren mit zwei
Zeitstempeln am Zeilenende übrig; ab und an ändert sich die Webseite und
weitere Zeilen mit Strings sind manuell oder durch ein angepasstes
Applescript zu eliminieren. Dieses Script wird nach Laune alle paar Tage
manuell angestoßen und konzentriert die Textdateien auf weniger als 140
Byte.
• Die so gewonnenen Textdateien mit gleichem Namensanfang werden mit dem
Finder alphabetisch sortiert und im Terminal mit cat zusammengefügt, was
vier Textdateien mit vier Zeilen pro Tag liefert (das findet manuell
statt und wäre dem zuvor laufenden Skript anzuhängen).
• Die zusammengefügten Textdateien werden manuell mit Excel geöffnet,
vier ausgewählte Spalten manuell per copy&paste in ein Exceltabelle
übertragen, dass durch Formeln und Filter die gewünschten Werte in einer
Zeile wiedergibt (wechselnde Zeitstempel erfordern manuelle Auswahl im
Filter), die wiederum in einer weiteren Auswertungstabelle durch
copy&paste zusammengefügt, auf gleiche Datumstempel (Vollständigkeit)
geprüft werden und das gewünschte Ergebnis liefern – für vier fixe
Uhrzeiten an jedem Tag vier Preise einer Spritsorte an vier Tankstellen.
• Es muss noch aufgeräumt werden: Der Ordner "Rohdaten Kopie" mit den
verbundenen Textdateien wird archiviert, die unverbundenen Dateien <140
Byte werden gelöscht, der Ordner "Rohdaten" mit den originalen,
aufgeblähten Textdateien wird geleert (sie würden beim nächsten Mal
wieder bearbeitet). Alle Exceltabellen mit Zwischenschritten (Formel,
Filter, Formatierung) werden ohne sichern geschlossen (nur die letzte
nicht).
Der Ablauf hat Potential zur Straffung und Automatisierung, aber dazu
reichen meine Motivation, Kenntnisse und Zeitersparnis noch nicht aus.
--
Munterbleiben
HC