Umlaute und Sonderzeichen (Support für das Suchscript)

Udo Leuschner ⌂ @, Heidelberg, Monday, 13.06.2022, 21:23 (vor 895 Tagen)

Sehr geehrter Herr Weisshart,

Ihr PHP-Skript war mir eine große Hilfe, nachdem die Telekom ältere PHP-Versionen abgeschaltet hat. Auf denen basierte nämlich mein altes PHP-Skript "planetsearch", das ich mehr als ein Jahrzehnt lang verwendet habe. Ich habe nun Ihres wie das alte an fünf Stellen meiner Homepage eingesetzt, um größere Textmengen durchsuchen zu können. Auch ohne Indexierung klappt das wunderbar. Sogar ein mehr als 500 Seiten umfassendes Buch wird in Bruchteilen einer Sekunde durchsucht (siehe https://udo-leuschner.de/liberalismus/fdp0.htm).

Allerdings haben alle Suchergebnisse den Schönheitsfehler, dass Umlaute und Sonderzeichen verstümmelt sind. Zuerst habe ich versucht, dieses Problem durch Änderungen in der Kodierung der Datei suchen.php zu lösen. Dann fand ich im Support-Forum die Anfrage eines Nutzers vom Juli 2019, der es auf dieselbe Weise versucht hat und dem Sie geraten haben, die alte Kodierung "windows-1252" wieder herzustellen. Ferner schrieben Sie: "Das alleine genügt leider nicht. Die Dateien müssen auch mit dieser Codierung abgespeichert werden. Die suchen.php wird leider vom Server immer noch als UTF-8 ausgeliefert."

Ich möchte Sie bitten, diese Empfehlung zu konkretisieren: Welche Dateien müssen mit der Kodierung "windows-1252" neu abgespeichert werden? Etwa alle Text-Dateien, die vom Skript durchsucht werden? Das wären auf meiner Homepage etwa zehntausend Textdateien. So etwas lässt sich manuell nicht bewältigen, und mit der maschinellen Umkodierung von HTML-Texten bin ich schon mal böse reingefallen. Unter diesen Umständen würde ich die verstümmelten Umlaute als kleineres Übel betrachten.

Oder gibt es doch noch andere Möglichkeiten?

Mit bestem Dank für eine kurze Antwort und freundlichen Grüßen

Udo Leuschner

Eintrag gesperrt
1763 Views

gesamter Thread: