Umlaute und Sonderzeichen (Support für das Suchscript)

Udo Leuschner ⌂ @, Heidelberg, Monday, 13.06.2022, 21:23 (vor 654 Tagen)

Sehr geehrter Herr Weisshart,

Ihr PHP-Skript war mir eine große Hilfe, nachdem die Telekom ältere PHP-Versionen abgeschaltet hat. Auf denen basierte nämlich mein altes PHP-Skript "planetsearch", das ich mehr als ein Jahrzehnt lang verwendet habe. Ich habe nun Ihres wie das alte an fünf Stellen meiner Homepage eingesetzt, um größere Textmengen durchsuchen zu können. Auch ohne Indexierung klappt das wunderbar. Sogar ein mehr als 500 Seiten umfassendes Buch wird in Bruchteilen einer Sekunde durchsucht (siehe https://udo-leuschner.de/liberalismus/fdp0.htm).

Allerdings haben alle Suchergebnisse den Schönheitsfehler, dass Umlaute und Sonderzeichen verstümmelt sind. Zuerst habe ich versucht, dieses Problem durch Änderungen in der Kodierung der Datei suchen.php zu lösen. Dann fand ich im Support-Forum die Anfrage eines Nutzers vom Juli 2019, der es auf dieselbe Weise versucht hat und dem Sie geraten haben, die alte Kodierung "windows-1252" wieder herzustellen. Ferner schrieben Sie: "Das alleine genügt leider nicht. Die Dateien müssen auch mit dieser Codierung abgespeichert werden. Die suchen.php wird leider vom Server immer noch als UTF-8 ausgeliefert."

Ich möchte Sie bitten, diese Empfehlung zu konkretisieren: Welche Dateien müssen mit der Kodierung "windows-1252" neu abgespeichert werden? Etwa alle Text-Dateien, die vom Skript durchsucht werden? Das wären auf meiner Homepage etwa zehntausend Textdateien. So etwas lässt sich manuell nicht bewältigen, und mit der maschinellen Umkodierung von HTML-Texten bin ich schon mal böse reingefallen. Unter diesen Umständen würde ich die verstümmelten Umlaute als kleineres Übel betrachten.

Oder gibt es doch noch andere Möglichkeiten?

Mit bestem Dank für eine kurze Antwort und freundlichen Grüßen

Udo Leuschner

Eintrag gesperrt
1128 Views
Avatar

Umlaute und Sonderzeichen

Fritz ⌂, Tuesday, 14.06.2022, 09:42 (vor 653 Tagen) @ Udo Leuschner

Erster Versuch:

In der search_config.php die Zeile (ca.)20 entkommentieren, d.h. ändern von
// $encoding = "utf";
in
$encoding = "utf";

Eintrag gesperrt
1096 Views

Umlaute und Sonderzeichen

Udo Leuschner @, Wednesday, 15.06.2022, 12:55 (vor 652 Tagen) @ Udo Leuschner

Vielen Dank. Der Tip war richtig. Jedenfalls sind die falschen Umlaute zu mehr als neunzig Prozent beseitigt. Mit dem Rest kann ich leben.

Eintrag gesperrt
1079 Views
Avatar

Umlaute und Sonderzeichen

Fritz ⌂, Thursday, 16.06.2022, 21:26 (vor 651 Tagen) @ Udo Leuschner

Ich hab' da eine Vermutung, was die 10% betrifft.
Bei welchem Suchbegriff tritt das Problem denn auf? Dann schau' ich mir das gerne nochmal an.