Sie sind nicht angemeldet.

Lieber Besucher, herzlich willkommen bei: GEOS-InfoBase-Forum. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

21

Sonntag, 10. Dezember 2017, 00:14

Zeichensatz-Problem

Hier ist noch was faul.



Wir müssen noch präziser werden. Hatte die "clp2geos" im Editor umgeschrieben und erneut eingelesen. Wenn die Formate innerhalb GEOS passen, muß ich die Skripte ebenfalls ändern und nicht bloß so ungefähr arbeiten.
"Always Look On The Bright Side Of Life!"

22

Sonntag, 10. Dezember 2017, 02:24

Der Export nach GEOS klappt regelmäßig, das nachfolgende Einlesen der Hostdatei zumeist - zumindest, solange keine Sonderzeichen im Spiel sind.



Das Zurückschreiben nach Linux mit Sonderzeichen ist zunächst ebenfalls kein Problem.



Jetzt öffne ich die CLP2HOST-Datei mit dem Editor: Schrott.



GEOS und der "Clipper" sind während der ganzen Zeit offen geblieben. Ebensowenig habe ich im Texteditor etwas verändert. Gleichwohl ist das erneute Einlesen unter Linux ein Fehlschlag.



Ein Speicherproblem? Gelegentlich taucht nach dem Erstellen der CLP2HOST.TXT im Manager das DOS-Icon für die Datei auf - Indiz für einen nicht richtig abgearbeiteten Vorgang.

GEOS geschlossen, neu hochgefahren und CLP2HOST.TXT mit drei Anwendungen geöffnet. Ist schon spannend.



GeoWrite wollte die Textdatei jedenfalls nicht importieren.

Nachtrag: Entschuldigt die vielen Bilder.
"Always Look On The Bright Side Of Life!"

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »msgeo« (10. Dezember 2017, 02:57)


23

Sonntag, 10. Dezember 2017, 09:46

"Viele Bilder" finde ich gut, macht die Sache anschaulicher. Für meine Sehstärke Sehschwäche sind sie aber zu klein, um wirklich Unterschiede ausmachen zu können.

Wenn du den Inhalt aus CLP2HOST.TXT ansiehst, muss entweder der benutzte Linux-Editor den Windows-Zeichensatz verwenden, oder ein Skript muss vor dem Öffnen der Datei den Inhalt nach UTF-8 wandeln (wenn es unbedingt UTF-8 für die Weiterverarbeitung sein muss). Die Datei nicht unter GEOS öffnen, der Inhalt wurde ja von Clipper schon im Windows-Format abgelegt.

In der CLP2GEOS.TXT muss der Inhalt mit einem Windows-Zeichensatz kodiert abgelegt sein. Also vorher umwandeln und dann die Datei nicht mehr unter Linux öffnen, sondern unter GEOS mit Clipper einlesen.
Bernd

24

Sonntag, 10. Dezember 2017, 12:54

Rainer nennt in der R-BASIC Doku keinen konkreten Zeichensatz.
Ich habe mir damals die Unterstützung von "Codepages" komplett geklemmt. Das war mir einfach zu aufwändig, wenn man es richtig machen will. Also habe ich die Umrechnungstabelle für "Windows-Zeichensatz" basierend auf dem zur damaligen Zeit aktuellen Windows "Standard-Zeichensatz" erstellt. (Wann war das noch gleich? Win 95? Win 98? oder schon später?) Also mit dem Zeichensatz mit dem der Editor und / oder Word TXT-Dateien speichern. Fragt den Geier, von welchem Römer der abstammt.

Das große Problem mit den Codepages ist aus meiner Sicht, dass es viele Zeichen gibt, die in GEOS einfach nicht existieren - und anderes herum. "Konvertieren" ist also ein nichttriviales Problem, bei dem man bestimmte Entscheidungen treffen muss (z.B: welches Ersatzeichen nehme ich denn nun? Was mache ich bei der "Zurück-Konvertierung" mit einem "Ersatzzeichen"?), die durch das Konzept "Codepage" nicht abgedeckt sind.

Vielleicht sollte ich das noch mal recherchieren, was ich damals gemacht habe, und es irgendwo sauber dokumentieren - vornehmlich im Anhang ;-)

Gruß
Rainer
Es gibt 10 Arten von Menschen - die einen wissen was binär ist, die anderen nicht.

25

Sonntag, 10. Dezember 2017, 12:57

"Viele Bilder" finde ich gut, macht die Sache anschaulicher. Für meine Sehstärke Sehschwäche sind sie aber zu klein, um wirklich Unterschiede ausmachen zu können.
Ich kann das Problem ebenfalls nicht nachvollziehen. Ich weiss weder was das Problem ist (fehlende Buchstaben? Falsche Umlaute?) noch was ich tun muss um es zu reproduzieren ?(
Rainer
Es gibt 10 Arten von Menschen - die einen wissen was binär ist, die anderen nicht.

26

Sonntag, 10. Dezember 2017, 14:09

Ich kann das Problem ebenfalls nicht nachvollziehen. Ich weiss weder was das Problem ist (fehlende Buchstaben? Falsche Umlaute?) noch was ich tun muss um es zu reproduzieren ?(

Bernd hat das Problem benannt. Als ich meine beiden Skripte heute nacht in den Tray eingebunden hatte, habe ich ein paarmal daraufgeklickt und mich gefreut, wie schnell und leise das alles ging. Dann kam mir wohl die Idee, die "clp2host.txt" unter GEOS manuell zu verändern - erst den Text im Clipper (ging zwar, wurde aber nicht exportiert), und nachfolgend im Editor. Bei der Kontrolle im Linux-Speicher-Manager zeigte sich plötzlich nur Schrott. Ich habe dann die deutschen Sonderzeichen nach GEOS hinübergeschoben und die "clp2geos.txt" mit drei verschiedenen Anwendungen geöffnet: dem Standard-Texteditor, Nathan Fiedlers Editor und dem Clipper: drei verschiedene Anzeigen - nur der Clipper war korrekt. Daraus folgt: Hände weg von den Austauschdateien oder Bearbeitungsmöglichkeit im Clipper, wenn man schnell mal etwas umschreiben möchte.

Gleichwohl ist das Problem des korrekten Zeichensatzes nicht vom Tisch. Es gibt beim Konvertieren die Möglichkeit, nichtkonvergente Zeichen zu unterdrücken - aber das Ergebnis ist nicht praktikabel.
"Always Look On The Bright Side Of Life!"

27

Sonntag, 10. Dezember 2017, 17:38

Ja, da sind sie wieder, die Probleme mit dem exakten formulieren. Auch wenn es nevig ist, Forumsleser können nicht Hellsehen. Ich zumindest nicht :P
Ein paar Beispiele (Ich lass jetzt einfach mal den Oberlehrer raushängen):
Hatte die "clp2geos" im Editor umgeschrieben
Unter GEOS oder unter Linux? ?(
Wenn die Formate innerhalb GEOS passen, muß ich die Skripte ebenfalls ändern
Was heißt "Formate passten unter GEOS"? Wer passt zu wem? ;(
Ich habe dann die deutschen Sonderzeichen nach GEOS hinübergeschoben

Genau. Völlig klar. Gut dass die Sonderzeichen eine Griff zum Schieben haben :huh:

Bernd hat das Problem benannt.

Und wo genau? Vermutlich indem er schrieb (aber wie kann ich da sicher sein):
Die Datei nicht unter GEOS öffnen, der Inhalt wurde ja von Clipper schon im Windows-Format abgelegt.

So, genug gemeckert. Ich hoffe du verstehst das Problem und bist mir ob meiner Offenheit nicht böse :cursing:
Ich würde gern meine Programme so fehlerfrei wie möglich machen. Solche Diskussionen hier im Forum helfen mir dabei sehr, weil ich jedes Mal gegenchecken kann, ob es irgendwo ein Problem geben könnte. Manchmal weisen mich die Diskussionen auf einige Sachen hin, an die ich selbst noch gar nicht gedacht habe.

Gruß
Rainer
Es gibt 10 Arten von Menschen - die einen wissen was binär ist, die anderen nicht.

28

Sonntag, 10. Dezember 2017, 21:24

Zeichensatz-Formate

Zeichensatz-Formate laut UltraEdit (file -i filename hatte lediglich "us-ascii" angezeigt):

GEOS-Standard "Text-Editor": CP850 - OEM Latin 1
Nathan Fiedlers "Text Editor": CP852 - OEM Latin 2 (funktioniert im Gegensatz zu den anderen Formaten jedenfalls)
Text-Export aus GeoWrite: CP852 - OEM Latin 2 (funktioniert im Gegensatz zu den anderen Formaten jedenfalls)
Clipper: ISO-8859-1 (Western European)

Meine Skripte brauchen nicht geändert zu werden.
"Always Look On The Bright Side Of Life!"

29

Sonntag, 10. Dezember 2017, 22:38

Hängt der benutzte Zeichensatz für den Export von Geos nach Dos nicht vom "Dos Keyboard" ab? Mir war so, also ob Geos da flexibel sei....
d[ 0_O ]b

30

Sonntag, 10. Dezember 2017, 23:35

Bei den Problemen, die ich offensichtlich selbst verursacht hatte, habe ich den Tastaturtreiber nicht vertauscht.

Noch einmal zum Ablauf (die von mir eingebundenen Grafiken waren wohl zu klein): Ich habe zunächst die vom Clipper angelegte Datei "clp2host.txt" mit dem alten Text-Editor (tedit.geo) manuell umgeschrieben und gespeichert. Anschließend unter Linux ins Clipboard geladen: Schrott.

Danach habe ich unter Linux die deutschen Umlaute kopiert und per Skript in die Datei "clp2geos.txt" geschrieben. Diese von UTF-8 in ISO-8859-1 konvertiert. Die "clp2geos.txt" habe ich unter GEOS gleichzeitig mit drei Anwendungen geöffnet: Text-Editor (tedit.geo), Text Editor (texted.geo) und mit Bernds "Clipper". Alle drei Anwendungen zeigten etwas anderes an - nur der Clipper das Korrekte: "äöüß". Die beiden Editoren: Schrott, aber unterschiedlichen. Bei solchem Handlungserfolg beginnt man sich natürlich für die Zeichensätze zu interessieren. Das führte zu dem Ergebnis

GEOS-Standard "Text-Editor": CP850 - OEM Latin 1
Nathan Fiedlers "Text Editor": CP852 - OEM Latin 2 (funktioniert im Gegensatz zu den anderen Formaten jedenfalls)
Clipper: ISO-8859-1 (Western European)

Daraus folgt, da meine Mini-Skripte UTF-8 in ISO-8859-1 (oder zurück) konvertieren: auch wenn man unter Geos schnell noch bearbeiten möchte, was man unter Linux in die Zwischenablage legt, man kann dafür nicht mal eben die Editoren oder Geowrite verwenden; es muß unter GEOS kopiert und dann mit dem "Clipper" in eine Datei geschrieben werden. Wieweit die Tastaturtreiber dann noch hineinspielen, will ich garnicht erst wissen. Am besten orientiere ich mich ausschließlich an Bernds Programm; das ist im Ergebnis ohnehin mehr, als wir vorher hatten.

Ich weiß nicht, ob es in Linux Bordmittel gibt, die auf der Konsole abfragen können, um welches Format es sich bei der Quelldatei handelt, bevor eine Konvertierung erfolgt. Der "file"-Befehl tut es jedenfall nicht.
"Always Look On The Bright Side Of Life!"

31

Montag, 11. Dezember 2017, 08:23

Hallo zusammen

Der Befehl "file" schaut einfach die ersten 4 Bytes an -> Magic Code. Ist da eine Unicode-Magic-Byte-Folge (ach, wie liebe ich Deutsch), wird das erkannt. Ansonsten wird er bei Text-Dateien diese als ASCII identifizieren.

Meiner Meinung nach kann man bei ASCII Textdateien gar nicht erkennen, welche Codepage bei dieser zugrunde liegt. Das ist ein Grund für die Empfehlung wenn immer möglich UTF-8 (oder -16 / -32) zu verwenden.

Eventuell sollte Clipper intern auch mit UTF-8 arbeiten? Das ist aber definitiv nicht trivial.

Bei meinem "geosps2pdf" übersetze ich auch die Zeichen für den Dateinamen, welche ich aus dem Dokumenten-Name generiere. Hatte dazu mal ein Dokument begonnen, siehe angehängtes PDF.

Gruss
Andreas
»bolle732« hat folgende Datei angehängt:

32

Montag, 11. Dezember 2017, 12:09

Meiner Meinung nach kann man bei ASCII Textdateien gar nicht erkennen, welche Codepage bei dieser zugrunde liegt.
UltraEdit bietet zumindest an, die vorgefundene Zeichenkette unter "Ansicht/Ansicht als Dateikodierung" in auswählbaren Codepages anzuzeigen. So kann ich zumindest sehen, ob ein bestimmter Zeichensatz funktionieren könnte.

Deine Tabelle läßt erahnen, wie problematisch eine Konvertierung sein kann. Zum Glück muß ich das nicht machen; die Skripte sind ja nur ein Taschenmesserchen, um die Zwischenablagen auszutauschen. Ich halte mich stur an Bernds Clipper. Es wäre allerdings schön, wenn man im Clipper den angezeigten Textinhalt einer Zwischenablage notfalls editieren und das Ergebnis dann nach "clp2host.txt" schreiben könnte - notfalls mit einem Kopier-Knopf.
"Always Look On The Bright Side Of Life!"

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »msgeo« (11. Dezember 2017, 16:12)


33

Montag, 11. Dezember 2017, 16:35

Aus meiner ganz privaten und Programmier-Sicht stellt sich das Problem mit den Zeichensätzen von der Grundidee her so dar:

1. Ein "Zeichensatz" ist eine Sammlung von Bildern und einer Zuordnung, welches Bild welchem 8-Bit Code entspricht. Sonderfälle wie Codes unter Code 32 und unvollständigen "Zuordnungtabellen" (7-Bit-Codes) mal abgesehen.

2. Daraus folgt, dass man einer Text-Datei nicht ansehen kann, welcher Zeichensatz verwendet wurde.

3. Ein Programm kann natürlich versuchen die Zuordnung zu "erraten". auf eine deutschen Computer wird eher ein ü als ein n mit Tilde vorkommen. Das OEM in der Bezeichnung heißt für mich: Anwendersperifisch - als nicht standardisiert.

4. Jedes Programm (umfasst auch "GEOS" und "Windows") liest die Codes ein und interpretiert sie als Bildfolge. Es "weiß" nicht, das wir zwei schräg nach oben verlaufende Striche, die sich oben treffen und einen Querbalken in der Mitte haben, ein A nennen.
Genau das ist das Problem für uns.

5. Eine "CodePage" ist eine Anweisung, welche Bilder zu welchem Code gehören sollen. Leider hat BillyBoy das Konzept nicht so kommuniziert - und insgesamt auch so unhandlich gestaltet, dass viele Programmierer es nicht benutzen. So kam es zu dem Wildwuchs, den wir jetzt haben.


Soviel zur vollständigen Verwirrung :P

Gruß
Rainer
Es gibt 10 Arten von Menschen - die einen wissen was binär ist, die anderen nicht.

34

Montag, 11. Dezember 2017, 16:58

Skripte, Korrekturen

Skriptnamen jetzt Bernds Programm angepaßt und den Import der "clp2host.txt" nach Linux modifiziert. Vorher kam es bei mehrfachem (zufälligen) Klicken auf das Symbol dazu, daß die nach UTF-8 umgeschriebene Datei beim zweiten oder dritten Mal jeweils als ISO-8859-1 eingelesen wurde und die Ergebnisse im Linux-Speicher entsprechend ausfielen.
https://www.geosfiles.de/app/download/71…sh?t=1513007390
https://www.geosfiles.de/app/download/71…sh?t=1513007325

Mit diesem Skript kann der Linux-Speicher mehrmals an die "clp2geos.txt" angehängt werden.
https://www.geosfiles.de/app/download/71…sh?t=1513022823

Ich stelle zwecks Verbesserungsvorschlägen mal den Text ein:

iconv -f ISO_8859-1 /root/.dosemu/drive_c/clp2geos.txt -t UTF-8 -o /root/.dosemu/drive_c/clp2host.txt -s
clipit -c >> /root/.dosemu/drive_c/clp2geos.txt
echo -e \ >> /root/.dosemu/drive_c/clp2geos.txt
iconv -f UTF-8 /root/.dosemu/drive_c/clp2geos.txt -t ISO_8859-1 -o /root/.dosemu/drive_c/clp2geos.txt -s
"Always Look On The Bright Side Of Life!"

Dieser Beitrag wurde bereits 3 mal editiert, zuletzt von »msgeo« (11. Dezember 2017, 21:17)


35

Mittwoch, 13. Dezember 2017, 11:24

Rainer nennt in der R-BASIC Doku keinen konkreten Zeichensatz.
Ich habe mir damals die Unterstützung von "Codepages" komplett geklemmt. Das war mir einfach zu aufwändig, wenn man es richtig machen will. Also habe ich die Umrechnungstabelle für "Windows-Zeichensatz" basierend auf dem zur damaligen Zeit aktuellen Windows "Standard-Zeichensatz" erstellt. (Wann war das noch gleich? Win 95? Win 98? oder schon später?) Also mit dem Zeichensatz mit dem der Editor und / oder Word TXT-Dateien speichern.
Funktioniert meiner Meinung nach auch aktuell noch gut genug. Martin hat die Probleme unter seinem Linux auch in den Griff bekommen, wenn ich das richtig verstanden habe.
"FileReadLine" und "Convert$" bieten eigentlich auch genügend Steuerungsmöglichkeiten. Sogar meine unter macOS erstellten HTML-Dokumente, die LF als Zeilenendezeichen verwenden, lassen sich richtig umbrochen einlesen.
Bernd

36

Mittwoch, 13. Dezember 2017, 11:32

Martin hat die Probleme unter seinem Linux auch in den Griff bekommen, wenn ich das richtig verstanden habe.

Ja - wobei ein Konsolen-Profi das vielleicht eleganter hinbekommen hätte.
"Always Look On The Bright Side Of Life!"

37

Mittwoch, 13. Dezember 2017, 14:02

Ich benötige die Pfade zum Laufwerk C unter Ubuntu/Mint für die Dosemu (evtl. DOSBox?). Ich weiß nicht, ob ihr GEOS dort als root oder als user startet. @Achim: antiX? Wichtig, ob Dosemu aus den Repositories oder von Jens-Dietmar/Wolfgang/Andreas mit dem eigens angelegten Programmordner. Ein Pfad von einem DOSBox-Anwender wäre ebenfalls nicht verkehrt.

Ich will zwei Skripte (GEOS rein und raus) für alle Anwendungsfälle schreiben, bei denen man das Zutreffende aktivieren kann.
"Always Look On The Bright Side Of Life!"

Frank9652

Fortgeschrittener

Beiträge: 361

Beruf: Backup-Administrator

  • Nachricht senden

38

Mittwoch, 13. Dezember 2017, 15:37

Ich will da nur mal was als Idee reinwerfen, vielleicht ist es zu was nützlich für neue Denkanstöße.

Vor vielen vielen Jahre, anno domini achzehnhundert... hatte ich das Problem von defekten Geowrite-Dateien.
Ich suchte eine Möglichkeit zumindest den Text als reinen ASCII retten zu können und dabei die ganzen Sonder- und Steuerzeichen löschen zu können.
Ich war dann damals auf das DOS-Programm "Textreplace" gestoßen (Download TREP200.ZIP - letzte Seite der Tabelle, Zeile 7 von oben ) gestoßen. In Textreplace konnte man in einer Textdatei auf der linken Seite die Zeichen eingeben, die konvertiert werden sollten, und auf der rechten Seite in der selben Datei das Zeichen eingeben dass das erstere ersetzen sollte.
Ich ersetzte die ganzen Sonderzeichen durch Leerzeichen. Später ließ ich mir von einem Freund ein Programm schreiben (EXHOPP.ZIP - Seite 2 der Tabelle, Zeile 30 ) mit dem ich Zeichenketten (also mehrere Lehrzeichen hintereinander) löschen konnte.

Gruß Frank
Geos x Asus EeePC 1015PN + SSD = doppelte Lichtgeschwindigkeit zum Quadrat

39

Mittwoch, 13. Dezember 2017, 16:01

Hallo Frank,

danke für Deinen Hinweis; schaue ich mir an. Das Ersetzen von Leerzeichen habe ich immer mit GeoWrite erledigt. Hatte Dir die salvage.exe bei Deinen ramponierten Dateien nicht helfen können? Gerade gesehen: liegt BBE nicht mehr bei, und NDO 2000 offenbar auch schon nicht mehr.
"Always Look On The Bright Side Of Life!"

40

Mittwoch, 13. Dezember 2017, 20:28

Ich benötige für die Dosemu-Installation von Andreas' Seite für Ubuntu/Mint noch den Pfad zur "clp2geos.txt".

/home/username/Programme/???/???/clp2geos.txt?
"Always Look On The Bright Side Of Life!"

Zur Zeit sind neben Ihnen 4 Benutzer in diesem Thema unterwegs:

4 Besucher

Ähnliche Themen

Thema bewerten