PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Problem mit Zeichensatz bzw. Dateisystem



Mac86
30.10.06, 14:56
Hallo,

ich habe eine ext3 Partition die als /home gemountet ist und da scheint es Probleme mit dem Zeichensatz bzw. dem Dateisystem zu geben. Ich weiss nicht genau woran es liegen kann oder wo ich suchen soll, deshalb hier erstmal ein screenshot.

http://img153.imageshack.us/img153/1149/umlautedo7.th.jpg (http://img153.imageshack.us/my.php?image=umlautedo7.jpg)

Wie man sieht werden Umlaute falsch dargestellt. Mal als zwei Kaestchen und mal als Fragezeichen. Es hat bisher eigentlich keine Probleme verursacht und wuerde auch nicht weiter stoeren. Jedoch kann ich so keine CDs/DVDs mit Joilet brennen. Ohne Joilet geht es problemlos. Naja und ausserdem ist es ja etwas unschoen.

Weiss einer woran das liegt und wie man es wegbekommt? Systemzeichensatz ist UTF-8 auf einem Ubuntu Dapper 64Bit System.

Gruss Mac86

kreol
30.10.06, 15:12
Hast Du die Dateien ggf. von einer Windows-Partition gezogen? Wahrscheinlich ist dort ein anderer Charset verwendet worden, dann wäre convmv Dein Freund.

Die Partition ist sicher ext3? Was steht in der /etc/fstab?


Kreol

Mac86
30.10.06, 16:01
uff...also ich verwende seit fast 3 jahren nur Linux, ich weiss gra nicht ob die Dateien schon so alt sind. Das Problem ist aber iirc erst seitdem ich Ubuntu habe. Und das ist seit Maerz.


Hier mal meine /etc/fstab:

# /etc/fstab: static file system information.
#
# <file system> <mount point> <type> <options> <dump> <pass>
proc /proc proc defaults 0 0
/dev/sda1 / ext3 defaults,errors=remount-ro 0 1
/dev/sda2 /home ext3 defaults 0 2
/dev/sda3 none swap sw 0 0
/dev/hda /media/cdrom0 udf,iso9660 user,noauto 0 0
/dev/fd0 /media/floppy0 auto rw,user,noauto 0 0


Auch wenn ich im ersten post nur von /home geredet habe, es ist auch auf der systempartition die beide, wie man sieht, ext3 sind.

Ixot
30.10.06, 17:03
Poste doch bitte mal die Ergebnisse von

$ echo ä | file -
beziehungsweise

$ file <pfad zu einer betroffenen datei>

Vermutlich stimmt mit dem Zeichensatz tatsächlich etwas nicht. Afaik verwendet Ubuntu UTF-8.

Mac86
30.10.06, 17:11
tux@ubuntu:~$ echo ä | file -
/dev/stdin: UTF-8 Unicode text



tux@ubuntu:~$ file stuff/sounds/misc/Bodo\ Bach\ -\ Haribo\ Cola-Fl�hen.mp3
stuff/sounds/misc/Bodo Bach - Haribo Cola-Fl�hen.mp3: MP3 file with ID3 version 2.3.0 tag

Ixot
30.10.06, 18:47
Ups sorry. Ich meinte eigentlich

echo <datei.mp3> | file -

Es geht darum den Zeichensatz des Datenamens zu ermitteln. :)

Mac86
31.10.06, 13:25
tux@ubuntu:~$ echo stuff/sounds/misc/Bodo\ Bach\ -\ Haribo\ Cola-Fl�hen.mp3 | file -
/dev/stdin: ISO-8859 text


hm...komisch. Ist gar kein UTF-8. Ist da der Fehler?

kreol
31.10.06, 22:11
convmv wurde doch schon genannt. Laß es halt mal auf die Datei(en) los. Manpage dafür gibts auch ;)


Kreol

Mac86
01.11.06, 23:06
ja ok, ich habe das jetzt mal drauf gemacht und mir die hilfe durchgelesen und den dateinamen versucht umzuaendern. allerdings sagt er das es schon UTF8 ist.


tux@ubuntu:~/stuff/sounds/misc$ convmv -f iso-8859-1 -t utf8 Bodo\ Bach\ -\ Haribo\ Cola-Fl�hen.mp3
Skipping, already UTF-8: ./Bodo Bach - Haribo Cola-Fl�hen.mp3
No changes to your files done. Use --notest to finally rename the files.


auch mit --notest gehts nicht. da sagt er auch das es schon UTF8 ist nur anstatt der emldung sagt er eben "Ready!" weil er es halt von UTF8 in UTF8 convertiert hat.

nur wie kann das sein? ich hab doch mit "echo <datei> | file -" erst ermittelt das es ISO8859 ist.

kreol
01.11.06, 23:18
Ist doch eigentlich ganz praktisch, daß convmv per default nur einen Probelauf macht, da verliert Experimentieren etwas an Risiko. Wenn er ohne --notest einen Fehler meldet brauchst Du es mit schon nicht mehr zu probieren ;)

Was sagt der echo-Befehl von Ixot (Danke übrigens, der war mir neu ;) ) denn jetzt? Vesuchs ggf. mal mit verschiedenen Zeichensätzen als Quelle/Ziel. Auf Anhieb fiele mir z.B. auch iso8859-15 ein. Vllt. erstellst Du vorsorglich eine Kopie von ein paar Problemdateien und experimentierst erst mit denen, --notest hin oder her...


Kreol

Mac86
01.11.06, 23:51
Was sagt der echo-Befehl von Ixot (Danke übrigens, der war mir neu ;) ) denn jetzt? Vesuchs ggf. mal mit verschiedenen Zeichensätzen als Quelle/Ziel. Auf Anhieb fiele mir z.B. auch iso8859-15 ein. Vllt. erstellst Du vorsorglich eine Kopie von ein paar Problemdateien und experimentierst erst mit denen, --notest hin oder her...

das ergebnis des befehls hab ich oben schon gepostet.

wo ist eigentlich der unterschied zwischen den einzelnen ISO-8859-1, ...., ISO-8859-15 ? der befehl sagt mir ja lediglich das es ISO-8859 ist, also ohne die zusaetzliche zahl.

kreol
01.11.06, 23:58
Die Ausgabe, die Du gepostet hast, war doch vor dem Einsatz von convmv, oder habe ich das falsch verstanden? Jetzt sollte da ggf. was anderes stehen. Bei einer meiner Dateien lautet die Ausgabe "/dev/stdin: ASCII text".

iso8859 ist der Westeuropäische Zeichensatz, afaik liegt der Unterschied zwischen -1 und -15 in der Erweiterung um das €-Zeichen. Ich hatte aber z.B. bei html2text oder ähnlichem je nach Zeichensatz der Datei (beides iso8859, mal -1, mal -15) schon die erstaunlichsten, hier bislang nicht nachvollzogenen Ergebnisse mit Umlauten. Deswegen denke ich, daß ein wenig Experimentieren nicht schadet...


Kreol