Site Suche

Site menu:

 

open all | close all

 

Archiv


Ich höre gerade
@ 04.12.08 04:00:


Mike Oldfield
Taurus 2

Five Miles Out

UTF-8 nach ISO-8859-1

4. August 2007 von Lars Schenk

Ein UTF-8 basierter RSS-Feed soll auf einer Site mit ISO-8859-1 Kodierung gerendert werden.
An der Kodierung soll festgehalten werden.

Ich gebe dem xml Parser beim Erstellen explizit das Encoding der Quelle an:

$xml_parser = xml_parser_create(”UTF-8″);

Die so empfangenen Zeichen kann ich jedoch nicht direkt ausgeben, weil die Site ja in ISO-8859-1 ausgegeben wird. Diverse Sonderzeichen werden als Fragezeichen dargestellt.

Abhilfe schafft dieser Workaround:

echo mb_convert_encoding($text, ‘HTML-ENTITIES’, “UTF-8″);

Weiterführende Artikel:
FAQ: Changing (X)HTML page encoding to UTF-8
de.php.net/mbstring

Der Beitrag wurde am Samstag, den 4. August 2007 um 00:42 Uhr von Lars Schenk veröffentlicht. Sie können die Kommentare zu diesen Eintrag durch den RSS 2.0 Feed verfolgen. Sie können einen Kommentar schreiben, oder einen Trackback auf Ihrer Seite einrichten.

Kategorie: tech-recipes
Social Bookmarks Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • Digg
  • del.icio.us
  • Google Bookmarks
  • YahooMyWeb
  • Webnews
  • StumbleUpon
  • Folkd
  • Furl
  • Live-MSN
  • Slashdot
  • Y!GG
  • Bloglines
  • Technorati
  • Linkarena
  • MisterWong
  • Ask
  • Facebook
  • TwitThis

2 Reaktionen zu “UTF-8 nach ISO-8859-1”

  1. Oliver

    Um xml-konform arbeiten zu können, reicht das aber nicht, weil jedes ‘&’ als Fehler ausgewertet wird. Abhilfe schafft, den konvertierten Text in CDATA einzuschließen:
    echo “”;

  2. Yury

    jawohl, das habe ich gesucht..

    nun kann ich Googlenews als rss in eine Kundenseite verbauen.

    Trotz der Angabe &ie=iso-8859-1 lieferte google UTF-8

    http://news.google.de/news?hl=de&um=1&tab=wn&q=test&ie=iso-8859-1&output=rss

    vielen Dank

Einen Kommentar schreiben