<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress.com" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>

<channel>
	<title>iso-8859-1 &amp;laquo; WordPress.com Tag Feed</title>
	<link>http://en.wordpress.com/tag/iso-8859-1/</link>
	<description>Feed of posts on WordPress.com tagged "iso-8859-1"</description>
	<pubDate>Sat, 05 Dec 2009 00:55:36 +0000</pubDate>

	<generator>http://en.wordpress.com/tags/</generator>
	<language>en</language>

<item>
<title><![CDATA[Mudando a configuração do Encoding de UTF8 para ISO-8859-1]]></title>
<link>http://thaleseduardo.wordpress.com/2009/07/22/mudando-a-configuracao-do-encoding-de-utf8-para-iso-8859-1/</link>
<pubDate>Wed, 22 Jul 2009 15:44:31 +0000</pubDate>
<dc:creator>thaleseduardo</dc:creator>
<guid>http://thaleseduardo.wordpress.com/2009/07/22/mudando-a-configuracao-do-encoding-de-utf8-para-iso-8859-1/</guid>
<description><![CDATA[Bom, tudo começou quando precisei fazer uma busca de arquivos no servidor de arquivos. Quando perceb]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Bom, tudo começou quando precisei fazer uma busca de arquivos  no servidor de arquivos. Quando percebi que quando eu listava os arquivos, os que tinham acentos, vinham todos com caracteres loucos. Eu até pensei que era algo de configuração no proprio servidor mas percebi que só acontecia quando eu acessava remotamente por ssh. Então pesquisando no grandioso google, percebi que tambem existia várias pessoas com o mesmo problema, então depois de umas horas procurando achei um script que fazia quase tudo, então peguei o script e acrescentei algumas linhas e deu tudo certo.</p>
<p><!--more--></p>
<p>Então vamos ao que interessa.</p>
<p>Crie uma pasta chamade de Encoding e dentro dela crie quatro arquivos: environment, local, locale e AlterarEncodig.sh.</p>
<p>No arquivo <strong>environment</strong>, coloque as linhas abaixo:</p>
<p>PATH=&#8221;/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games&#8221;<br />
LANG=&#8221;pt_BR&#8221;<br />
LANGUAGE=&#8221;pt_BR:pt:en&#8221;</p>
<p>No arquivo <strong>local, </strong>coloque as linhas abaixo:</p>
<p>pt_BR.ISO-8859-1 ISO-8859-1<br />
en_US.ISO-8859-1 ISO-8859-1</p>
<p>No arquivo <strong>locale, </strong>coloque as linhas abaixo:</p>
<p>LANG=&#8221;pt_BR&#8221;<br />
LANGUAGE=&#8221;pt_BR:pt:en&#8221;</p>
<p>No arquivo <strong>AlterarEncodig.sh</strong>, coloque dentro dele os códigos abaixo:</p>
<p><code>#!/bin/bash</code></p>
<p><code>echo "Esse script mudará a configuração do Encoding de UTF-8 para ISO-8859-1."<br />
echo "É necessário que voce esteja logado como root para execução do script!"</code></p>
<p><code>echo "Para continuar digite y(YES), caso contrário digite n(NO)!"<br />
read var</code></p>
<p><code>if [ $var = "y" ]; then</code></p>
<p><code>echo "Iniciando Mudanca no Encoding."</code></p>
<p><code>echo "Removendo arquivos da variavel locales!"<br />
rm -r /var/lib/locales/supported.d/*</code></p>
<p><code>sleep 2</code></p>
<p><code>echo "Copiando novo arquivo local para variavel locales!"<br />
cp -r local /var/lib/locales/supported.d/</code></p>
<p><code>sleep 2</code></p>
<p><code>echo "Alterando o arquivo locale do /etc!"<br />
cp -r locale /etc/default/</code></p>
<p><code>sleep 2</code></p>
<p><code>echo "Alterando o arquivo environment do /etc!"<br />
cp -r environment /etc/</code></p>
<p><code>sleep 2</code></p>
<p><code>echo "Adicionando pt_BR pt_BR.ISO-8859-1 em /etc/locale.alias"<br />
echo "pt_BR pt_BR.ISO-8859-1" &#62;&#62; /etc/locale.alias</code></p>
<p><code>sleep 2</code></p>
<p><code>echo "Adicionando variaveis em /etc/profile"<br />
echo "export LANG=pt_BR" &#62;&#62; /etc/profile<br />
echo "export LC_CTYPE="pt_BR""  &#62;&#62; /etc/profile<br />
echo "export LC_NUMERIC="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_TIME="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_COLLATE="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_MONETARY="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_MESSAGES="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_PAPER="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_NAME="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_ADDRESS="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_TELEPHONE="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_MEASUREMENT="pt_BR"" &#62;&#62; /etc/profile<br />
echo "export LC_IDENTIFICATION="pt_BR"" &#62;&#62; /etc/profile</code></p>
<p><code>sleep 4</code></p>
<p><code>echo "Executando comandos para configuração do Encoding!"<br />
localedef pt_BR -i pt_BR -f ISO-8859-1</code></p>
<p><code>sleep 5</code></p>
<p><code>localedef pt_BR.ISO-8859-1 -i pt_BR -f ISO-8859-1</code></p>
<p><code>sleep 5</code></p>
<p><code>localedef pt_BR.ISO8859-1 -i pt_BR -f ISO-8859-1</code></p>
<p><code>sleep 5</code></p>
<p><code>dpkg-reconfigure locales</code></p>
<p><code>sleep 5</code></p>
<p><code>locale-gen -purge</code></p>
<p><code>sleep 5</code></p>
<p><code>locale-gen</code></p>
<p><code>sleep 5</code></p>
<p><code>echo "Pronto! Agora será necessário reiniciar o seu sistema.<br />
Salve e feche todos os aplicativos que estiverem abertos."</code></p>
<p><code>echo "O sistema pode ser reiniciado?"<br />
echo "Digite y(yes) ou n(NO)."<br />
read ver</code></p>
<p><code>if [ $ver = "y" ]; then<br />
echo "Reiniciando o Sistema!"<br />
reboot<br />
else<br />
echo "O sistema será reiniciado manualmente."<br />
fi</code></p>
<p><code>else</code></p>
<p><code>echo "Cancelado pelo usuario!"</code></p>
<p><code>fi</code></p>
<p><code>exit</code></p>
<p>Depois de ter feito esses passos agora vamos dar permissão de execução no arquivo <strong>AlterarEncodig.sh.</strong></p>
<p>chmod +x AlterarEncoding.sh</p>
<p>Pronto agora é só executar:</p>
<p>./AlterarEncoding.sh</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Convertire tutti i file ISO-8859-1 in utf-8 ]]></title>
<link>http://chalda.wordpress.com/2009/06/07/convertire-tutti-i-file-iso-8859-1-in-utf-8/</link>
<pubDate>Sun, 07 Jun 2009 20:31:38 +0000</pubDate>
<dc:creator>chalda</dc:creator>
<guid>http://chalda.wordpress.com/2009/06/07/convertire-tutti-i-file-iso-8859-1-in-utf-8/</guid>
<description><![CDATA[find /directory/da/modificare -type f -exec sh -c "( iconv --from-code ISO-8859-1 --to-code UTF-8 {}]]></description>
<content:encoded><![CDATA[find /directory/da/modificare -type f -exec sh -c "( iconv --from-code ISO-8859-1 --to-code UTF-8 {}]]></content:encoded>
</item>
<item>
<title><![CDATA[Acentos, latin1, utf-8, LaTeX...]]></title>
<link>http://ddcampayo.wordpress.com/2009/05/19/acentos-latin1-utf-8-latex/</link>
<pubDate>Tue, 19 May 2009 12:20:59 +0000</pubDate>
<dc:creator>ddcampayo</dc:creator>
<guid>http://ddcampayo.wordpress.com/2009/05/19/acentos-latin1-utf-8-latex/</guid>
<description><![CDATA[Otra entrada en español, sobre un asunto que lleva tiempo dándome guerra. En algún momento, linux fu]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Otra entrada en español, sobre un asunto que lleva tiempo dándome guerra. En algún momento, linux fue cambiando de la <a href="http://es.wikipedia.org/wiki/Codificación_de_caracteres" target="_blank">codificación de caracteres</a> (<a href="http://en.wikipedia.org/wiki/Character_encoding" target="_blank"><em>encoding</em></a>) <a href="http://en.wikipedia.org/wiki/Latin1" target="_blank"><strong>latin1</strong></a> al estándar actual, <a href="http://en.wikipedia.org/wiki/UTF-8" target="_blank"><strong>utf-8</strong></a>.</p>
<p>Como resultado, los documentos en texto, sobre todo las famosas &#8220;fuentes LaTeX, que nunca hay que cambiar porque son texto&#8221; pueden cambiar después de todo (a efectos prácticos). En algunos sitios, como <a href="http://mindspill.net/computing/linux-notes/determine-and-change-file-character-encoding.html" target="_blank">mindspill</a>, he visto por fin cómo determinar y cambiar la codificación.</p>
<p><!--more--></p>
<p>Primeramente, un viejo conocido, el comando <strong>file</strong>, puede proporcionarnos la codificación de un archivo (si es que está definida):</p>
<blockquote><p>$ file -i *.tex<br />
prueba1.tex: text/plain charset=utf-8<br />
prueba2.tex: text/plain charset=utf-8<br />
prueba3.tex: text/plain charset=iso-8859-1<br />
prueba4.tex: text/plain charset=utf-8</p></blockquote>
<p>Lo he aplicado a una serie de archivos que contienen acentos, todos utf-8 menos uno (iso-8859-1 es la manera correcta de decir latin1). Para convertir de uno a otro está el comando <strong>iconv</strong> (que viene con el paquete glibc en mi distribución linux):</p>
<blockquote><p>iconv -f utf-8 -t latin1 prueba2.tex &#62; prueba3.tex</p></blockquote>
<p>&#8220;-f&#8221; es &#8220;from&#8221;, &#8220;-t&#8221;, &#8220;to&#8221;, y hay que redireccionar (&#8220;pipetear&#8221;) la salida del comando hacia otro fichero. iconv -l devuelve una larga lista de codificaciones posibles.</p>
<p>Hay algunos aspectos que todavía no comprendo bien. Por ejemplo, cómo distintos editores, como emacs y vi, distinguen la codificación automáticamente y por qué a veces no se ponen de acuerdo. Puede que se deba incluso a que vi se corre en modo de texto, desde una terminal y emacs, por lo general, es gráfico. Esto está relacionado con una vieja solución a este problema (&#8220;export TERM=C&#8221;) que, por lo visto, ya no es necesaria.</p>
<p><strong>Nota</strong>: El comando LaTeX para utf8 es:</p>
<blockquote>
<pre><code><span><span>\</span>usepackage</span>[utf8]{inputenc}
% </code><code>(utf8x si hay problemas)</code>
<code>
</code></pre>
</blockquote>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[[CC] Conversão entre ISO-8859-1 e UTF-8]]></title>
<link>http://danielbauermann.wordpress.com/2009/04/24/cc-conversao-entre-iso-8859-1-e-utf-8/</link>
<pubDate>Fri, 24 Apr 2009 18:40:44 +0000</pubDate>
<dc:creator>Daniel Bauermann</dc:creator>
<guid>http://danielbauermann.wordpress.com/2009/04/24/cc-conversao-entre-iso-8859-1-e-utf-8/</guid>
<description><![CDATA[Não sei se o iconv está disponível em todas as distribuições, mas no Slackware tem. $ iconv -f iso-8]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Não sei se o iconv está disponível em todas as distribuições, mas no Slackware tem. <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<pre>$ iconv -f iso-8859-1 -t utf-8 arquivo_iso.txt &#62; arquivo_utf.txt</pre>
<blockquote><p>Dentre as páginas que citam o comando, uma delas é <a title="Outra blog que cita como executar a conversão" href="http://www.opcaolinux.com.br/gnulinux/dicas/14-comandos-linux/33-como-converter-arquivos-iso-8859-1-para-utf-8-e-vice-versa.html">esta</a> &#8211; de onde busquei o exemplo.</p></blockquote>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Zeichensatz, von ISO-8859-x zu UTF-8 ]]></title>
<link>http://shopnix.wordpress.com/2009/03/26/zeichensatz-von-iso-8859-x-zu-utf-8/</link>
<pubDate>Thu, 26 Mar 2009 21:49:44 +0000</pubDate>
<dc:creator>spessart</dc:creator>
<guid>http://shopnix.wordpress.com/2009/03/26/zeichensatz-von-iso-8859-x-zu-utf-8/</guid>
<description><![CDATA[Es gibt eine Reihe guter Gründe, auf den Internationalen Zeichensatz UTF-8 umzustellen. Alle Sprache]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Es gibt eine Reihe guter Gründe, auf den Internationalen Zeichensatz UTF-8 umzustellen.</p>
<ul>
<li>Alle Sprachen können im gleichen Zeichensatz behandelt werden</li>
<li>Betriebssysteme stellen um</li>
<li>XHTML nennt UTF-8 als Standard</li>
<li>Browser schalten automatisch auf UTF-8 wenn nicht explizit anderes gefordert wird</li>
</ul>
<p>Im osCommerce Shop stellt man den Zeichensatz in der ersten sprachabhängigen Datei pro Sprache ein, z.B. in includes/languages/german.php, jeweils ein Mal pro Sprache, für Shop und Admin getrennt.</p>
<p>Standardmäßig wird Deutsch in ISO-8859-1 ausgeliefert, dem Zeichensatz für Westeuropa. Der Wert ist als Konstante definiert [define('CHARSET', 'iso-8859-1');] und taucht im Quelltext der ausgelieferten HTML-Seite als Meta-Tag wieder auf.</p>
<pre>&#60;<span class="start-tag">meta</span><span class="attribute-name"> http-equiv</span>=<span class="attribute-value">"Content-Type" </span><span class="attribute-name">content</span>=<span class="attribute-value">"text/html; charset=iso-8859-1"</span>&#62;</pre>
<p>Will ich nun umstellen, genügt es natürlich nicht, nur diese Einstellung zu ändern, denn die soll nur den Browser darüber informieren, wie die Seite zu interpretieren ist. Ich muss außerdem die sprachabhängigen Dateien umkodieren. Unter Linux geht das sehr schön mit dem Tool &#8220;recode&#8221;.</p>
<pre>recode ISO-8859-1..UTF-8 german.php</pre>
<p>Der gegebene Anlaß für diese Aktion ist die Anforderung, einen polnischen Shop aufzubauen. Die passende Sprach-Contribution steht im Zeichensatz für Mitteleuropa, ISO-8859-2 zur Verfügung, und ich codiere sie schon vor der Inbetriebnahme um.</p>
<p>Für die Datenübernahme bekomme ich eine Exceltabelle, die ich mit OpenOffice öffne und als ASCII-Datei gleich in UTF-8 abspeichere.</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Os caracteres especiais da tabela ISO 8859 Latin-1 ]]></title>
<link>http://littleoak.wordpress.com/2009/02/12/os-caracteres-especiais-da-tabela-iso-8859-latin-1/</link>
<pubDate>Thu, 12 Feb 2009 17:46:50 +0000</pubDate>
<dc:creator>littleoak</dc:creator>
<guid>http://littleoak.wordpress.com/2009/02/12/os-caracteres-especiais-da-tabela-iso-8859-latin-1/</guid>
<description><![CDATA[&amp;Aelig; Æ &amp;Aacute; Á &amp;Acirc; Â &amp;Agrave; À &amp;Aring; Å &amp;Atilde; Ã &amp;Auml; Ä ]]></description>
<content:encoded><![CDATA[&amp;Aelig; Æ &amp;Aacute; Á &amp;Acirc; Â &amp;Agrave; À &amp;Aring; Å &amp;Atilde; Ã &amp;Auml; Ä ]]></content:encoded>
</item>
<item>
<title><![CDATA[UTF-8 or ISO-9959-1 this is the question]]></title>
<link>http://alessioma.wordpress.com/2009/01/24/utf-8-or-iso-9959-1-this-is-the-question/</link>
<pubDate>Sat, 24 Jan 2009 14:28:02 +0000</pubDate>
<dc:creator>bayois</dc:creator>
<guid>http://alessioma.wordpress.com/2009/01/24/utf-8-or-iso-9959-1-this-is-the-question/</guid>
<description><![CDATA[La spiegazione completa fatta dal W3C di tutta la questione pre filo e per segno si trova QUI L]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>La spiegazione completa fatta dal W3C di tutta la questione pre filo e per segno si trova <a href="http://www.w3.org/International/tutorials/tutorial-char-enc/#declaring">QUI</a></p>
<p>L&#8217;applicazione in ambito J2EE viene spiegata dalla Sun <a href="http://java.sun.com/developer/technicalArticles/Intl/HTTPCharset/">QUI</a></p>
<p>Un riassunto fatto da uno sviluppatore <a href="http://blogs.warwick.ac.uk/kieranshaw/entry/utf-8_internationalisation_with">QUI</a></p>
<p>Invece <a href="http://www.ietf.org/rfc/rfc3629.txt">QUI</a> si trova la <strong>bibbia</strong></p>
<p>Novità sul fronte charset in arrivo dall&#8217;HTML5, pare venga aggiunto un nuovo <a href="http://blog.whatwg.org/the-road-to-html-5-character-encoding">META</a></p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Codificação do Sistema Operacional - Arch Linux]]></title>
<link>http://pobrecomputeiro.wordpress.com/2009/01/14/codificacao-do-sistema-operacional-arch-linux/</link>
<pubDate>Wed, 14 Jan 2009 12:15:59 +0000</pubDate>
<dc:creator>lmmoreira</dc:creator>
<guid>http://pobrecomputeiro.wordpress.com/2009/01/14/codificacao-do-sistema-operacional-arch-linux/</guid>
<description><![CDATA[Por muito tempo tive dor de cabeça com a codificação do Arch Linux. Codificação nada mais é que o co]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Por muito tempo tive dor de cabeça com a codificação do Arch Linux.</p>
<p>Codificação nada mais é que o conjunto de caracteres habilitados no seu sistema operacional, por exemplo: UTF-8, ISO-8859-1.</p>
<p>O default do Arch e se não me engano da maioria dos sistemas Unix é UTF-8, porém o Windows trabalha com ISO-8859-1 (Até onde eu sei).</p>
<p>Então como meu Arch trabalhava em uma codificação diferente, quando eu recebia arquivos vindos do Windows com acentos, os mesmos sumiam e davam lugar a um &#60;?&#62; muito estranho, dizendo que o Arch não sabia que caractere era aquele. Caso eu mudasse meu sistema para ISO-8859-1 este problema aconteceria com arquivos vindos de outras máquinas Linux.</p>
<p>Ruim não é.</p>
<p>Pois é.</p>
<p>Explicarei o pouco que pesquisei sobre a forma que a codificação é configurada no Arch Linux.</p>
<p>Em <strong>/etc/</strong> existe um arquivo chamado <strong>locale.gen</strong> (você pode altera-lo na instalação do Arch ou depois de instalado).</p>
<p>Este arquivo locale.gen lista todas as codificações conhecidas, perceba que a maioria está comentada (#), isto é não está habilitada. As codificações descomentadas representam codificações que o seu sistema suporta-rá.</p>
<p>Portanto, procure pela string (<strong>pt_BR</strong>), estou imaginando que você fale português do Brasil, caso seja do Uzbequistão ou outro procure a codificação correspondente a seu idioma.</p>
<p>No meu caso eu descomentei as strings:</p>
<p style="padding-left:30px;">pt_BR.UTF-8 UTF-8</p>
<p style="padding-left:30px;">pt_BR ISO-8859-1</p>
<p>Salve e feche o arquivo.</p>
<p>Agora, antes de continuar é necessário gerar os locales que você descomentou, faça isso com o comando</p>
<p style="padding-left:30px;">locale-gen</p>
<p>Agora que os locales estão gerados não significa que seu sistema compreende os caracteres que você descomentou, a coisa continua no arquivo <strong>/etc/rc.conf</strong>.</p>
<p>Abra-o.</p>
<p>Na instalação do Arch Linux, na parte de configuração do rc.conf, a maioria dos tutoriais pede para você configurar este bloco de código desta forma:</p>
<p style="padding-left:30px;">LOCALE=&#8221;pt_BR.utf8&#8243;<br />
HARDWARECLOCK=&#8221;localtime&#8221;<br />
USEDIRECTISA=&#8221;no&#8221;<br />
TIMEZONE=&#8221;America/Sao_Paulo&#8221;<br />
KEYMAP=&#8221;br-abnt2&#8243;<br />
CONSOLEFONT=<br />
CONSOLEMAP=<br />
USECOLOR=&#8221;yes&#8221;</p>
<p>Porém assim você está dizendo para o seu sistema suportar apenas a codificação &#8220;pt_BR.utf8&#8243;.</p>
<p>Resumindo, não importa quais locales estão descomentados no seu <strong>locale.gen</strong> se o seu rc.conf está configurado apenas para uma (UTF-8).</p>
<p>Portanto o que você deve fazer para que seu sistema suporte as duas codificações brasileiras (pt_BR.UTF-8 e pt_BR ISO-8859-1) é alterar a linha locale para:</p>
<p style="padding-left:30px;">LOCALE=&#8221;pt_BR&#8221;</p>
<p>Logo:</p>
<p style="padding-left:30px;">LOCALE=&#8221;pt_BR&#8221;<br />
HARDWARECLOCK=&#8221;localtime&#8221;<br />
USEDIRECTISA=&#8221;no&#8221;<br />
TIMEZONE=&#8221;America/Sao_Paulo&#8221;<br />
KEYMAP=&#8221;br-abnt2&#8243;<br />
CONSOLEFONT=<br />
CONSOLEMAP=<br />
USECOLOR=&#8221;yes&#8221;</p>
<p>Pronto, reinicie a máquina e seu sistema estará suportanto as duas codificações simultaneamente.</p>
<p>Sei que o post trata de um assunto meio besta porém eu fiquei um bom tempo com aqueles &#60;?&#62; vindos do Windows.</p>
<p>Obrigado a todos</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Caracteres Especiales]]></title>
<link>http://netzky.wordpress.com/2009/01/02/caracteres-especiales/</link>
<pubDate>Fri, 02 Jan 2009 16:40:17 +0000</pubDate>
<dc:creator>netzky</dc:creator>
<guid>http://netzky.wordpress.com/2009/01/02/caracteres-especiales/</guid>
<description><![CDATA[Si alguna vez en alguna aplicacion que estas desarrollando o pagina web, te has topado con estos car]]></description>
<content:encoded><![CDATA[Si alguna vez en alguna aplicacion que estas desarrollando o pagina web, te has topado con estos car]]></content:encoded>
</item>
<item>
<title><![CDATA[CakePHP: Behavior para converter entre iso-8859-1 e utf-8]]></title>
<link>http://gutoferreira.wordpress.com/2008/11/27/cakephp-behavior-para-converter-entre-iso-8859-1-e-utf-8/</link>
<pubDate>Thu, 27 Nov 2008 10:52:30 +0000</pubDate>
<dc:creator>Augusto Ferreira</dc:creator>
<guid>http://gutoferreira.wordpress.com/2008/11/27/cakephp-behavior-para-converter-entre-iso-8859-1-e-utf-8/</guid>
<description><![CDATA[Para aplicações que utilizam múltiplas bases com codificações diferentes, utilize utf-8 como padrão ]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Para aplicações que utilizam múltiplas bases com codificações diferentes, utilize utf-8 como padrão e para os models que se conectam aos bancos com codificação iso-8859-1 inclua este behavior.</p>
<p>Código disponível no Bakery do CakePHP-Brasil.org:</p>
<p><a href="http://bakery.cakephp-brasil.org/articles/view/behavior-para-converter-entre-iso-8859-1-e-utf-8">http://bakery.cakephp-brasil.org/articles/view/behavior-para-converter-entre-iso-8859-1-e-utf-8</a></p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Configurando Encode do Netbeans no Linux e a Periquita?]]></title>
<link>http://blogprototipo.wordpress.com/2008/11/07/configurando-encode-do-netbeans-no-linux-e-a-periquita/</link>
<pubDate>Fri, 07 Nov 2008 17:03:09 +0000</pubDate>
<dc:creator>blogprototipo</dc:creator>
<guid>http://blogprototipo.wordpress.com/2008/11/07/configurando-encode-do-netbeans-no-linux-e-a-periquita/</guid>
<description><![CDATA[Bom&#8230;Hoje sofri com o Encode do NetBeans. Estava utilizando Windows pra desenvolver no NetBeans]]></description>
<content:encoded><![CDATA[Bom&#8230;Hoje sofri com o Encode do NetBeans. Estava utilizando Windows pra desenvolver no NetBeans]]></content:encoded>
</item>
<item>
<title><![CDATA[Codificació UTF-8 per a Outlook utilitzant comanda mailto]]></title>
<link>http://carlesbonfill.com/2008/11/06/codificacio-utf-8-per-a-outlook-utilitzant-comanda-mailto/</link>
<pubDate>Thu, 06 Nov 2008 18:01:26 +0000</pubDate>
<dc:creator>carlesbonfill</dc:creator>
<guid>http://carlesbonfill.com/2008/11/06/codificacio-utf-8-per-a-outlook-utilitzant-comanda-mailto/</guid>
<description><![CDATA[Un petit truc ràpid que poso en el blog. Microsoft Outlook té problemes amb la codificació UTF-8. Aq]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Un petit truc ràpid que poso en el blog.</p>
<p>Microsoft Outlook té problemes amb la codificació UTF-8. Aquest fet és notori quan des d&#8217;una web fas ús de la comanda &#8220;mailto&#8221; en un enllaç per a què se t&#8217;obri directament el gestor de correu.</p>
<p>Si tens la web codificada en UTF-8, tindràs problemes si el teu gestor és l&#8217;Outlook. Caràcters amb accents o &#8220;ñ&#8221; o dièresis, no es veuran correctament. El truc és utilitzar les llibreries de conversió en PHP &#8216;iconv&#8217;.Amb aquesta funció pots passar una cadena de UTF8 a ISO-8859-1 (que si interpreta outlook).</p>
<p>Així que si programes amb PHP amb codificació UTF-8, i utilitzes &#8220;mailto&#8221;, et pot anar bé aquest codi:</p>
<p>$subject = &#8220;El meu assumpte té un accent.&#8221;;</p>
<p>$subject_mailto = rawurlencode(iconv(&#8216;UTF-8&#8242;,&#8217;ISO-8859-1&#8242;,$subject));</p>
<p>echo &#8216;&#60;a href=&#8221;mailto:desti@test.com?subject&#8217;.$subject_mailto.&#8217;&#8221;&#62;enviar mail&#60;/a&#62;&#8217;;</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Alterar Codificação de ARQUIVOS no Linux]]></title>
<link>http://pobrecomputeiro.wordpress.com/2008/11/03/alterar-codificacao-de-arquivos-no-linux/</link>
<pubDate>Mon, 03 Nov 2008 18:08:10 +0000</pubDate>
<dc:creator>lmmoreira</dc:creator>
<guid>http://pobrecomputeiro.wordpress.com/2008/11/03/alterar-codificacao-de-arquivos-no-linux/</guid>
<description><![CDATA[Em vários momentos recebemos arquivos que quando abrimos parecer estar cheios de códigos estranhos n]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Em vários momentos recebemos arquivos que quando abrimos parecer estar cheios de códigos estranhos nos lugares dos acentos e mais um monte de caracteres no lugar da cedilha.</p>
<p>Talvez isto não seja problema do texto mas sim da codigifação usada na máquina que o criou.</p>
<p>Primeiramente deixe-me explicar o que é a codificação.</p>
<p>Codificação não passa de um conjunto de caracteres de determinada região ou lingua. Quando o computador foi criado e o mesmo só falava a lingua inglêsa junto com ele foi criada a codificação (Encoding) ASCII que é um conjunto de caracteres para lingua inglêsa, ou seja não tem acento, cedilha e etc.</p>
<p>Conforme a informática foi chegando a outros países encontrou-se a necessidade de criar novas codificações adicionando outros caracteres como os acentos e etc.</p>
<p>Obs.: Este trecho de história esta muito resumido e os acontecimentos podem não terem ocorrido exatamente na forma e no tempo indicado. Minha intenção é te fazer entender o que é um encoding e não te passar história. Se você quer história vá para a <a href="http://pt.wikipedia.org/wiki/P%C3%A1gina_principal">wikipedia</a>.</p>
<p>Continuando&#8230;</p>
<p>Foi então criada a codificação iso-8859-1 que abrangia alguns idiomas latinos porém ainda dava falta de alguns caracteres. Então criou-se a codificação UTF-8 que é a mais utilizada por sistemas mais novos.</p>
<p>Então quando você recebe um arquivo vindo de um servidor antigo que utilize iso-8859-1, ou então você vai mandar para este e nao quer que o arquivo chegue lá todo estranho é necessário uma conversão que fazemos com o comando iconv do Linux.</p>
<p>Vamos criar um arquivo simples chamado teste.</p>
<p>Dentro deste arquivo teste coloque texto com acentos, cedilha e tudo mais que você acha de direito.</p>
<p>Agora vamos converter este texto para a codificação iso-8859-1 para que possamos envia-lo a alguem que trabalhe com este tipo de codificação.</p>
<p style="padding-left:30px;">cat teste&#124;iconv -f utf-8 -t iso8859-1 -o teste-iso8859-1</p>
<p>De forma mais humana podemos interpretar o -f como from utf-8 e o -t como to iso8859-1.</p>
<p>A sintaxe do comando é esta, agora é só brincar.</p>
<p>Você pode achar este post meio inútil, eu também achava. Porém hoje eu resolvi um problema de wireless que perdurava por mais de dois meses comigo devido a esta besteira, então achei legal postar esta dica.</p>
<p>Só para terminar.</p>
<p>Como você faria para descobrir qual codificação um arquivo foi escrito? (Esta é até uma maneira de descobrir em qual codificação seu computador trabalha)</p>
<p>Simples</p>
<p style="padding-left:30px;">file -i teste</p>
<p style="padding-left:30px;">Retorno: teste: text/plain charset=utf-8</p>
<p>Por enquanto é só. Daqui a alguns minutos postarei sobre o problema de wireless que tive e como resolvi utilizando codificações de arquivos e no mesmo post mato a sequencia de conexões de rede no Arch Linux com a rede do tipo wireless agora.</p>
<p>Obrigado a todos, caso tenham alguma dúvida sobre o assunto deixem nos comentários que farei o máximo para lhes ajudar.</p>
<p>Mais uma vez reforço, o bloco história deste post não é confiavel. Eu só quis através de uma historinha lhe dizer o que é um encoding. Mais ou menos igual aquela dos sete anões.</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Cambiar la codificación de caracteres de un fichero XML]]></title>
<link>http://tykall.wordpress.com/2008/10/11/cambiar-la-codificacion-de-caracteres-de-un-fichero-xml/</link>
<pubDate>Sat, 11 Oct 2008 00:01:18 +0000</pubDate>
<dc:creator>tykall</dc:creator>
<guid>http://tykall.wordpress.com/2008/10/11/cambiar-la-codificacion-de-caracteres-de-un-fichero-xml/</guid>
<description><![CDATA[Por defecto XI genera los mensajes XML en formato UTF-8. Para que estos se codifiquen en otro format]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Por defecto XI genera los mensajes XML en formato UTF-8. Para que estos se codifiquen en otro formato como el ISO-8859-1 habrá que configurar el adaptador receptor para que éste se encargue de hacerlo.</p>
<p>Como ejemplo se mostrará la configuración para un receptor de tipo fichero. Para lograr que el “contenido” del fichero se muestre en formato ISO-8859-1 se necesita añadir un módulo específico al adaptador que se encarga de realizar la conversión, entre otras cosas. En el caso de los ficheros XML, para que el módulo pueda procesar el contenido del fichero éste deberá ser de tipo BINARIO, de otro modo se producirá una excepción a la hora de procesar el fichero diciendo que el fichero pasado no se encuentra en el formato correcto. Esta restricción queda especificada en el enlace <a href="http://help.sap.com/saphelp_nw04/Helpdata/EN/bc/bb79d6061007419a081e58cbeaaf28/content.htm">Configuring the Receiver File/FTP Adapter</a>, en el apartado &#8220;Select the File Type of the document&#8221;.</p>
<p style="text-align:center;"><a href="http://tykall.files.wordpress.com/2008/10/file_adapter_parameters_processing.png"><img class="size-medium wp-image-135 aligncenter" title="file_adapter_parameters_processing" src="http://tykall.wordpress.com/files/2008/10/file_adapter_parameters_processing.png?w=300" alt="" width="300" height="128" /></a></p>
<p>En la pestaña Module del adaptador se inserta el módulo AF_Modules/XMLAnonymizerBean en una posición anterior al módulo CallSapAdapter ya que de lo contrario se enviaría el fichero antes de procesarlo.</p>
<p><img class="aligncenter size-full wp-image-279" title="file_adapter_module" src="http://tykall.wordpress.com/files/2008/10/file_adapter_module2.png" alt="file_adapter_module" width="497" height="248" /></p>
<p>Una vez definido el módulo como tipo “Local Enterprise Bean”, se deberán especificar los parámetros anonymizer.acceptNamespaces y anonymizer.encoding. El primero sirve para filtrar los Espacios de Nombre (namespaces) del fichero que se desean conservar (los que no se informen aquí se eliminarán del fichero). Hay que tener en cuenta que un fichero XML puede contener más de un espacio de nombres definido y a través de este parámetro también se permitirá renombrar a los mismos. En el caso del namespace principal se indicará haciéndole corresponder 2 comillas simples (‘’). En la nota 880173 &#8211; XI 3.0 Adapter Framework XML Anonymizer Modulese se muestran varios ejemplos sobre el comportamiento de estos parámetros.</p>
<p>El segundo parámetro, encoding, indica el formato con el que se generarán los datos del fichero.</p>
<p>En este caso los valores que se le han dado a los parámetros han sido:</p>
<ul>
<li>anonymizer.acceptNamespaces = http://www.server.com/DIR/NameSpace ‘’</li>
<li>anonymizer.encoding = ISO-8859-1</li>
</ul>
<p>Para más información se pueden consultar los siguientes enlaces:</p>
<ul>
<li><a href="http://help.sap.com/saphelp_nw04/helpdata/en/45/d169186a29570ae10000000a114a6b/content.htm">XMLAnonymizerBean</a></li>
<li><span><a href="http://help.sap.com/saphelp_nw04/Helpdata/EN/bc/bb79d6061007419a081e58cbeaaf28/content.htm">Configuring the Receiver File/FTP Adapter</a><br />
</span></li>
<li><a href="https://www.sdn.sap.com/irj/sdn/go/portal/prtroot/docs/library/uuid/502991a2-45d9-2910-d99f-8aba5d79fb42">How To&#8230; Work with Character Encodings in Process Integration</a></li>
</ul>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Corriger des caractères iso corrompus dans un fichier utf8]]></title>
<link>http://ohmycode.wordpress.com/2008/09/06/corriger-des-caracteres-ansi-corrompus-dans-un-fichier-utf8/</link>
<pubDate>Sat, 06 Sep 2008 07:25:07 +0000</pubDate>
<dc:creator>hekki974</dc:creator>
<guid>http://ohmycode.wordpress.com/2008/09/06/corriger-des-caracteres-ansi-corrompus-dans-un-fichier-utf8/</guid>
<description><![CDATA[Problème récurrent des pauvres bougres qui jouent avec mysql, surtout les anciennes versions : J]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Problème récurrent des pauvres bougres qui jouent avec mysql, surtout les anciennes versions :</p>
<p>J&#8217;avais une base en iso-8859-1 (latin1 avec une collation swedish, logique toute mysqlienne : )</p>
<p>Je déménage sur un serveur en utf8, je récupère donc mon dump en iso-8859-1 (ansi), j&#8217;utilise notepad++ pour le transformer en utf8, et j&#8217;importe dans ma nouvelle maison. Je met des fleurs sur la table, je change les rideaux et hop je suis prêt à pendre la crémaillère !!</p>
<p>Et là comme un belu (autodidacte incompétent et un peu fainéant <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> , je laisse tout le reste en l&#8217;état. Ma connexion à la base est toujours en iso-8859-1, mes fichiers php/html aussi. Et je profite, insouciant, de ma nouvelle maison bien plus spacieuse que l&#8217;ancienne.</p>
<p>Du coup pendant presque 3 mois, mes internautes vivent leurs vies, s&#8217;inscrivent, racontent leurs vies, vont et viennent. Ce faisant, ils écrivent en iso-8859-1 dans ma jolie base en utf8. Les ploucs ascendant pic-assiettes de base qu&#8217;ils sont&#8230;.</p>
<p>Symptômes : Le tri et les recherches sur avec les mots accentués ne fonctionne plus.<br />
Je cherche, je cherche, je cherche, je pleure un peu, je cherche, je cherche et je finis par trouver.</p>
<p>Pas facile pour mysql de retrouver &#8216;nom like &#8216;%é%&#8221; quand tous les &#8216;é&#8217; en question sont en fait stockés comme des Â~.</p>
<div id="attachment_18" class="wp-caption aligncenter" style="width: 227px"><img class="size-full wp-image-18" title="martine-ecrit-en-utf-8" src="http://ohmycode.wordpress.com/files/2008/09/martine-ecrit-en-utf-8.jpg" alt="&#34;Martine script une feuille de papier&#34;" width="217" height="269" /><p class="wp-caption-text">Le petit brun au fond là....C&#39;est moi !!</p></div>
<p>Un petit dump plus tard et effectivement tout est clair, tous les caractères accentués entré dans la base de données depuis trois mois sont stockés sous des formes léprosées avec du pus dedans !! Yak !!</p>
<p>Un petit tour vite fait sur internet, pas de solution évidente, car il est techniquement impossible de déterminer si un caractère est utf8 ou pas.</p>
<p>D&#8217;où donc le script ci-dessous pour ce problème très spécifique : convertir</p>
<pre class="brush: sql;">

INSERT INTO `Activite` VALUES
(5545, 'Diagnostics et bilans ÃƒÂ©cologiques', '', 1, 5544, '2005-12-06 15:51:55', 0),
(5546, 'Etudes rÃƒÂ©glementaires environnementales', '', 2, 5544, '2005-11-16 13:01:37', 0),

(5550, 'Conseil en politique environnementale', '', 6, 5544, '2005-11-22 18:43:10', 0), ...
</pre>
<p>en</p>
<pre class="brush: sql;">

INSERT INTO `Activite` VALUES
(5545, 'Diagnostics et bilans écologiques', '', 1, 5544, '2005-12-06 15:51:55', 0),
(5546, 'Etudes réglementaires environnementales', '', 2, 5544, '2005-11-16 13:01:37', 0),
(5550, 'Conseil en politique environnementale', '', 6, 5544, '2005-11-22 18:43:10', 0), ...
</pre>
<p>J&#8217;ai écrit vite fait le script ci-dessous en php :</p>
<pre class="brush: php;">

&lt;?
//Author -- Yahel

//The list of the characters that usually get messed up in iso-8859-1
$GoodCharaters = array (&quot;¡&quot;,&quot;¢&quot;,&quot;£&quot;,&quot;¤&quot;,&quot;¥&quot;,&quot;¦&quot;,&quot;§&quot;,&quot;¨&quot;,&quot;©&quot;,&quot;ª&quot;,&quot;«&quot;,&quot;¬&quot;,&quot;­&quot;,&quot;®&quot;,&quot;¯&quot;,&quot;°&quot;,&quot;±&quot;,&quot;²&quot;,&quot;³&quot;,&quot;´&quot;,&quot;µ&quot;,&quot;¶&quot;,&quot;·&quot;,&quot;¸&quot;,&quot;¹&quot;,&quot;º&quot;,&quot;»&quot;,&quot;¼&quot;,&quot;½&quot;,&quot;¾&quot;,&quot;¿&quot;,&quot;×&quot;,&quot;÷&quot;,&quot;À&quot;,&quot;Á&quot;,&quot;Â&quot;,&quot;Ã&quot;,&quot;Ä&quot;,&quot;Å&quot;,&quot;Æ&quot;,&quot;Ç&quot;,&quot;È&quot;,&quot;É&quot;,&quot;Ê&quot;,&quot;Ë&quot;,&quot;Ì&quot;,&quot;Í&quot;,&quot;Î&quot;,&quot;Ï&quot;,&quot;Ð&quot;,&quot;Ñ&quot;,&quot;Ò&quot;,&quot;Ó&quot;,&quot;Ô&quot;,&quot;Õ&quot;,&quot;Ö&quot;,&quot;Ø&quot;,&quot;Ù&quot;,&quot;Ú&quot;,&quot;Û&quot;,&quot;Ü&quot;,&quot;Ý&quot;,&quot;Þ&quot;,&quot;ß&quot;,&quot;à&quot;,&quot;á&quot;,&quot;â&quot;,&quot;ã&quot;,&quot;ä&quot;,&quot;å&quot;,&quot;æ&quot;,&quot;ç&quot;,&quot;è&quot;,&quot;é&quot;,&quot;ê&quot;,&quot;ë&quot;,&quot;ì&quot;,&quot;í&quot;,&quot;î&quot;,&quot;ï&quot;,&quot;ð&quot;,&quot;ñ&quot;,&quot;ò&quot;,&quot;ó&quot;,&quot;ô&quot;,&quot;õ&quot;,&quot;ö&quot;,&quot;ø&quot;,&quot;ù&quot;,&quot;ú&quot;,&quot;û&quot;,&quot;ü&quot;,&quot;ý&quot;,&quot;þ&quot;,&quot;ÿ&quot;);

//The list of the characters they are usually messed up to
$BadCharacters = array (&quot;Â¡&quot;,&quot;Â¢&quot;,&quot;Â£&quot;,&quot;Â¤&quot;,&quot;Â¥&quot;,&quot;Â¦&quot;,&quot;Â§&quot;,&quot;Â¨&quot;,&quot;Â©&quot;,&quot;Âª&quot;,&quot;Â«&quot;,&quot;Â¬&quot;,&quot;Â­&quot;,&quot;Â®&quot;,&quot;Â¯&quot;,&quot;Â°&quot;,&quot;Â±&quot;,&quot;Â²&quot;,&quot;Â³&quot;,&quot;Â´&quot;,&quot;Âµ&quot;,&quot;Â¶&quot;,&quot;Â·&quot;,&quot;Â¸&quot;,&quot;Â¹&quot;,&quot;Âº&quot;,&quot;Â»&quot;,&quot;Â¼&quot;,&quot;Â½&quot;,&quot;Â¾&quot;,&quot;Â¿&quot;,&quot;Ã—&quot;,&quot;Ã·&quot;,&quot;Ã€&quot;,&quot;Ã&quot;,&quot;Ã‚&quot;,&quot;Ãƒ&quot;,&quot;Ã„&quot;,&quot;Ã…&quot;,&quot;Ã†&quot;,&quot;Ã‡&quot;,&quot;Ãˆ&quot;,&quot;Ã‰&quot;,&quot;ÃŠ&quot;,&quot;Ã‹&quot;,&quot;ÃŒ&quot;,&quot;Ã&quot;,&quot;ÃŽ&quot;,&quot;Ã&quot;,&quot;Ã&quot;,&quot;Ã‘&quot;,&quot;Ã’&quot;,&quot;Ã“&quot;,&quot;Ã”&quot;,&quot;Ã•&quot;,&quot;Ã–&quot;,&quot;Ã˜&quot;,&quot;Ã™&quot;,&quot;Ãš&quot;,&quot;Ã›&quot;,&quot;Ãœ&quot;,&quot;Ã&quot;,&quot;Ãž&quot;,&quot;ÃŸ&quot;,&quot;Ã &quot;,&quot;Ã¡&quot;,&quot;Ã¢&quot;,&quot;Ã£&quot;,&quot;Ã¤&quot;,&quot;Ã¥&quot;,&quot;Ã¦&quot;,&quot;Ã§&quot;,&quot;Ã¨&quot;,&quot;Ã©&quot;,&quot;Ãª&quot;,&quot;Ã«&quot;,&quot;Ã¬&quot;,&quot;Ã­&quot;,&quot;Ã®&quot;,&quot;Ã¯&quot;,&quot;Ã°&quot;,&quot;Ã±&quot;,&quot;Ã²&quot;,&quot;Ã³&quot;,&quot;Ã´&quot;,&quot;Ãµ&quot;,&quot;Ã¶&quot;,&quot;Ã¸&quot;,&quot;Ã¹&quot;,&quot;Ãº&quot;,&quot;Ã»&quot;,&quot;Ã¼&quot;,&quot;Ã½&quot;,&quot;Ã¾&quot;,&quot;Ã¿&quot;);

//Skip a line for better readability
echo &quot;\r\n&quot;;

//Get the file to open from command line
$FileToCorrect=$argv[1];
if (!file_exists($FileToCorrect)) die(&quot;the file '&quot;.basename($FileToCorrect).&quot;' could not be found&quot;);

//Computes destination filename
$FileCorrected=dirname($argv[1]).&quot;\\corrected_&quot;.basename($argv[1]);//$argc[2];

//Explain what happens to the user
echo &quot;Correcting utf8 from '&quot;.basename($FileToCorrect).&quot;' to '&quot;.basename($FileCorrected).&quot;'\n&quot;;

//Open the file to be corrected
$fh = fopen($FileCorrected, 'w') or die(&quot;can't open file '&quot;.$FileCorrected.&quot;'\n&quot;);

//Makes the correction and save in a single move
fwrite($fh, str_replace($BadCharacters ,$GoodCharaters ,file_get_contents($FileToCorrect)));

//Close the file and quit
fclose($fh);
echo &quot;Done.\n&quot;;
?&gt;
</pre>
<p>J&#8217;utilise depuis peu php comme langage de script sur ma machine. Il suffit d&#8217;avoir php installé et qu&#8217;il soit dans le path.</p>
<p>Pour le lancer : php correct_utf8.php FichierPourri.sql</p>
<p>Dans le même répertoire que &#8216;FichierPourri.sql&#8217;, vous trouverez &#8216;corrected_FichierPourri.sql&#8217;.</p>
<p>Pour un fichier de 21.5 megas (Bloat: ), le script a tourné moins de 5 secondes (Zap, Zap : ).</p>
<p><span style="text-decoration:underline;">PS :</span> <em>J&#8217;utilise aussi depuis peu un petit logiciel à pas cher, <a href="http://www.e-texteditor.com/">e texteditor</a> en remplacement de dreamweaver. Ce petit bidule qui n&#8217;est pas parfait et ne paye pas de mine à la possibilité d&#8217;utiliser les bundles de textmate(les maquisards apprécieront). J&#8217;ai donc porté le petit script ci-dessous pour e texteditor. Seul problème, pour les très larges fichiers, il rame grave. Toujours est-il, si ça intéresse quelqu&#8217;un :</em></p>
<pre class="brush: php;">
#!/usr/bin/env php.exe
&lt;?

$GoodCharaters = array (&quot;¡&quot;,&quot;¢&quot;,&quot;£&quot;,&quot;¤&quot;,&quot;¥&quot;,&quot;¦&quot;,&quot;§&quot;,&quot;¨&quot;,&quot;©&quot;,&quot;ª&quot;,&quot;«&quot;,&quot;¬&quot;,&quot;­&quot;,&quot;®&quot;,&quot;¯&quot;,&quot;°&quot;,&quot;±&quot;,&quot;²&quot;,&quot;³&quot;,&quot;´&quot;,&quot;µ&quot;,&quot;¶&quot;,&quot;·&quot;,&quot;¸&quot;,&quot;¹&quot;,&quot;º&quot;,&quot;»&quot;,&quot;¼&quot;,&quot;½&quot;,&quot;¾&quot;,&quot;¿&quot;,&quot;×&quot;,&quot;÷&quot;,&quot;À&quot;,&quot;Á&quot;,&quot;Â&quot;,&quot;Ã&quot;,&quot;Ä&quot;,&quot;Å&quot;,&quot;Æ&quot;,&quot;Ç&quot;,&quot;È&quot;,&quot;É&quot;,&quot;Ê&quot;,&quot;Ë&quot;,&quot;Ì&quot;,&quot;Í&quot;,&quot;Î&quot;,&quot;Ï&quot;,&quot;Ð&quot;,&quot;Ñ&quot;,&quot;Ò&quot;,&quot;Ó&quot;,&quot;Ô&quot;,&quot;Õ&quot;,&quot;Ö&quot;,&quot;Ø&quot;,&quot;Ù&quot;,&quot;Ú&quot;,&quot;Û&quot;,&quot;Ü&quot;,&quot;Ý&quot;,&quot;Þ&quot;,&quot;ß&quot;,&quot;à&quot;,&quot;á&quot;,&quot;â&quot;,&quot;ã&quot;,&quot;ä&quot;,&quot;å&quot;,&quot;æ&quot;,&quot;ç&quot;,&quot;è&quot;,&quot;é&quot;,&quot;ê&quot;,&quot;ë&quot;,&quot;ì&quot;,&quot;í&quot;,&quot;î&quot;,&quot;ï&quot;,&quot;ð&quot;,&quot;ñ&quot;,&quot;ò&quot;,&quot;ó&quot;,&quot;ô&quot;,&quot;õ&quot;,&quot;ö&quot;,&quot;ø&quot;,&quot;ù&quot;,&quot;ú&quot;,&quot;û&quot;,&quot;ü&quot;,&quot;ý&quot;,&quot;þ&quot;,&quot;ÿ&quot;);

$BadCharacters = array (&quot;Â¡&quot;,&quot;Â¢&quot;,&quot;Â£&quot;,&quot;Â¤&quot;,&quot;Â¥&quot;,&quot;Â¦&quot;,&quot;Â§&quot;,&quot;Â¨&quot;,&quot;Â©&quot;,&quot;Âª&quot;,&quot;Â«&quot;,&quot;Â¬&quot;,&quot;Â­&quot;,&quot;Â®&quot;,&quot;Â¯&quot;,&quot;Â°&quot;,&quot;Â±&quot;,&quot;Â²&quot;,&quot;Â³&quot;,&quot;Â´&quot;,&quot;Âµ&quot;,&quot;Â¶&quot;,&quot;Â·&quot;,&quot;Â¸&quot;,&quot;Â¹&quot;,&quot;Âº&quot;,&quot;Â»&quot;,&quot;Â¼&quot;,&quot;Â½&quot;,&quot;Â¾&quot;,&quot;Â¿&quot;,&quot;Ã—&quot;,&quot;Ã·&quot;,&quot;Ã€&quot;,&quot;Ã&quot;,&quot;Ã‚&quot;,&quot;Ãƒ&quot;,&quot;Ã„&quot;,&quot;Ã…&quot;,&quot;Ã†&quot;,&quot;Ã‡&quot;,&quot;Ãˆ&quot;,&quot;Ã‰&quot;,&quot;ÃŠ&quot;,&quot;Ã‹&quot;,&quot;ÃŒ&quot;,&quot;Ã&quot;,&quot;ÃŽ&quot;,&quot;Ã&quot;,&quot;Ã&quot;,&quot;Ã‘&quot;,&quot;Ã’&quot;,&quot;Ã“&quot;,&quot;Ã”&quot;,&quot;Ã•&quot;,&quot;Ã–&quot;,&quot;Ã˜&quot;,&quot;Ã™&quot;,&quot;Ãš&quot;,&quot;Ã›&quot;,&quot;Ãœ&quot;,&quot;Ã&quot;,&quot;Ãž&quot;,&quot;ÃŸ&quot;,&quot;Ã &quot;,&quot;Ã¡&quot;,&quot;Ã¢&quot;,&quot;Ã£&quot;,&quot;Ã¤&quot;,&quot;Ã¥&quot;,&quot;Ã¦&quot;,&quot;Ã§&quot;,&quot;Ã¨&quot;,&quot;Ã©&quot;,&quot;Ãª&quot;,&quot;Ã«&quot;,&quot;Ã¬&quot;,&quot;Ã­&quot;,&quot;Ã®&quot;,&quot;Ã¯&quot;,&quot;Ã°&quot;,&quot;Ã±&quot;,&quot;Ã²&quot;,&quot;Ã³&quot;,&quot;Ã´&quot;,&quot;Ãµ&quot;,&quot;Ã¶&quot;,&quot;Ã¸&quot;,&quot;Ã¹&quot;,&quot;Ãº&quot;,&quot;Ã»&quot;,&quot;Ã¼&quot;,&quot;Ã½&quot;,&quot;Ã¾&quot;,&quot;Ã¿&quot;);

echo str_replace($BadCharacters ,$GoodCharaters ,file_get_contents('php://stdin'));
?&gt;
</pre>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[PostgreSQL: migrando de LATIN1 pra UTF-8]]></title>
<link>http://arezi.wordpress.com/2008/07/16/postgresql-migrando-de-latin1-pra-utf-8-2/</link>
<pubDate>Wed, 16 Jul 2008 21:46:49 +0000</pubDate>
<dc:creator>Fábio Arezi</dc:creator>
<guid>http://arezi.wordpress.com/2008/07/16/postgresql-migrando-de-latin1-pra-utf-8-2/</guid>
<description><![CDATA[Pra padronizar meus sistemas, resolvi migrar as bases de LATIN1 pra UTF8. Sei que alguns não vão con]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Pra padronizar meus sistemas, resolvi migrar as bases de LATIN1 pra UTF8. Sei que alguns não vão concordar com minha escolha mas enfim. Segue os passos que eu fiz em um servidor RedHat5 (testei com Debian e funcionou também) com a versão 8.1 do PostgreSQL. Fiz com uma base de em torno de 800Mb.<br />
Recomendo que teste em um ambiente separado antes de aplicar na produção. Use por conta e risco.</p>
<p>Primeiro pare todos os serviços que utilizam o banco (ex. stop no apache, tomcat, jboss) para ninguém (usuários) alterar o banco durante o processo.<br />
<span style="font-family:sans-serif;">Nos comandos abaixo, substitua:<br />
</span><span style="font-family:sans-serif;">usuario_banco = usuário dono do banco, com permissões de apagar e criar bancos<br />
meu_banco = o banco que vc quer fazer a migração<br />
</span><br />
fazer um backup em texto plano<br />
<span style="font-family:Courier New;"><br />
/usr/bin/pg_dump -i -h localhost -U usuario_banco -F p -D -v -f bancoL.sql meu_banco</span></p>
<p>aqui está o segredo. Use o software iconv para conversão<br />
<span style="font-family:Courier New;"><br />
iconv -f iso-8859-1 -t utf-8 bancoL.sql &#62; bancoU.sql</span></p>
<p>abra o arquivo bancoL.sql (de preferencia use o vim pra editar)<br />
e no inicio aí pela linha 7, onde tem &#8220;SET client_encoding = &#8216;LATIN1&#8242;;&#8221;  troque LATIN1 por UTF8</p>
<p>Com banco fazer:</p>
<p>faça um backup é claro<br />
<span style="font-family:Courier New;"> pg_dump -U usuario_banco -i -F c -b -f banco.backup meu_banco<br />
</span><br />
agora apague o banco inteiro<br />
<span style="font-family:Courier New;"> dropdb -h localhost -U usuario_banco meu_banco</span></p>
<p>crie-o com UTF8<br />
<span style="font-family:Courier New;"> createdb -h localhost -E UTF8 -U usuario_banco meu_banco</span></p>
<p>e agora restaure o banco &#8220;uteéfeoitoado&#8221; <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /><br />
<span style="font-family:Courier New;"> psql -h localhost -U usuario_banco -d meu_banco &#60; bancoU.sql</span></p>
<p>caso use em seus SQL a função TO_ASCII, com UTF-8 ela não irã funcionar. Veja <a href="http://arezi.wordpress.com/2008/04/09/postgresql-funcao-to_ascii-em-banco-utf-8/">aqui a alternativa</a> em um post passado que eu fiz.</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Solución usando UTF-8 en formularios multipart/form-data con Jboss]]></title>
<link>http://programmerlife.wordpress.com/2008/07/14/solcion-usando-utf-8-en-formularios-multipartform-data-con-jboss/</link>
<pubDate>Mon, 14 Jul 2008 16:58:50 +0000</pubDate>
<dc:creator>wrcdriver</dc:creator>
<guid>http://programmerlife.wordpress.com/2008/07/14/solcion-usando-utf-8-en-formularios-multipartform-data-con-jboss/</guid>
<description><![CDATA[Pues hace poco me encontré con un gran problema para todos aquellos programadores que trabajamos con]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Pues hace poco me encontré con un gran problema para todos aquellos programadores que trabajamos con aplicaciones web en la cual se usan caracteres diferentes a los de idioma anglosajón (ingles), pues en ciertos formularios las letras que poseen acentos ó diéresis no llegaban correctamente a la <span style="text-decoration:none;">aplicación</span> y estas eran sustituidas por algo parecido a “A!+” lo cual no sabia que era pues ya había configurado el servidor para que recibiera los HTTP Request en encoding UTF-8, la base de datos esta en UTF-8 y el meta tag del cuerpo de los jsp están también en UTF-8, todo esto trabajando bajo el servidor Jboss junto con toda la mecánica de los EJB3.</p>
<p style="margin-bottom:0;">
<p style="margin-bottom:0;">Pues que es lo que pasaba, después de varias comparaciones entre los formularios que funcionaban y los que no pude notar que los que no funcionaban tenían el siguiente atributo <span style="font-size:x-small;"><span style="font-family:Monospace;"><span style="color:#7f007f;">enctype</span><span style="color:#000000;">=</span><span style="color:#2a00ff;">&#8220;multipart/form-data&#8221;</span></span></span><span style="font-size:small;"><span style="font-family:DejaVu Sans,sans-serif;"><span style="color:#000000;">, pues bueno luego de una búsqueda entre foros, blogs y otras cosas pude ver que hay miles y miles de programadores con el mismo problema, desde suecos hasta hebreos, y pues tras leer muchas cosas dí con la solución <a href="http://markmail.org/message/3hw6j6mnpbqawitu#query:ServletFileUpload%20setHeaderEncoding%20utf-8+page:1+mid:upbsqbnbahwptcyt+state:results" target="_blank">aquí</a> y bueno lo demás fue hacer lo siguiente:</span></span></span></p>
<p style="margin-bottom:0;">
<p style="margin-bottom:0;"><span style="color:#000000;"><span style="font-family:DejaVu Sans,sans-serif;"><span style="font-size:small;">En los JSPs colocar los siguiente en la primera linea:</span></span></span></p>
<ul>
<li>
<p style="margin-bottom:0;"><span style="color:#000000;"><span style="font-family:Monospace;"><span style="font-size:x-small;"><span style="color:#bf5f3f;">&#60;%@ </span><span style="color:#3f7f7f;">page </span><span style="color:#7f007f;">language</span>=<span style="color:#2a00ff;">&#8220;java&#8221; </span><span style="color:#7f007f;">contentType</span>=<span style="color:#2a00ff;">&#8220;text/html; 	charset=UTF-8&#8243; </span><span style="color:#7f007f;">pageEncoding</span>=<span style="color:#2a00ff;">&#8220;UTF-8&#8243;</span><span style="color:#bf5f3f;">%&#62;</span></span></span></span></p>
</li>
</ul>
<p style="margin-bottom:0;">
<p style="margin-bottom:0;"><span style="color:#000000;"><span style="font-family:DejaVu Sans,sans-serif;"><span style="font-size:small;">En las acciones que reciben los parámetros hice:</span></span></span></p>
<ul>
<li>
<p style="margin-bottom:0;"><span style="color:#000000;"><span style="font-family:Monospace;"><span style="font-size:x-small;">ServletFileUpload 	upload = <strong><span style="color:#7f0055;">new</span></strong> ServletFileUpload(factory);</span></span></span></p>
</li>
</ul>
<p style="margin-bottom:0;" align="left"><span style="font-family:Monospace;"><span style="font-size:x-small;"><span style="color:#000000;"> upload.setHeaderEncoding(</span><span style="color:#2a00ff;">&#8220;UTF-8&#8243;</span><span style="color:#000000;">);</span></span></span></p>
<ul>
<li>
<p style="margin-bottom:0;" align="left"><span style="color:#000000;"><span style="font-family:Monospace;"><span style="font-size:x-small;">String 	value = <strong><span style="color:#7f0055;">new</span></strong> String(item.getString().getBytes(<span style="color:#2a00ff;">&#8220;ISO-8859-1&#8243;</span>),</span></span></span></p>
</li>
</ul>
<p style="margin-bottom:0;" align="left"><span style="color:#000000;"><span style="font-family:Monospace;"><span style="font-size:x-small;"><span style="color:#2a00ff;"> &#8220;UTF-8&#8243;</span>);</span></span></span></p>
<p style="margin-bottom:0;" align="left"><span style="color:#000000;"><span style="font-family:Monospace;"><span style="font-size:x-small;"> al ver esto parece que los formularios con <span style="color:#7f007f;">enctype</span>=<span style="color:#2a00ff;">&#8220;multipart/form-data&#8221;</span> siguen pasando los parámetros en formato ISO-8859-1.</span></span></span></p>
<p style="margin-bottom:0;" align="left">
<p style="margin-bottom:0;" align="left"><span style="font-family:DejaVu Sans,sans-serif;"><span style="font-size:small;"><span style="color:#000000;">Con esto dice ser suficiente, pero por si acaso<span style="text-decoration:none;"> coloqué el atributo </span></span><span style="font-size:x-small;"><span style="font-family:Monospace;"><span style="color:#7f007f;">accept-charset</span><span style="color:#000000;">=</span><span style="color:#2a00ff;">&#8220;UTF-8&#8243;</span></span></span><span style="text-decoration:none;"><span style="color:#000000;"> en el formulario. Después de esto puedes compilar el proyecto subirlo a tu servidor e irte a dormir tranquilo ¡por que todo va a esta bien!</span></span></span></span></p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[PHP: Utilizando UTF-8 corretamente]]></title>
<link>http://danilow.wordpress.com/2008/06/07/utilizando-utf8-corretamente/</link>
<pubDate>Sat, 07 Jun 2008 00:43:43 +0000</pubDate>
<dc:creator>Danilo Akamine</dc:creator>
<guid>http://danilow.wordpress.com/2008/06/07/utilizando-utf8-corretamente/</guid>
<description><![CDATA[Há um tempo atrás precisei fazer um site que armazenava e recuperava dados em japonês e português tu]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Há um tempo atrás precisei fazer um site que armazenava e recuperava dados em japonês e português tudo na mesma base de dados. A solução para isso foi utilizar codificação UTF-8, esquecendo o famoso ISO-8859-1 (Latin).<br />
Utilizando UTF-8 corretamente você se livrará de todos os problemas de acentuação que poderão ser causados em sua página e se livrar de vez de funções como utf8_encode() e derivadas.<br />
Apesar de consumir alguns bytes a mais em certos caracteres, você terá a vantagem de trabalhar com qualquer tipo de idioma.</p>
<p>O segredo está em deixar TUDO na codificação UTF-8.</p>
<ul>
<li>Arquivos .php devem ser salvos por sua IDE nesta codificação. (Qualquer editor possui esta opção, como por exemplo o Zend Studio ou Eclipse)</li>
</ul>
<ul>
<li>Meta tag dos cabeçalhos HTML <strong>&#60;meta http-equiv=&#8221;Content-Type&#8221; content=&#8221;text/html; charset=UTF-8&#8243;/&#62;</strong></li>
</ul>
<ul>
<li>Cabeçalhos em seus arquivos PHP<br />
<strong>header(&#8220;Content-Type: text/html; charset=UTF-8&#8243;, true);</strong></li>
</ul>
<ul>
<li>Banco de dados, tabelas e campos com collation <strong>utf8_general_ci</strong></li>
</ul>
<ul>
<li>Sempre após a conexão com o banco alterar codificação.<br />
Após conectar (<em>mysql_connect</em>) e antes de efetuar qualquer operação deve-se<em> </em>utilizar a função <strong>mysql_set_charset(&#8220;utf8&#8243;, $conexao);    </p>
<p></strong>Caso seu PHP seja inferior a 5.2.3, é possível utilizar dois SQL ao invés da função acima.<br />
<strong>mysql_query(&#8220;SET NAMES &#8216;UTF8&#8242;&#8221;, $conexao);<br />
mysql_query(&#8220;SET CHARACTER SET &#8216;UTF8&#8242;&#8221;, $conexao); </strong></p>
<p><span style="color:#ff0000;">[UPDATE]</span></p>
<p>As instruções SQL acima podem ser utilizadas com qualquer função ou classe (PDO, ADODB, etc)</p>
<p><span style="color:#ff0000;">[/UPDATE]</span></li>
</ul>
<p>Após feito essas alterações, você deve limpar suas tabelas e inserir novamente os dados para que a partir de agora sejam gravados e lidos na codificação correta. Outra opção é converter seus registros utilizando as funções CAST() ou CONVERT() do seu banco de dados.<br />
Lembrando que os exemplos acima foram feitos utilizando MySQL, mas qualquer banco possui instruções semelhantes.</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Mese ja irkkaaminen]]></title>
<link>http://toenperalla.wordpress.com/2008/05/04/mese-ja-irkkaaminen/</link>
<pubDate>Sun, 04 May 2008 17:24:35 +0000</pubDate>
<dc:creator>toenpera</dc:creator>
<guid>http://toenperalla.wordpress.com/2008/05/04/mese-ja-irkkaaminen/</guid>
<description><![CDATA[Irkattiin iloisesti sunnuntaina 17-19. Hauskaa hommaa. Alussa kaikki oli hieman hankalaa ja &#8220;p]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p style="text-align:right;">Irkattiin iloisesti sunnuntaina 17-19. Hauskaa hommaa. Alussa kaikki oli hieman hankalaa ja &#8220;paikallinen mikrotuki&#8221; käämit kärähtäneenä sillä asioita hidasti kurssin ohjeiden ja käyttöjärjestelmäni yhteensopimattomuuden lisäksi fossiilin omaksumisnopeus</p>
<ul>
<li>käyttöjärjestelmä Ubuntu 8.04 Hardy Heron</li>
<li>irc-ohjelmaksi valittin Xchat-GNOME IRC Chat, ongelmana tässä ohjelmassa olivat ääkköset, jotka eivät näkyneet muille irkkaajille oikein, asetuksen piti olla ISO-8859-1, mutta ohjelmassani oli valittavissa vain ISO-8859-15</li>
<li>meseä varten valittiin Pidgin Internet Messenger -ohjelma</li>
</ul>
<p style="text-align:center;">Kokonaisarvio irkkaamisesta</p>
<ol style="text-align:center;">
<li>Hauskuus 9</li>
<li>Hyödyllisyys, jää nähtäväksi</li>
<li>Suositeltavuus työkäyttöön 9</li>
<li>Nyt en enää keksi neljättä kohtaa. Osasin silti käyttää artikkelin muotoiluun kaikkia työkalu-valikon nappuloita, paitsi &#8220;kitchen sink&#8221;-nappulaa. Mitähän sekin tarkoittaa?</li>
</ol>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Coding week - Day 1]]></title>
<link>http://hashbang0.wordpress.com/2008/01/28/coding-week-day-1/</link>
<pubDate>Mon, 28 Jan 2008 21:47:57 +0000</pubDate>
<dc:creator>Ben Lavery</dc:creator>
<guid>http://hashbang0.wordpress.com/2008/01/28/coding-week-day-1/</guid>
<description><![CDATA[Today started off with rolling out of bed at 8:10am, out the house for 8:50, I had left it a tad lat]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Today started off with rolling out of bed at 8:10am, out the house for 8:50, I had left it a tad late to make it up the hill in time, though my phone helped, playing a crap, compressed version of <a href="http://youtube.com/watch?v=jQYQTFudrqc">99 Luftballons</a>.</p>
<p><!--more-->I got into the computer room to find some of the group huddled around our computers.  Me a Steve got stuck in with looking at how to parse XML using Java and query it using XPath.  By 10am we had cracked the parsing; the files we had been given declared they were UTF-8 encoded, however, every time we tried to parse the file we got an error stating something about 1 od 1-byte not UTF-8 or some such nonsense&#8230;After looking around, we changed the declaration to ISO-8859-1, this seems to work <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' />   Our data was parsed, or at least displayed no errors!<br />
We battled on with trying to look at XPath, searching various sites, looking at tutorials, but it was useless.  We even tried the <a href="http://www.tv-anytime.org/">TV-Anytime API</a>, but our files wouldn&#8217;t work correctly, the Genre&#8217;s weren&#8217;t being recognised&#8230;After talking to one of our Project Managers, <a href="http://www.aber.ac.uk/compsci/public/department/staff-lists/staff-member-profile.php?staff_id=rrp">Rhys Parry</a>, we retreated down into town for lunch.</p>
<p>After lunch we received an email stating that <a href="http://www.aber.ac.uk/compsci/public/department/staff-lists/staff-member-profile.php?staff_id=nwh">Nigel Hardy (a.k.a. Beardy Nigel)</a> was putting on a Q&#38;A on XML.  Steve and myself attending this meeting and asked about XML namespaces and asked questions relating to out XPath problems.<br />
We returned to work feeling very informed, but not overly sure on where to go next.  I had already contacted <a href="http://www.linkedin.com/in/andrewmcparland">Andrew McParland</a> from the <a href="http://www.bbc.co.uk">BBC</a> who had worked on the TV-Anytime project, with a stroke of luck he replied just after lunch!  He suggested editing the API to recognise the new Genres. The class that needed editing was created in 2002 according to the declaration at the top, the files we were using were time-stamped 2007&#8230;</p>
<p>So, two plans formed, look more into XPath, or edit the TVAT API&#8230;We chose to persist with XPath.  At 4:45 we had got nowhere <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' />   We decided to go for changing the API.  First of all I tried to parse the XML file with the TVAT API, reciving close to 5000 lines of errors about genres&#8230;I copy and pasted around 1500 lines into a text editor (it appeared that the list was repeated several times) and reduced these down to 24 genres in the space of about 30 minutes&#8230;After changing the API, compiling and running, we were not just receiving errors concerning that genres weren&#8217;t recognised, but also some of them weren&#8217;t formatted correctly!  After looking at an example, I noticed that it was not only formatted the same as all the others, it was the first in the list of genres in the edited class!  This at 6pm this evening, after this day&#8230;Almost nine straight hours of work, we decided to retire for the day and come back to it in the morning&#8230;</p>
<p>So, tomorrow is another day&#8230;We are open to all suggestions <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' />   Comments welcome <img src='http://s.wordpress.com/wp-includes/images/smilies/icon_razz.gif' alt=':P' class='wp-smiley' /><br />
But for now&#8230;BED!</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Traduzindo Wordpress para Português do Brasil]]></title>
<link>http://aprendendosobre.wordpress.com/2008/01/24/traduzindo-wordpress-para-portugues-do-brasil/</link>
<pubDate>Thu, 24 Jan 2008 14:13:36 +0000</pubDate>
<dc:creator>Leo WP</dc:creator>
<guid>http://aprendendosobre.wordpress.com/2008/01/24/traduzindo-wordpress-para-portugues-do-brasil/</guid>
<description><![CDATA[Caso queira a versão do seu WordPress em outro idioma(traduzido), como português do Brasil, devemos ]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Caso queira a versão do seu WordPress em outro idioma(traduzido), como português do Brasil, devemos fazer o download da tradução escolhida. É importante(mas não unicamente) escolher a tradução na versão do seu WordPress. No meu caso, a versão atual é a 2.3.2.<br />
Procure na ferramente de busca do site do Worpress, ou até mesmo no google por <b>portugues-br</b> e faça o download do arquivo.</p>
<p>No link: <a href="http://codex.wordpress.org/WordPress_in_Your_Language" target="_blank">http://codex.wordpress.org/WordPress_in_Your_Language</a> encontramos o idioma <b>Brazilian Portuguese (pt_BR) (Português do Brasil), </b>com os links das respectivas versões:</p>
<ul>
<li><a href="http://www.webmais.com/wordpress/" class="external text" title="http://www.webmais.com/wordpress/">Brazilian Portuguese 2.3.2</a></li>
<li> <a href="http://www.bagulhos.blog.br/traducao-do-wordpress" class="external text" title="http://www.bagulhos.blog.br/traducao-do-wordpress">WordPress 2.3.1 Português do Brasil</a></li>
<li> <a href="http://alenonimo.com.br/wordpress/traducao/" class="external text" title="http://alenonimo.com.br/wordpress/traducao/">Brazilian Portuguese 2.3 Beta 1</a></li>
<li> <a href="http://taijiquan.pro.br/baixar/" class="external text" title="http://taijiquan.pro.br/baixar/">Brazilian Portuguese 2.1.3</a> (Esta é a tradução <b>oficial</b>.  Também estão disponíveis traduções para versões antigas do WordPress).</li>
<li> <a href="http://www.perazza.com/wordpress" class="external text" title="http://www.perazza.com/wordpress">Brazilian Portuguese 2.1.2</a></li>
</ul>
<p><b></b><br />
No 1º link (webmais), temos a tradução tanto na codificação UTF-8, como na codificação ISO-8859-1. Recomendo utilizar a codificação ISO-8859-1.</p>
<p>Downloads pelo site <a href="http://www.webmais.com/wordpress/" target="_blank">http://www.webmais.com/wordpress/<br />
</a></p>
<p><a href="http://www.webmais.com/download-manager.php?id=15" title="wordPressptbr" target="_blank" name="wordPressptbr"><b>Tradução do WordPress 2.3.2</b> (ISO-8859-1)</a></p>
<p><a href="http://www.webmais.com/download-manager.php?id=37" title="wordPressptbr" target="_blank" name="wordPressptbr"><b>Tradução do WordPress 2.3.2 </b>(UTF-8)</a></p>
<p>Após ter feito o download. Descompacte o arquivo pt_BR.mo e coloque na pasta <b><i>wp-includes/languages/ </i></b>:</p>
<p>Cada codificação possui uma maneira de instalar, abaixo cada uma delas:<br />
Para <b>codificação ISO-8859-1</b>, siga os passos:</p>
<ol>
<li>Abra o arquivo: wp-config.php.
<p>Encontre o comando:<br />
<i>define (&#8216;WPLANG&#8217;, &#8221;);<br />
</i><br />
E altere para:<br />
<i>define (&#8216;WPLANG&#8217;, &#8216;pt_BR&#8217;);</p>
<p></i><br />
Ainda no mesmo arquivo, encontre o comando:<br />
<i> define(&#8216;DB_CHARSET&#8217;, &#8216;utf8&#8242;);<br />
</i><br />
E altere para:<br />
<i> define(&#8216;DB_CHARSET&#8217;, &#8216;latin1&#8242;);</p>
<p></i></li>
<li>Logue no WordPress <b>/wp-admin</b>, acesse <b>Opções</b>, em seguida <b>Lendo</b> e modifique a codificação de caracteres de <b>UTF-8</b> para <b>ISO-8859-1
<p></b></li>
<li>Pronto! O Seu WordPress já foi traduzido para Português do Brasil (portugues-br)</li>
</ol>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[How to do proper URL Encoding in Javascript when using window.open()]]></title>
<link>http://roneiv.wordpress.com/2007/12/25/how-to-do-proper-url-encoding-in-javascript-when-using-windowopen/</link>
<pubDate>Tue, 25 Dec 2007 00:40:10 +0000</pubDate>
<dc:creator>roneiv</dc:creator>
<guid>http://roneiv.wordpress.com/2007/12/25/how-to-do-proper-url-encoding-in-javascript-when-using-windowopen/</guid>
<description><![CDATA[In some cases you might want to do encoding of URL-parameters directly inside javascript, simply bec]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>In some cases you might want to do encoding of URL-parameters directly inside javascript, simply because you think it&#8217;s best to do it there or because you have no other options of getting the parameters encoded. But as I discovered when trying to do this myself, doing this in javascript is not like a walk in the park, or at least there are some important &#8220;black holes&#8221; you should be aware of.</p>
<p>In my example I use JSF, and I have a h:dataTable component which I build up programmatically in java. For each row I have a link that will  open a new popup window that points to another page (jsp) passing some parameters. I needed to do javascript-encoding of parameters, because when I build my table I use expression language (EL &#8211; #{} ) and valueBindings (for those of you that are familiar with it). If you use expressions you don&#8217;t hold the value itself, but the expression will be &#8220;decoded&#8221; run-time when the page is rendered.</p>
<p>To show an example, I have a Java-class that has a hashmap called properties, an ordinary key-value thing. By using a get-method that returns the whole map it&#8217;s possible through EL to give an &#8220;input-parameter&#8221; on which property to get. My get-method:</p>
<pre class="brush: java;">
public Map&lt;String, Object&gt; getProperties()
{
	return properties;
}</pre>
<p>this would be the expression to get the url:</p>
<pre class="brush: java;">
String url = &quot;#{row.properties['&quot;+SOME_KEY_THAT_POINTS_TO_OBJECT_WITH_URL+&quot;']}&quot;;</pre>
<p>And then I would create my link in java with value-binding like this:</p>
<pre class="brush: java;">
HtmlOutputLink htmlOutputLink = new HtmlOutputLink();
ValueBinding vb = FacesContext.getCurrentInstance().getApplication().createValueBinding(
&quot;popupWindow('&quot;+ url +&quot;','MY_POPUP_WINDOW', WIDTH,HEIGHT); return false;&quot;);
htmlOutputLink.setValueBinding(&quot;onclick&quot;,vb);</pre>
<p>The &#8220;normal&#8221; way of doing encoding java-side would be something like this:</p>
<pre class="brush: java;">
public String urlEncode(String urlToEncode)
{
	String encodedUrl = &quot;&quot;;
	if(urlToEncode != null)
	{
		try
		{
 			encodedUrl = URLEncoder.encode(urlToEncode,&quot;UTF-8&quot;);
		}
		catch (Exception e)
 		{
			log.error(&quot;Encode exception when encoding url: &quot; + urlToEncode,e);
 			return urlToEncode; //Return unencodedUrl
		}

		return encodedUrl;
	}
}</pre>
<p>But in my case, if I were to encode the url before passing it to the javascript, what I would encode would actually be my expression, not the value of it. The result of this encoding would be something like;</p>
<pre> %23%7Brow.properties%5B%27SOME_KEY_THAT_POINTS_TO_OBJECT_WITH_URL%27%5D%7D.</pre>
<p>Thus, I was in the need of doing the encoding after the page has been rendered, and then I needed to do it inside the javascript.</p>
<p>I tried two different approaches for encoding the url, the first one which I expected would work, and the second one which I had to do to make it work. What you need to be aware of is that default encoding in javascript is the UTF-8 format, so if you try to decode &#8220;on the other side&#8221; you have to use UTF-8 in your decoder. I&#8217;ve also seen some examples around saying that the escape()-function does some sort of encoding, but this one just escapes (replaces) special characters, for example it converts white-spaces to %20%. Trying to use escape() on the URL and then decoding it with an URL-decoder would fail! Still, I found the need of using the escape()-function as well, and will explain this as I go.</p>
<p>The first function I tried uses the encodeURI()-function inside javascript directly:</p>
<pre class="brush: java;">
function encodeUrl(url)
{
	return encodeURI(url);
}</pre>
<p>And from my popupWindow()-function I call the encodeUrl() like this:</p>
<pre class="brush: java;">
var newWindow = '';
function popupWindow(url, name, width, height)
{
	name = name.replace(/\/&amp;#124;\-&amp;#124;\./gi, &quot;&quot;);
	var whitespace = new RegExp(&quot;\\s&quot;,&quot;g&quot;);
	name = name.replace(whitespace,&quot;&quot;);
	if (!newWindow.closed &amp;&amp; newWindow.location)
	{
		newWindow.location.href = encodeUrl(url);
	}
	else
	{
		newWindow = window.open(encodeUrl(url),name, &quot;location=no, scrollbars=yes, resizable=yes, toolbar=no, menubar=no, width=&quot; + width + &quot;, height=&quot; + height );
		if (!newWindow.opener)
			newWindow.opener = self;
	}
	if (window.focus)
	{
		newWindow.focus()
	}
}</pre>
<p>But doing it like this the decoding seemed to fail, as I couldn&#8217;t get the proper value from the url on the receiving side (decodedValue != encodedValue). Having struggled with this one for some time, I discovered that the window.open()-function actually tries to do some sort of decoding of the url itself before it passes it on. So I created another method that encodes on parameter level, and which also uses the escape-method to &#8220;protect&#8221; the encoded parameters from the window.open()-function.</p>
<pre class="brush: java;">
function encodeUrl(url)
{
 	if (url.indexOf(&quot;?&quot;)&gt;0)
 	{
		encodedParams = &quot;?&quot;;
 		parts = url.split(&quot;?&quot;);
 		params = parts[1].split(&quot;&amp;&quot;);
 		for(i = 0; i &lt; params.length; i++)
 		{
			if (i &gt; 0)
	 		{
				encodedParams += &quot;&amp;&quot;;
			}
			if (params[i].indexOf(&quot;=&quot;)&gt;0) //Avoid null values
			{
				p = params[i].split(&quot;=&quot;);
				encodedParams += (p[0] + &quot;=&quot; + escape(encodeURI(p[1])));
			}
			else
			{
				encodedParams += params[i];
			}
		}
		url = parts[0] + encodedParams;
	}
	return url;
}</pre>
<p>One thing to mention in this function is that is uses the encodeURI()-function. This one doesn&#8217;t do anything with the reserved characters like ; , / ? : @ &#38; = + $. If you for some reason need to encode these as well, you should use the encodeURIComponent()-function.I tried to do this function without the use of escape(), but then the parameters &#8220;arrived&#8221; wrongly encoded, and became &#8220;corrupted&#8221; after I decoded them. Wrapping the encodeURI() inside an escape() solved this problem:</p>
<pre class="brush: java;">
encodedParams += (p[0] + &quot;=&quot; + escape(encodeURI(p[1])));</pre>
<p>Finally, inside my receiving page, I managed to decode the parameters and get the values I actually submitted with a java decoding method like this:</p>
<pre class="brush: java;">
public String urlDecode(String urlToDecode)
{
	String decodedUrl = &quot;&quot;;
 	if(urlToDecode != null)
 	{
 		try
 		{
 			decodedUrl = URLDecoder.decode(urlToDecode,&quot;UTF-8&quot;);
 		}
 		catch (Exception e)
 		{
 			log.error(&quot;INVALID URL: &quot; + urlToDecode,e);
 			return &quot;&quot;;
 		}
 	}
	return decodedUrl;
}</pre>
<p>This way of doing it also works for special characters belonging to the ISO-8859-1 encoding, even if the encoding used is actually UTF-8. As a small reference I can list the proper UTF-8 encoding for the Scandinavian specific characters if you use those, in this way you should be able to check whether your URL is encoded correctly or not if you print it out before decoding it.</p>
<ul>
<li>æ = %E6</li>
<li>ø = %F8</li>
<li>å = %E5</li>
<li>Æ = %C6</li>
<li>Ø = %D8</li>
<li>Å = %C5</li>
</ul>
<p>You can also check out this page for a complete reference of encoded characters: <a href="http://www.w3schools.com/tags/ref_urlencode.asp">http://www.w3schools.com/tags/ref_urlencode.asp</a></p>
<p>If you want to try an example of how encodeURI and encodeURIComponent works, copy and paste the following javascript and test with your own strings:</p>
<pre class="brush: jscript;">

&lt;script type=&quot;text/javascript&quot;&gt;

                var unencodedText = &quot;This is my text that contains whitespaces and characters like # and Ø&quot;;
                var encodedText = &quot;&quot;;
                var decodedText = &quot;&quot;;
                alert('unencodedText: ' + unencodedText);

                //To encode whitespaces and the 'Ø' character - use encodeURI
                encodedText = encodeURI(unencodedText);
                //We see that whitespaces and 'Ø' are encoded, but the '#' is still there:
                alert('encodedText: ' + encodedText);

                //If we decode it we should get our unencodedText back
                decodedText = decodeURI(encodedText);
                alert('decodedText: ' + decodedText);

                //To also encode the '#' we use the encodeURIComponent
                encodedText = encodeURIComponent(unencodedText);
                //Now all the characters have been encoded:
                alert('encodedText: ' + encodedText);

                //To get our unencodedText back we now need to use the decodeURIComponent
                decodedText = decodeURIComponent(encodedText);
                alert('decodedText: ' + decodedText);

            &lt;/script&gt;
</pre>
<p>I hope that you might find this post useful, and that it might save you from some pain in the a** if you try to use the encoding capabilities of Javascript.</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Editando UTF8 no vim]]></title>
<link>http://xnxlabs.wordpress.com/2007/12/19/editando-utf8-no-vim/</link>
<pubDate>Wed, 19 Dec 2007 23:26:03 +0000</pubDate>
<dc:creator>serialcoder</dc:creator>
<guid>http://xnxlabs.wordpress.com/2007/12/19/editando-utf8-no-vim/</guid>
<description><![CDATA[Para editar arquivos em UTF8 no vim vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1" ou]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Para editar arquivos em UTF8 no <a href="http://www.vim.org/">vim</a></p>
<pre>
vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1"</pre>
<p>ou&#8230;</p>
<pre>
[user@host ~]$ cat bin/vim-utf8
#!/bin/bash
vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1" "$@"</pre>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Editando UTF8 no vim]]></title>
<link>http://dimitrihashnov.wordpress.com/2007/12/19/editando-utf8-no-vim/</link>
<pubDate>Wed, 19 Dec 2007 23:26:03 +0000</pubDate>
<dc:creator>serialcoder</dc:creator>
<guid>http://dimitrihashnov.wordpress.com/2007/12/19/editando-utf8-no-vim/</guid>
<description><![CDATA[Para editar arquivos em UTF8 no vim vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1" ou]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Para editar arquivos em UTF8 no <a href="http://www.vim.org/">vim</a></p>
<pre>
vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1"</pre>
<p>ou&#8230;</p>
<pre>
[beckmann@duo ~]$ cat bin/vim-utf8
#!/bin/bash
vim -c "set encoding=utf8" -c "set termencoding=iso-8859-1" "$@"</pre>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Switch from current encoding to specified encoding not supported.]]></title>
<link>http://doquent.wordpress.com/2007/12/04/switch-from-current-encoding-to-specified-encoding-not-supported/</link>
<pubDate>Tue, 04 Dec 2007 20:25:18 +0000</pubDate>
<dc:creator>doquent</dc:creator>
<guid>http://doquent.wordpress.com/2007/12/04/switch-from-current-encoding-to-specified-encoding-not-supported/</guid>
<description><![CDATA[I ran into this error when trying to open an XSL file in Internet Explorer, which specified the enco]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>I ran into this error when trying to open an XSL file in Internet Explorer, which specified the encoding as ISO-8859-1. However, it seemed that one of the editors I used on Windows used a double-byte encoding to store the file.</p>
<p>While various editors and Firefox opened this file fine, IE gave the above error. One thing that worked for me was to open the file in XML Notepad 2007 and then save it. It seems that XML Notepad honors the encoding specified within the document while saving it.</p>
</div>]]></content:encoded>
</item>

</channel>
</rss>
