<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Blog de SEO e Webstandards &#187; Conteúdo duplicado</title>
	<atom:link href="http://seo.blog.br/conteudo-duplicado/feed" rel="self" type="application/rss+xml" />
	<link>http://seo.blog.br</link>
	<description>SEO, Web Standards e algo mais.</description>
	<lastBuildDate>Tue, 06 Jul 2010 06:30:07 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Evitando conteúdo duplicado pelas URL`s com PHP</title>
		<link>http://seo.blog.br/seo/evitando-conteudo-duplicado-pelas-urls-com-php.html</link>
		<comments>http://seo.blog.br/seo/evitando-conteudo-duplicado-pelas-urls-com-php.html#comments</comments>
		<pubDate>Thu, 02 Jul 2009 05:23:30 +0000</pubDate>
		<dc:creator>Ronaldo Bitencourt</dc:creator>
				<category><![CDATA[Conteúdo duplicado]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[301]]></category>
		<category><![CDATA[404]]></category>
		<category><![CDATA[Canonização da URL]]></category>
		<category><![CDATA[Conteúdo]]></category>
		<category><![CDATA[Script]]></category>
		<category><![CDATA[Status HTTP]]></category>
		<category><![CDATA[URL's]]></category>

		<guid isPermaLink="false">http://www.seo.blog.br/?p=285</guid>
		<description><![CDATA[Como tinha prometido no post anterior onde citei algumas dicas de como otimizar a estrutura dos arquivos do seu site agora vamos falar mais afundo de como evitar conteúdo duplicado, que é um assunto muito importante para SEO, e para isso vamos usar uma versão mais completa do script citado no post anterior, mãos à obra.

Um erro muito frequente em websites é a não canonização das URL's para cada uma das páginas do site, vamos entender melhor o que é a canonização das URL's de um site.
Canonização das URL's

Existem várias formas de se linkar para uma determinada página como por exemplo:

    * www.site.com.br/pagina.php?id=1234 - sem URL's amigáveis
    * site.com.br/pagina.php?id=1234 - sem URL's amigáveis
    * www.site.com.br/titulo-da-pagina-1234 - com URL's amigáveis
    * site.com.br/titulo-da-pagina-1234 - com URL's amigáveis]]></description>
			<content:encoded><![CDATA[<p>Como tinha prometido no post anterior onde citei algumas dicas de como <a title="Otimizando a estrutura de arquivos do seu site" href="http://www.seo.blog.br/desenvolvimento/otimizando-a-estrutura-de-arquivos-do-seu-site.html">otimizar a estrutura dos arquivos do seu site</a> agora vamos falar mais afundo de <strong>como evitar conteúdo duplicado</strong>, que é um assunto muito importante para <a title="Blog de SEO" href="http://www.seo.blog.br/"><acronym title="Search Engine Optimization">SEO</acronym></a>, e para isso vamos usar uma versão mais completa do script citado no post anterior, mãos à&nbsp;obra.</p>
<p>Um erro muito frequente em websites é a não canonização das <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s para cada uma das páginas do site, vamos entender melhor o que é a canonização das <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s de um&nbsp;site.</p>
<h3>Canonização das&nbsp;<acronym title="Uniform Resource Locator">URL</acronym>&#8217;s</h3>
<p>Existem várias formas de se linkar para uma determinada página como por&nbsp;exemplo:</p>
<ul class="unIndentedList">
<li> www.site.com.br/pagina.php?id=1234&thinsp;&#8211;&thinsp;sem <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s&nbsp;amigáveis</li>
<li> site.com.br/pagina.php?id=1234&thinsp;&#8211;&thinsp;sem <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s&nbsp;amigáveis</li>
<li> www.site.com.br/titulo-da-pagina-1234&thinsp;&#8211;&thinsp;com <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s&nbsp;amigáveis</li>
<li> site.com.br/titulo-da-pagina-1234&thinsp;&#8211;&thinsp;com <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s&nbsp;amigáveis</li>
</ul>
<p>As quatro <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s acima são diferentes, óbvio, e todas elas se acessadas irão mostrar uma página idêntica ou seja com o mesmo conteúdo. Para os buscadores isso acaba sendo um problema e pra você também, como o PageRank é de certa forma um tipo de pontuação da página pelo Google, se estiver disponível as quatro formas de acessar a página o PageRank pode ser divido entre essas&nbsp;<acronym title="Uniform Resource Locator">URL</acronym>&#8217;s.</p>
<p>Para evitar isso, deve ser escolhido uma forma padrão de link permanente para as páginas do site, claro, aplicando uma regra simples de usabilidade devemos sempre deixar as quatro opções disponíveis para serem acessadas, mas no final das contas uma única <acronym title="Uniform Resource Locator">URL</acronym> deve ser eleita como principal. Existe uma forma correta de fazer isso, e se não for seguida o conteúdo duplicado continuará a existir prejudicando seu site nos&nbsp;buscadores.</p>
<h3>Script para canonização das&nbsp;<acronym title="Uniform Resource Locator">URL</acronym>&#8217;s</h3>
<p>Antes de ir direto ao script você precisa ter em mente algumas&nbsp;premissas:</p>
<ul class="unIndentedList">
<li> Escolha uma única forma de <strong>link permanente das páginas</strong> do seu&nbsp;site.</li>
<li> <acronym title="Uniform Resource Locator">URL</acronym> que não existe conteúdo nela deve estritamente retornar o <a href="http://pt.wikipedia.org/wiki/HTTP_404" target="_self"><strong>Código de Status <acronym title="HyperText Transfer Protocol">HTTP</acronym>&nbsp;404</strong></a>.</li>
<li> Existem pelo menos duas formas de se acessar a raiz de um diretório, acessando o arquivo índice (index.html como padrão no apache) e acessando direto o diretório com o &#8220;/&#8221;, portanto escolha uma da opções e use como padrão em todos os sub-diretórios do seu&nbsp;site.</li>
<li> Quando existir mais de uma <acronym title="Uniform Resource Locator">URL</acronym> para o mesmo conteúdo use o <strong><a href="http://en.wikipedia.org/wiki/HTTP_301" target="_self">Código de Status <acronym title="HyperText Transfer Protocol">HTTP</acronym> 301</a> de redirecionamento permanente</strong> para apenas uma das&nbsp;<acronym title="Uniform Resource Locator">URL</acronym>&#8217;s.</li>
</ul>
<p>Esses são os principais pontos sobre a canonização das <acronym title="Uniform Resource Locator">URL</acronym>&#8217;s do site. Se você achar importante destacar mais algum ponto por favor deixe um comentário e vamos aprender&nbsp;juntos.</p>
<p>Apenas para lembrar que para usar o script abaixo é necessário que seja seguido a dicas citadas no post anterior sobre <a title="Otimizando a estrutura de arquivos do seu site" href="http://www.seo.blog.br/desenvolvimento/otimizando-a-estrutura-de-arquivos-do-seu-site.html">estrutura de arquivos do&nbsp;site</a>.</p>
<p>Como o script é um tanto longo e não ficou legal em nenhuma das tentativas de colocar no corpo do post como texto, criei uma imagem de uma parte dele para ilustrar e também disponibilizei para download o arquivo com o script em <acronym title="Pre-Hypertext Processing">PHP</acronym> no link da imagem&nbsp;abaixo.</p>
<a title="Baixar script" rel="nofollow" href="http://www.seo.blog.br/wp-content/uploads/2009/07/scriptphp.zip"><img class="size-full wp-image-287   " title="script-em-php-para-prevencao-de-conteudo-duplicado" src="http://www.seo.blog.br/wp-content/uploads/2009/07/script-em-php-para-prevencao-de-conteudo-duplicado.png" alt="Download do Script" width="675" height="316" /></a>
<p>Como na imagem acima o script é comentado linha por linha, cada ação executada pelo script foi devidamente comentada para facilitar o entendimento das ações do&nbsp;script.</p>
<p>O script foi feito em <acronym title="Pre-Hypertext Processing">PHP</acronym> por mim e pelos meus colegas da <a title="Agência digital em florianópolis" href="http://www.agenciahive.com.br" target="_self">Agência Hive</a>, e também incluí a dica comentada no post anterior por outro parceiro, Stephan, administrador do <a href="http://www.hxbr.net" target="_self">Portal&nbsp;HxBr</a>.</p>
<p>Tenho certeza que existem outras formas de se fazer este mesmo script em <acronym title="Pre-Hypertext Processing">PHP</acronym>, se você sabe uma forma de reduzí-lo manda bala que nós vamos fornando um script cada vez melhor.<br />
Valeu e até o proximo post :)<br />
<h3 class='related_post_title'>Leia&nbsp;também:</h3>
<ul class='related_post'>
<li><a href='http://www.seo.blog.br/desenvolvimento-web/otimizando-a-estrutura-de-arquivos-do-seu-site.html' title='Otimizando a estrutura de arquivos do seu site'>Otimizando a estrutura de arquivos do seu&nbsp;site</a></li>
<li><a href='http://www.seo.blog.br/seo/cloaking/redirecionamento-e-frames-como-google-interpreta.html' title='Redirecionamentos e frames como o Google interpreta?'>Redirecionamentos e frames como o Google&nbsp;interpreta?</a></li>
</ul>]]></content:encoded>
			<wfw:commentRss>http://seo.blog.br/seo/evitando-conteudo-duplicado-pelas-urls-com-php.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
