OS SEGREDOS DO GOOGLE E DO RANKING DAS EMPRESAS
Por J.C.Mello
ABET OPEN UNIVERSITY, USA
http://mba-open-university.net/index.html
mar-2006
Tem uma grande confusao na area. E eu
complico mais quando escrevo: ...PARA O COMPUTADOR LER. O que es isso?
Vamos falar sobre o ponto de vista do BUSINESS, ou seja voce tem um site na
Internet para essa finalidade (institucional, ou comercio/fabricacao/servicos).
Evidentemente o seu objetivo es ter a maior AUDIENCIA possivel (e no Primeiro
Mundo isso pode fazer voce ficar milionario).
Mas como consegui-la? Como conseguir com que o maior numero possivel de
internautas visitem o seu site e voce obtenha algum lucro/beneficio por causa
disso?
Resposta: Com um bom RANKING no Google principalmente (mas tambem no YAHOO).
Ranking es o NIVEL em que voce esta numa resposta que o Google da, quando voce
faz uma pesquisa. Quanto mais alto for o seu RANKING, mais voce aparece. Na
realidade existe um velho consenso: Se voce nao estiver nas DUAS PRIMEIRAS
paginas dos resultados de uma pesquisa (as primeiras 20 respostas) voce nao
"esta" na Internet. Vamos dizer que voce venda cavalos, e alguem faz uma
pesquisa com essa palavra no Google. Vai receber 50 milhoes de resultados, e o
Google lhe mostrara a primeira pagina com 10 resultados; se voce nao estiver
nela, o internauta nao vai procurar nos outros 49.999.990 resultados (na
realidade, estatisticamente o internauta so procura nos primeiros 20
resultados).
Portanto, voce para "estar" na Internet e ter audiencia que lhe gere alguma
forma de lucro/beneficio, voce precisa ter um bom RANKING. O layout do seu site
nao interessa, esqueca o "bonito" que todo mundo lhe sugere e faca o seu site
para o Google (NAO use Flash ou similares, NAO use frames, e um monte de coisas
mais, umas 50, pois perdera ranking). Fazer ambos "bonito" + para o Google, es
teoricamente impossivel.
O Google faz a analise do RANKING, e coloca o seu site no "nivel" equivalente.
Mas para fazer isso, ele tem um algoritmo (para ficar mais claro, ele tem 100
"normas" para isso e cada uma analisa uma coisa), e esse algoritmo examina 100
COISAS para definir o RANKING do seu site em relacao a todos os outros sites.
100 COISAS! E elas vao definir a "qualidade" (RANKING) do seu site.
Dessas 100 coisas, a mais importante es:
- Contar a quantidade de links que APONTAM para o seu site, e adicionalmente ver
a "qualidade" de cada um desses links em relacao ao conteudo do seu site.
Exemplos: Seu site es de cavalos, e um OUTRO site aponta (um link) para o seu
site; se esse OUTRO es relacionado com cavalos e tem um bom ranking, voce ganha
10 pontos; se ele nao tem um bom ranking, voce ganha 5 pontos; e se ele nao es
de cavalos, voce ganha um ponto.
Portanto, voce tem que ter o maior numero de INBOUND links = links que ENTRAM no
seu site, vindos de sites preferencialmente com bons rankings NO SEU RAMO.
Ora, quem "le" os sites PARA ISSO nao es um humano, es um dos 250.000
computadores (em grid computing, explicarei como no futuro) do Google. Portanto,
o que lhe interessa es o COMPUTADOR LER, e nao um humano.
Vejamos agora:
Voce escreve um ARTIGO sobre cavalos, e o coloca nas centenas de publishers
(publicadores, editoras, etc) que existem na Internet. Nele, no seu artigo, voce
coloca um link para o seu site. Quando o Google "pegar" esse artigo (ele lhe
visitar, ele faz isso 24 horas por dia), voce vai ganhar pontos que se somam aos
seus pontos atuais, ao seu ranking atual. Na realidade vai pegar muitos, pois o
seu artigo foi colocado em centenas de editoras porem milhares de outros sites
os copiam e tambem publicam.
Mas imagine voce ter que escrever artigos, e quanto mais melhor... Uns 5 por
semana... Voce nao aguenta.
Por isso, ha um ano atras eu fiz um programa (que demorou um ano para ficar
pronto...) de analise de conteudos, ate mais complexo do que o do Google (uma
das 100 COISAS es analise de conteudos, nao confundir com analise de keywords -
palavras-chaves - veja abaixo por que ele es mais complexo). E esse programa
"escreve" o artigo sobre uma das minhas materias das minhas 2600 licoes
existentes. E pode fazer 10.000 artigos diferentes por dia se eu o quizer,
embora faca somente um (sem interferencia humana). Outro programa que fiz
(tambem complexo, pois CADA editora tem as suas normas proprias) os coloca nas
centenas de editoras. E tudo isso automaticamente e sem qualquer interferencia
humana, a cada noite.
E ele (seu artigo) estara preparado (disponivel) para os COMPUTADORES do Google.
Dai a expressao ...PARA OS COMPUTADORES LEREM.
E os humanos? Nao interessam, o SEU objetivo (BUSINESS) es conseguir AUDIENCIA
atraves das pesquisas e obter algum lucro/beneficio disso, de gente que esta
procurando o SEU NEGOCIO e nao de gente que ocasionalmente le um seu artigo. Sao
2 tipos de audiencia BEM DIFERENTES, para BUSINESS (acima eu disse que so
estavamos vendo isso) a voce so interessa a primeira.
E aqui vem uma outra coisa: Seu site es de cavalos, e voce tem 50 milhoes de
"competidores" para vencer (lembre-se que outros sites estao tentando vencer
voce, ao mesmo tempo...). Portanto, 1/50.000.000, o que es muito dificil. Mas se
o seu site for de um restaurante no Recreio de Bandeirantes, voce tem somente 20
competidores a vencer. Logo, 1/20, muitissimo mais facil.
O nome de tudo isso (usar o algoritmo do Google - que es super-secreto - para
conseguir um bom ranking) es SEO Search Engine Optimization, Otimizacao do seu
site "para" os Search Engines. E aqui vem uma surpreza: SEO es o assunto mais
complexo que aprendi em toda a minha vida, pois alem das 100 COISAS que sao
secretas, seus dados sao extremamente dinamicos pois se voce esta diariamente
tentando elevar seu ranking os seus competidores tambem o estao... e mais de
2.000.000 de sites NOVOS (quantos serao "novos" competidores?) entram na
Internet a cada 24 horas. Alias a Internet atingiu 1 Bilhao de usuarios, ha
poucos meses. Complexidade + dinamicidade + segredo, sai de baixo.
O assunto es extremamente mais complexo, queria apenas dar um verniz.
Vou dar um exemplo:
Ha tres meses a principal palavra-chave pela qual estatisticamente alguem
procurava MBAs na Internet, era "online MBA program". Em 4.900.000 de
resultados, eu estava na primeira pagina e na 6a. posicao, acima de todas
Universidades do mundo (fechadas, ou abertas como a minha). Uma delicia... Mas
entao o Google mudou (e muito) o seu algoritmo, e TAMBEM a quantidade de
respostas subiu para 40.000.000, e eu sumi, para uma 400a. posicao ou mais. E
junto com alguns gurus (aconteceu a mesma coisa com eles, como es obvio) com
trocas de informacoes tecnicas estamos descobrindo o que mudou, para fazer as
mudancas necessarias. Ja descobrimos varias coisas. Portanto, TRABALHO CONTINUO
se voce quer ter um bom ranking (Google faz esses updates periodicamente como
resultado de suas pesquisas para o aprimoramento do seu algoritmo + 2.000.000 de
sites novos que entram diariamente, o que diariamente muda tudo). Dificil, muito
dificil.
Outra visao: "online MBA program" es estatisticamente a mais procurada como ja
disse. Mas eu PROPOSITADAMENTE tenho 30 sites diferentes e independentes (no meu
Server mainframe no Arizona), cobrindo 5000 keywords relacionadas com MBAs. A
grande maioria sao secundarias, mas geram um PEQUENO trafego o qual, somado, lhe
gera uma apreciavel audiencia. Uma palavra-chave (competicao) da 1/1.000, outra
1/10.000, e assim por diante. Resumo: Se voce tem GRANDE competicao (como
1/50.000.000) esqueca a palavra PRINCIPAL e trabalhe nas centenas ou milhares
secundarias (1/50, 1/10.000, etc). Exemplos de secundarias: mba certification,
mba learning, mba distance, mba internet, mba Pakistan, mba online Pakistan, etc
e etc. Centenas ou milhares.
Um exemplo: Em "cio certification" eu estou em primeiro lugar em todo o mundo.
Praticamente nao existe ninguem no mundo que isso procure (o top atual da
informatica) e que nao me encontre. E centenas de outras tambem no primeiro
lugar ou na primeira pagina. Por isso, quando o Google me jogou para a posicao
400a. no "online MBA program" e minha audiencia caiu 75% de um dia para o outro,
os 25% restantes das palavras-chaves secundarias me sustentaram.
Ha pouco inaugurei OUTRA etapa: De cada artigo que o computador "escreve"
diariamente, um outro programa que fiz (misturando um monte de programas,
inclusive o extraordinario SYSTRAN PRO PREMIUM 5.0) automaticamente e sem
interferencia humana TRADUZ esse artigo para mais ONZE linguas e os coloca num
site MEU na Internet. Finalidade: gerar palavras-chaves/links em OUTRAS linguas
e que tem uma relacao 1/x muito menor do que em ingles. Esta dando certo, em MBA
se um chines faz uma pesquisa (ainda somente no Yahoo) com aqueles simbolozinhos
deles, eu apareco em primeiro lugar sobre todas as universidades chinesas.
A proposito, voces imaginam se eu fizer isso (AUDIENCIA) para uma boa
Universidade brasileira ministrar seus cursos e os desejadissimos DEGREES em
todo o mundo? Milhoes e milhoes de dolares. Mas seria meu tempo integral e umas
10-12 horas/diarias... Alias nao poderia faze-lo, pois esse pessoal AINDA nao
compreendeu o que es e-Education, estao engatinhando com seus (equivocados)
programas online. No inicio ha uns 10 anos, eu tinha os 3 melhores programas
online do mundo, e assim comecei. Tres meses depois fui obrigado a mudar a
metodologia. Como um exemplo: Eu tenho um aluno indiano que pediu que suas
licoes fossem mandadas somente nas 5as. feiras (horario U.S.) pois na 6a. feira
ele iria num cybercafe para estuda-las pois nao tinha computador (e muitos e
muitos outros exemplos). Outro: Trabalha num offshore de petroleo e so vem ao
continente a cada 15 dias. Outro: Trabalha 3 semanas na Arabia Saudita e nao
pode ter computador, e depois passa uma semana na sua casa na Malasia. O mundo
es assim, e nao como esse pessoal pensa que es, tudo bonitinho, todo mundo com
bom computador (camera, som, etc), todo mundo DISPONIVEL nas horas das classes
online, etc... Outro exemplo interessante: Fui obrigado a abrir conta num Banco
ingles (MoneyBookers, alias avancadissimo na Internet, os brasileiros nao fazem
operacoes equivalentes - ate por celular num pais arabe voce opera), pois os
arabes NAO QUEREM mandar mandar dinheiro para os Estados Unidos...
Portanto voltando:
5 artigos em ingles por semana,
55 idem em 11 linguas tambem por semana.
Total: 60/semana, 3120 artigos/ano, e como cada um deles es publicado e
re-publicado centenas ou milhares de vezes, quantos links? Num e-mail recente eu
disse que um UNICO artigo publicado em 2004 (escrito por um humano, eu...) foi
publicado/"apanhado" pelo Google 16.000 vezes = 16.000 links de 16.000 paginas.
Veja um exemplo em (russo):
http://tips-on-project-management-pm.business-technology.us/russian.html
E em mais uma semana, inauguro a sua EXTENSAO: colocar esses 12 artigos diarios
(automatica e sem interferencia humana) nos MEUS 12 Grupos e nos MEUS 12 Blogs
criados exclusivamente para isso (Yahoo, etc), CADA UM gerando links para os
meus sites. A proposito, voce sabia que o YahooGroups aceita grupos em outras
linguas inclusive as de 2 bytes como chines, etc)? Fui descobrir agora.
Como o Google faz o seu algoritmo?
Sao 240 tecnicos trabalhando exclusivamente nele, um programa propositadamente
extremamente fraccionado para mante-lo secreto (o calcanhar de Aquiles do
Google, a propria razao da sua existencia) e fraccionado em muitos Estados
diferentes. Somente 3 pessoas o conhecem totalmente, pois essa informacao vale
US$ 1 BILHAO. Por que? Obviamente dependendo de varios fatores, se o seu site
tiver OTIMA AUDIENCIA voce pode ganhar MUITO dinheiro. Tem muitos primeiros
lugares que valem US$ 50 milhoes/mes... Em resumo, para melhorar a "qualidade"
das respostas o principal es uma analise de conteudos e o Google investe feio
nisso, tem ate um Premio Nobel de Matematica (em New Jersey, eu ja falei com ele
por e-mail) exclusivamente nisso, ele me disse que uma analise melhor somente
sera possivel com uma "nova" matematica no que alias ele esta trabalhando
exclusivamente - e regiamente pago pelo Google.
Agora vou explicar por que a minha analise de conteudo es um algoritmo melhor do
que o do Google, como eu disse acima:
1. Eu tenho apenas (em MBAs, ITs, etc) umas dezenas de assuntos nos meus cursos,
portanto es infinitamente mais facil analisar conteudos (portanto, customizar o
algoritmo para uma analise somente para os meus assuntos)
2. O Google, mesmo que o quizesse, nao poderia usar o meu algoritmo, pois tem
milhoes e milhoes (bilhoes?) de assuntos DIFERENTES, portanto seu algoritmo nao
pode ser especifico (mais avancado, como o meu) mas somente generico (portanto
de nivel de analises/resultados bem inferiores).
A proposito, analise de conteudos vai MUDAR COMPLETAMENTE O MUNDO, tudo vai ser
diferente (business, vida academica, vida intelectual, Governos, etc e etc).
Novo mundo digital. Com o que eu estou fazendo (o embrionario "redigir"
artigos/livros de agora, vai ser exponencialmente maior com a Artificial
Intelligence e muitos novos algoritmos resultantes do natural processo de
tentativas-e-erros), voce vai ter BILHOES de artigos (conteudos) escritos pelo
computador e disponiveis para qualquer coisa... Mundo digital. E creio que voce
pensou: o processo se auto-alimenta naturalmente... Verdade!