Supercomputadores

CURITIBA (wet… five days) Ontem discutíamos na universidade sobre o novo supercomputador que os chineses acabaram de lançar. Trata-se do Sunway Taihulight, um brinquedinho com 10.649.600 cores (isso mesmo, 10 milhões de cores) o qual tem uma capacidade teórica  de processamento de 125 petaflops. Só lembrando,  FLOP (Floating-point Operations per Seconds) é a unidade usada para determinar o desempenho de um computador. Em geral usamos múltiplos de flops como megaflops (10^6), gigaflops (10^9), teraflops (10^12), petaflops (10^15), etc.. Só para ter uma ideia, aquele Intel i7 que você tem no seu desktop atinge cerca de 20 Gigaflops.

Alguns fatos interessantes sobre isso: i) quinze anos atras a china não tinha nenhum supercomputador na lista dos 500 supercomputadores mais rápidos do mundo, ii) hoje tem um que é cinco vezes mais rápido do que o mais rápido americano, iii) ele continuará sendo o mais rápido até 2018 pelo menos, pois nada do que vai ser lançado até lá vai supera-lo, iv)  a máquina não usa processadores Intel.

O departamento de comercio americano, alegando questões de segurança, não permitiu que a Intel vendesse seus Intel Xeon para os chineses. Banana para os americanos, foi o que o governo chinês deve ter dito quando anunciou a conclusão do projeto.

E por aqui, nosso supercomputador hospedado no LNCC (Laboratório Nacional de Computação Científica) foi desligado por falta de dinheiro para pagar a conta de luz. Isso mesmo, o supercomputador que tem capacidade de processamento de 1.1 petaflops está parado pois não temos dinheiro pra pagar a luz. E parado com ele estão todas as pesquisas que dependiam do seu poder de processamento. Sad but true!

 

 

Índice H

CURITIBA (measuring) O que é o tal do índice H e pra que serve? Essa é uma pergunta que geralmente escuto dos alunos de pós-graduação.  Em 2005, um físico chamado J. E. Hirsch, intrigado com os critérios usados para avaliar a produção científica de pesquisadores, propôs um índice [1] que leva em consideração não somente a quantidade de artigos escritos, mas também a quantidade de citações que o mesmo recebe. Antes do índice H, os pesquisadores eram avaliados por um dos dois critérios ou ainda pela relação entre os dois.

  1. Número total de artigos escritos. Vantagens: Mede a produção. Desvantagem: Não mede o impacto da produção.
  2. Número total de citações. Vantagem: Mede o impacto total. Desvantagem: Pode ser inflada por um único trabalho, como um livro campeão de vendas.

O índice H junta esses dois critérios em um único número usando uma regra bastante simples: Um pesquisador tem índice H se H artigos publicados tiverem pelo menos H citações cada um. Por exemplo, para ter um índice H = 20, o pesquisador deve ter publicado 20 artigos que tenham pelo menos 20 citações cada um. A Figura abaixo também exemplifica o índice h.

Representação do indice h (Fonte: Wikipedia)

Representação do indice h (Fonte: Wikipedia)

Depois de um certo limiar, é bastante difícil aumentar o valor de H pelos seguintes motivos. Primeiro, nem todos os artigos serão úteis para aumentar o índice. Alguns artigos vão receber poucas citações simplesmente por não serem muito relevantes.  Segundo, em geral um artigo tem um certo período de popularidade. Depois de um certo tempo, seu número de citações diminui consideravelmente.

Por outro lado, o valor de H nunca vai cair. Mesmo depois de se aposentar e resolver pedalar todos os dias, o pesquisador vai manter seu índice H. Dependendo da popularidade dos seus últimos trabalhos, seu índice pode até aumentar.

Mas o que é um bom índice H? Segundo Hirsch, um índice H = 20 para um pesquisador com 20 anos de carreira, indica um pesquisador de sucesso. H = 40 para os mesmos 20 anos caracteriza pesquisadores excepcionais, geralmente trabalhando com grandes equipes em universidades de ponta. H = 90 para 30 anos de carreira caracteriza os pontos fora da curva (como por exemplo G. Hinton, um dos pais do deep learning). Um dado interessante citado por Hirsch é que 84% dos ganhadores de prêmio nobel possuem índice H >= 30, indicando que são pesquisadores com uma carreira consistente e não surgem do dia pra noite.

Mas é preciso esperar 20 anos para saber se o pesquisador teve sucesso? Não necessariamente. Em geral, espera-se que o índice H seja acrescido de 1 todo ano até o vigésimo ano. O que vier depois é lucro. E quando começa a carreira do pesquisador? Em geral alguém começa a ser produtivo na segunda metade do doutorado. Então pode-se afirmar que alguém que defendeu o doutorado há 10 anos e tem índice H = 10 está no caminho certo.

E como consultar o indice H de alguém? Existem diferentes bases de dados com diferentes formas de indexação, como a ISI e a Scopus. Entretanto, a mais fácil de usar e que tem se tornado padrão, pela simplicidade, acessibilidade e poder de indexação, é o google scholar. Basta digitar o nome do pesquisador e voilà. Se você quiser que seu nome apareça no scholar, seu perfil deve ser público.

E quem usa o indice H? Quando você escreve um projeto pedindo dinheiro para qualquer órgão de fomento, pode ter certeza que quem avalia seu projeto vai consultar seu índice H. Em projetos de cooperação internacional você deve colocar essa informação no seu CV.

[1] J. E. Hirsch, An Index to Quantify an Individual’s scientific research output, PNAS, 102(46):16569-16572, 2005.

Distribuição de Bolsas de Produtividade na Computação

CURITIBA (void) Depois de uma discussão com alguns colegas sobre a relação oferta/demanda de bolsas de produtividade na área de computação, resolvi verificar alguns dados. A informação que me foi passada (numa mesa de bar, diga-se de passagem) era que o CNPq tinha feito um corte de 30% na bolsas de produtividade no fim de 2015.

Para quem não está familiarizado com o assunto, as bolsas de Produtividade em Pesquisa (PQ) são destinadas aos pesquisadores que se destaquem entre seus pares, valorizando sua produção científica segundo critérios normativos, estabelecidos pelo CNPq, e específicos, pelos comitês de assessoramento do CNPq.

Segundo o mapa de investimento disponível no site do CNPq, o governo tem cerca 15000 bolsas de produtividade em pesquisa (PQ) e tecnologia (DT) implementadas. Dessas 15 mil bolsas, 398 (2.65%) são destinadas a Ciência da Computação e 74 (0.49%) a área de Tecnologia da Informação e Comunicação. Considerando essas duas áreas como Computação, a área tem hoje 472 bolsistas.

O CNPq disponibiliza somente o investimento atual, não sendo possível comparar com o passado. Entretanto, encontrei um levantamento de 2013 feito pelo Prof. Alexandre N. Duarte da UFPB. Nele consta que em 2013, a área de computação tinha 467 bolsistas. Ou seja, não houve corte de 30%. Apenas o número de bolsas não cresceu nos últimos três anos, apesar da demanda ter crescido. Outro ponto que vale a pena mencionar é que o valor da bolsa não sofre reajuste desde 2008. E pelo andar das carruagem, não teremos nem reajuste e nem acréscimo no número de bolsas tão cedo.

Aproveitando que baixei os dados do site do CNPq, fiz um script para sumarizar os dados e comparar com o ano de 2013. A distribuição de bolsas por classe continua quase a mesma com grande concentração na classe 2 (bolsas sem taxa de bancada)

NivelQuantidade
(2013)
Quantidade
(2016)
1A 23 24
1B 21 22
1C 34 39
1D 76 56
2 313 330

Diferentemente do levantamento de 2013, quando as bolsas estavam espalhadas em 63 instituições, agora as mesmas estão distribuídas em 74 instituições de ensino e pesquisa. As 10 instituições com mais bolsistas continuam as mesmas e ainda concentram cerca de 60% dos bolsistas de produtividade. O que salta aos olhos é o aumento significativo na quantidade de bolsistas na UFMG. Em 3 anos o programa da UFMG ganhou nada menos que 12 bolsistas de produtividade.

InstituiçãoTotal de Bolsas
(2013)
Total de Bolsas
(2016)
Distribuição por
Classe de Bolsa
USP51481A: 6 1B: 4 1C: 4 1D: 6 2: 27
UFMG29411A: 5 1B: 1 1C: 4 1D: 4 2: 27
UFRJ40361A: 6 1B: 3 1C: 1 1D: 9 2: 17
UNICAMP29321A: 3 1B: 3 1C: 3 1D: 5 2: 18
UFPE29301A: 1 1B: 3 1C: 4 1D: 3 2: 19
UFRGS32291B: 3 1C: 9 1D: 2 2: 15
UFF24241A: 1 1B: 1 1C: 1 1D: 3 2: 18
PUC-Rio23181A: 1 1B: 2 1C: 6 2: 9
UFC11141D: 2 2: 12
UFSC16111C: 1 1D: 2 2: 8
UFPR8101D: 4 2: 6
UFAM6101C: 2 2: 8
PUCRS10101D: 2 2: 8
UnB791D: 2 2: 7
UFRN991D: 1 2: 8
UFSCAR981B: 1 2: 7
UERJ581D: 3 2: 5
UNISINOS361D: 1 2: 5
UFES862: 6
PUC/PR661D: 1 2: 5
LNCC751D: 3 2: 2
UNIRIO342: 4
UNIFOR642: 4
UFMS441A: 1 1D: 1 2: 2
UFCG641C: 1 2: 3
UFAL441B: 1 2: 3
UFABC742: 4
UPE232: 3
UNIFESP132: 3
UFU532: 3
UFRPE232: 3
UFPB331D: 1 2: 2
UFMA632: 3
PUC Minas332: 3
INPE331C: 2 2: 1
CPqD332: 3
UTFPR/CT2 2: 2
UTFPR621D: 1 2: 1
UNIVALI322: 2
UFS122: 2
UFPA222: 2
UFOP422: 2
UFJF122: 2
UEM122: 2
UECE122: 2
ITA222: 2
INMETRO222: 2
FEI322: 2
CTI322: 2
USP/RIB. PRETO11C: 1
UPF12: 1
UNINOVE12: 1
UNIJUI112: 1
UNESP/IBILCE12: 1
UNESP/BAURU12: 1
UNESP212: 1
UFSJ12: 1
UFPI12: 1
UFPEL12: 1
UFFS12: 1
UFBA112: 1
SEA12: 1
MACKENZIE112: 1
ITV /BELÉM I12: 1
IME312: 1
IFES112: 1
FURG112: 1
FUMEC112: 1
FIOCRUZ/ICC12: 1
EPP12: 1
EACH/USP112: 1
CEFET/RJ12: 1
CEFET/MG12: 1
BACEN12: 1

 

Best Paper

CURITIBA (sem chuva hoje, por enquanto) Recebi um email do meu amigo Paulo hoje pela manhã com a notícia que nosso artigo “An Adaptive Multi-level Framework for Forest Species Recognition” foi premiado com o Best Paper Award na IV Brazilian Conference on Intelligent Systems (BRACIS 2015) que está acontecendo essa semana em Natal.

Best Paper

Infelizmente não consegui estar em Natal essa semana. Depois de tantas viagens esse ano, se eu fosse pra lá estaria correndo risco de vida aqui em casa…. Agradecimentos especiais ao Paulo, da IBM Research, por ter feito grande parte deste trabalho!

E como dizia Dorothy Parker, “I hate writing, I love having written”.

Sem Perspectivas de Mudanças

CURITIBA (ainda não choveu hoje) Reproduzo abaixo o texto publicado na folha de São Paulo do Prof. Rogério Cezar de Cerqueira Leite. Os negritos são por minha conta. Um bom retrato da nossa situação atual no que diz respeito a pesquisa no Brasil. Temos um monte de coisa pra mudar nas nossas universidades e institutos de pesquisa, mas cá entre nós, nada vai mudar.

Dois artigos publicados recentemente pela revista britânica “Nature”, especializada em ciência, deixam o Brasil e, em especial, a comunidade acadêmica brasileira, profundamente envergonhados.

A “Nature” nos acusa, em primeiro lugar, de produzir mais lixo do que conhecimento em ciência. Nas revistas mais severas quanto à qualidade de ciência, selecionadas como de excelência pelo periódico, cientistas brasileiros preenchem apenas 1% das publicações.

Quando se incluem revistas menos qualificadas, porém, ainda incluídas dentre as indexadas, o Brasil se responsabiliza por 2,5%. O que a “Nature” generosamente omite são as publicações em revistas não indexadas, que contêm número significativo de publicações brasileiras, um verdadeiro lixo acadêmico.

O segundo golpe humilhante para a ciência brasileira exposto pela revista se refere à eficiência no uso de recursos aplicados à pesquisa. Dentre 53 países analisados, o Brasil está em 50º lugar. Melhor apenas que Egito, Turquia e Malásia.

Tomemos um exemplo. O Brasil publicou 670 artigos em revistas de grande prestígio, enquanto no mesmo período o Chile publicou 717, nessas mesmas revistas. O dado profundamente inquietante é que enquanto o Brasil despendeu em ciência US$ 30 bilhões, o Chile gastou apenas US$ 2 bilhões.

Quer dizer, o Chile, que aliás não está entre os primeiros em eficiência no mundo científico, é 15 vezes mais eficiente que o Brasil. Alguma coisa está errada, profundamente errada. A academia brasileira, isto é, universidades e institutos de pesquisas produzem mais pesquisa de baixa do que de boa qualidade e as produz a custos muito elevados. Há certamente causas, talvez muitas, para essa inadequação.

A primeira decorre de um “distributivismo” demagógico. É evidente que seria desejável que novos centros de pesquisas se desenvolvessem em regiões ainda não desenvolvidas do país. Mas é um erro crasso esperar que uma atividade de pesquisas qualquer venha a desenvolver economicamente uma região sem cultura adequada para conviver com essa pesquisa.

Seria desejável que investimentos maciços fossem aplicados em pesquisas em instituições localizadas em regiões pouco desenvolvidas, mas cujo meio ambiente é capaz de absorver os benefícios dessa inserção.

O segundo mal que é causa inquestionável da diminuta e dispendiosa produção de conhecimento é o obsoleto regime de trabalho que regula a mão de obra do setor de pesquisas em universidades públicas e na maioria dos institutos.

O pesquisador faz um concurso –frequentemente falsificado– no começo de sua carreira. Torna-se vitalício. Quase sempre não precisa trabalhar para ter aumento de salário e galgar postos em sua carreira. Ora, qual seria, então, a motivação para fazer pesquisas?

O terceiro problema é o sistema de gestão de universidades públicas e instituições de pesquisa, cuja burocracia soterra qualquer iniciativa dos poucos bem-intencionados professores e pesquisadores que ainda não esmoreceram.

Pois bem. Há uma fórmula que evita todos esses males e que já foi experimentada com sucesso em algumas das instituições científicas do Brasil: a organização social. A resistência dos medíocres e parasitas e a falta de coragem política de algumas de nossas autoridades impedem a solução desse problema.

Planejamento Nota 10

CURITIBA (no windows) A Universidade ficou parada quase dois meses em função da copa do mundo e férias de julho. Nesse meio tempo o pessoal resolveu fazer uma reforma nos blocos onde ficam as nossas salas de aula. Coisa simples, apenas trocar as janelas por algumas que abrem e fecham e não deixam o vento passar. Dizem que do lado da rua teremos vidros duplos para um melhor isolamento acústico!

Mas esqueceram que estamos em uma universidade federal, onde o tempo de obra previsto deve ser multiplicado por um fator F, que pode variar de 2 a 10. Ontem esse era o estado da minha sala de aula. Dizem que vou poder usar na quinta…. Agora não é só pra pedalar que eu vou ter que ver a previsão do tempo!

Sala de Aula

Dr.Yandre

CURITIBA (+1) Algum tempo atrás, em 2009 pra ser mais preciso, comecei a trabalhar juntamente com alguns colegas da PUCPR e do INESC-Porto (Portugal) com um assunto um pouco diferente do que vinha trabalhando nos últimos anos,  a classificação automática de gêneros musicais.

Um dos responsáveis por explorar essa nova linha de pesquisa foi meu aluno de doutorado, Yandre M. G. Costa. E depois de 4 anos de muito trabalho, hoje Yandre cumpriu a última etapa do processo, defendendo com sucesso sua tese de doutorado. Assim que eu receber a versão corrigida coloco na minha página. Mas boa parte do trabalho está publicado nesse artigo da Signal Processing, um periódico bem conceituado na área da Computação (Qualis A1 para os aficionados).

Yandre

E foram muitas perguntas….

Parabéns Yandre!

Dr. Pedro

CURITIBA (+1) Nosso trabalho sobre o reconhecimento automático de espécies florestais está começando a dar os primeiros resultados. Algumas publicações e bases de dados já estão disponíveis na página do laboratório. Mas nada como uma defesa de doutorado para encerrar bem o ano. Hoje meu orientado, agora Dr. Pedro, defendeu o trabalho “Reconhecimento de Espécies Florestais através de Imagens Macroscópicas” o qual foi aprovado e bastante elogiado pela banca examinadora.

Um poco tenso durante as perguntas...

Um poco tenso durante as perguntas…

Mais um pouco e mais alguns artigos e a versão final da tese também estarão disponíveis. Parabéns Pedro!

100 Anos da UFPR com Poucas Perspectivas

Reforma UFPR

Foto: http://www.circulandoporcuritiba.com.br/

CURITIBA (quase lá) Semana passada recebi um convite para participar das comemorações do centenário da UFPR. Tem uma lista grande de festividades. Reformaram até o prédio da Santos Andrade. Agora parece um hospital. Daqui a pouco o pessoal da medicina já deve estar requisitando o prédio. Pra quem não sabe, espaço físico vale ouro dentro de universidade federal.

Mas vamos as velinhas. Reza a lenda que a universidade foi fundada em 1912, o que faz da UFPR a universidade mais antiga do país. Há controvérsias, entretanto.

Com o status de mais antiga do país, não seria razoável que fossemos uma referência na pós-graduação brasileira? Mas não somos. Os programas de pós-graduação são avaliados pela CAPES com notas de 2 a 7. Quando um programa é criado, ele recebe nota 3. Se receber uma avaliação 2, o programa é automaticamente descredenciado, ou seja, passa a não ser reconhecido pelo governo. Programas com notas 6 e 7 são tidos como programas de excelência e de nível internacional.

Pois bem, a UFPR tem mais de 50 programas de pós-graduação. Vários deles com mestrado e doutorado.  Entretanto, temos apenas UM programa nota 6. Nenhum nota 7. A grande maioria se concentra nos conceitos 4 e 5.  O fato é que somos a universidade mais a antiga do país, mas temos uma pós-graduação apenas mediana. Acredito que esse seja um bom momento de repensar a pós-graduação na UFPR, passando por uma reforma profunda na pró-reitoria de pesquisa e pós-graduação, a qual é extremamente ineficiente no gerenciamento dos recursos destinados a pesquisa.

Outra coisa que eu acho que deveria entrar em discussão é a criação e a manutenção de programas. Vale a pena criar programas mesmo quando não se tem espaço físico para laboratórios e nem técnicos administrativos para atuar nas secretárias? Vale a pena manter um programa em funcionamento mesmo quando esse programa tem sucessivas avaliações nota 3? Não seria o caso de consolidar programas para que enfim sejamos referências em algumas áreas?

Mas pelo que ouvi pelos corredores, não teremos grandes mudanças, a não ser a cor do prédio da Santos Andrade.