Palestra de Abertura - A Interdisciplinaridade das Mudanças Climáticas e o Uso da Estatística em seus Estudos
1Tércio Ambrizzi
1 Instituto de Astronomia, Geofísica e Ciências Atmosféricas da Universidade de São Paulo – IAG/USP
1Concluiu o doutorado em Meteorologia pela Universidade de Reading em 1993. Membro da Comissão de Pesquisa do IAG e do Conselho de Departamento. Tem coordenado projetos nacionais e internacionais de pesquisa. Atua na área de Ciências Atmosféricas, com ênfase em Meteorologia Dinâmica, Modelagem Numérica da Atmosfera e Climatologia. Coordenador do Grupo de Estudos do Clima - GrEC no IAG/USP. Autor principal de um dos relatórios de mudanças climáticas regionais encomendado pelo Ministério do Meio Ambiente em uma parceria entre USP e CPTEC/INPE e revisor do Relatório de Impactos do IPCC em 2007 e 2013. Indicado para coordenar o Grupo de Trabalho 1 - Base Científica das Mudanças Climáticas do Painel Brasileiro de Mudanças Climáticas pelo Governo Federal (Portaria interministerial dos Ministérios da Ciência e Tecnologia e do Meio Ambiente) compondo o Comitê Científico. É coordenador do INCLINE (INter-disciplinary CLimate INvestigation cEnter) Núcleo de Apoio a Pesquisa em Mudanças Climáticas da USP. Membro Titular da Academia Brasileira de Ciências (ABC).
RESUMO
As emissões dos gases de efeito estufa (GEE) têm aumentado sistematicamente desde a era pré-industrial, possivelmente associado ao crescimento populacional e econômico. As concentrações atmosféricas do dióxido de carbono, por exemplo, atingiram um patamar nunca observado nos últimos 800.000 anos. Seus efeitos, conjuntamente com outras fontes antropogênicas, têm sido detectados no sistema climático global e, provavelmente, são a causa principal do aquecimento atmosférico observado desde a metade do século 20. Desde 1950, diversas mudanças têm sido observadas em extremos de tempo e clima em termos globais. Algumas destas mudanças têm sido associadas diretamente com a influência humana, sendo que as mais evidentes são: decréscimo em extremos de baixas temperaturas, aumento em extremos de altas temperaturas, aumento no nível dos mares e, em algumas regiões, um aumento no número de dias com fortes precipitações. No entanto, como o último relatório do IPCC (Painel Intergovernamental sobre Mudanças Climáticas – em inglês, IPCC) descreve para vários dos extremos climáticos observados, ainda há um alto grau de incerteza associado devido a vários fatores como falta de dados ou séries muito curtas, influências regionais ou a ação direta do Homem mudando seu meio ambiente. Esta palestra irá descrever como o clima tem variado em um contexto global e regional e quais tem sido seus impactos mais relevantes para a sociedade, focando em dados do passado, presente e projeções futuras de mudança do clima. Será mostrado também como a estatística é amplamente utilizada para avaliar estes impactos em diversas áreas importantes como saúde, biologia e ecossistemas de forma geral.
Palestra 1 - Evolução Molecular de Vírus Zika
1Prof. Me. Caio César de Melo Freire
1Departamento de Genética e Evolução, Universidade Federal de São Carlos – UFSCar-SP1
1Atualmente é professor adjunto do Departamento de Genética e Evolução da Universidade Federal de São Carlos – UFSCar-SP, tem ministrado seminários sobre a evolução molecular do Vírus Zika: de Silvestre a Pandêmico, dentre outras pesquisas)
RESUMO
O vírus Zika (ZIKV) foi isolado pela primeira vez em Uganda na floresta de Zika em 1947 (Dick et al. 1952). Durante os 60 anos seguintes, ele foi associado a raras infecções humanas na África e no sudeste asiático (Hayes 2009). Até então, acreditava-se que este vírus infectava majoritariamente primatas não humanos, sendo os últimos hospedeiros incidentais, incapazes de sustentar uma cadeia de transmissão humano-mosquito-humano. Esta crença permaneceu até 2007, quando ocorreu a primeira epidemia de febre Zika (ZF) na ilha Yap na Micronésia, onde estima-se que o vírus infectou 73% da população da ilha (Duffy et al. 2009). O vírus só voltaria a preocupar as autoridades de saúde em 2013 quando ocorreu outra grande epidemia na Polinésia Francesa, onde estima-se que o vírus infectou 85% da população do arquipélago (Kucharski et al. 2016). Preocupantemente, foi observado durante o surto na Polinésia um aumento de 20 vezes nos casos de síndrome de Guillain-Barre (GBS) (Musso et al. 2014). Em 2015, o vírus chega ao Brasil onde foi também associado a um aumento na incidência de GBS (SESAB 2015), assim como com a expansão do número de casos de malformações fetais (Mlakar et al. 2016). Atualmente, buscamos entender as mutações que este vírus sofreu e de alguma forma foram selecionadas e mantidas nas linhagens epidêmicas do vírus.
Referências
Dick GWA, Kitchen SF, Haddow AJ. Zika virus. I. Isolations and serological specificity. Trans R Soc Trop Med Hyg. 1952 Sep;46(5):509–20.
Duffy MR, Chen T-H, Hancock WT, Powers AM, Kool JL, Lanciotti RS, et al. Zika virus outbreak on Yap Island, Federated States of Micronesia. N Engl J Med. 2009 Jun 11;360(24):2536–43.
Hayes EB. Zika virus outside Africa. Emerg Infect Dis. 2009 Sep;15(9):1347–50.
Kucharski AJ, Funk S, Eggo RM, Mallet H, Edmunds WJ, Nilles EJ. Transmission dynamics of Zika virus in island populations : a modelling analysis of the 2013 – 14 French Polynesia outbreak. 2016; 1–15.
Mlakar J, Korva M, Tul N, Popovic M, Poljšak-Prijatelj M, Mraz J, et al. Zika Virus Associated with Microcephaly. N Engl J Med. 2016;160210140106006.
Musso D, Nilles EJ, Cao-Lormeau V-M. Rapid spreading of emerging Zika virus in the Pacific area. Clin Microbiol Infect. 2014 Jun 7;1–5.
SESAB. Situação epidemiológica da dengue, chikungunya e dei/zika. bahia, 2015. [Internet]. Salvador; 2015. p. 1–3. Available from: http://www.suvisa.ba.gov.br/sites/default/files/Boletim epidemiológico no 03 dengue_chikungunya_zika_0.pdf
Palestra 2 - Extended Poisson-Tweedie: Properties and regression models for count
1Prof. Dra. Clarice Garcia Borges Demétrio
1Escola Superior de Agricultura Luiz de Queiroz – USP
1Graduação em Engenharia Agronômica pela Universidade de São Paulo (1975), mestrado em Agronomia (Estatística e Experimentação Agronômica) pela Universidade de São Paulo (1978), doutorado em Agronomia (Estatística e Experimentação Agronômica) pela Universidade de São Paulo (1985) e pós-doutorado no Imperial College, Londres (1986-1987). Atualmente é professora titular da Universidade de São Paulo. Tem experiência na área de Probabilidade e Estatística, com ênfase em Probabilidade e Estatística Aplicadas, atuando principalmente nos seguintes temas: modelos lineares generalizados, overdispersion, mixed generalized linear models
RESUMO
We propose a new class of discrete generalized linear models based on the class of Poisson-Tweedie factorial dispersion models with variance of the form $\mu + \phi\mu^p$, where $\mu$ is the mean, $\phi$ and $p$ are the dispersion and Tweedie power parameters, respectively (Bonat et al, 2016, submmitted). The models are fitted by using an estimating function approach obtained by combining the quasi-score and Pearson estimating functions for estimation of the regression and dispersion parameters, respectively. This provides a flexible and efficient regression methodology for a comprehensive family of count models including Hermite, Neyman Type A, P\'olya-Aeppli, negative binomial and Poisson-inverse Gaussian. The estimating function approach allows us to extend the Poisson-Tweedie distributions to deal with underdispersed count data by allowing negative values for the dispersion parameter $\phi$. Furthermore, the Poisson-Tweedie family can automatically adapt to highly skewed count data with excessive zeros, without the need to introduce zero-inflated or hurdle components, by the simple estimation of the power parameter. Thus, the proposed models offer a unified framework to deal with under, equi, overdispersed, zero-inflated and heavy-tailed count data. The computational implementation of the proposed models is fast, relying only on a simple Newton scoring algorithm. Simulation studies showed that the estimating function approach provides unbiased and consistent estimators for both regression and dispersion parameters. We highlight the ability of the Poisson-Tweedie distributions to deal with count data through a consideration of dispersion, zero-inflated and heavy tail indexes, and illustrate its application with four data analyses.
Palestra 3 - Panorama das doenças infecto-contagiosas no Brasil
1Prof. Dr. Eduardo Massad
1USP/SP - Instituto Oscar Freire - Medicina Legal
1Professor Titular de Informática Médica da Faculdade de Medicina, Universidade de São Paulo – Instituto Oscar Freire, Medicina Legal. Pós-Doutorado pela University of London, UL, Inglaterra. Pós-Doutorado pela International Center For Theoretical Physics, ICTP, Inglaterra. Pós-Doutorado pela The University Of Sussex, US, Inglaterra. Doutorado em Patologia Experimental. Faculdade de Medicina Veterinária da Universidade de São Paulo, MVUSP, Brasil. pesquisador IA do CNPq desde 1992. Professor Honorário do Departamento de Doenças Infecciosas e Tropicais, London School of Higiene e Medicina Tropical desde 2003
Palestra 4 - Redução de Dimensionalidade e Aprendizagem de Estruturas – Aplicações em Genômica
1Prof. Dra. Julia Maria Pavan Soler
1Departamento de Estatística do Instituto de Matemática e Estatística da Universidade de São Paulo – IME/USP
1Professora do Departamento de Estatística do Instituto de Matemática e Estatística da Universidade de São Paulo – IME/USP, sua área de pesquisa é Probabilidade e Estatística Aplicadas, com ênfase em Genética e Genômica. Seus interesses de pesquisa estão dirigidos, principalmente, para os temas: mapeamento genético de doenças complexas, análise de ligação genética via delineamentos com populações naturais e experimentais, estudos de associação Genética e experimentos de expressão gênica.
RESUMO
Com a explosão dos problemas “Big Data” na análise de dados de diferentes áreas, a Estatística tem se deparado com o desafio de aplicar, adaptar e desenvolver novos métodos de redução de dimensionalidade e de aprendizagem de estruturas. A principal dificuldade é o tratamento de espaços restritos a n<<p (no caso da Genômica, centenas de milhares de variáveis genéticas observadas em um número reduzido de unidades amostrais) e estruturados (envolvendo dependências longitudinais, espaciais, entre múltiplas variáveis e entre indivíduos relacionados). Neste Encontro, conversaremos sobre algumas soluções a problemas deste tipo no mapeamento de genes e no aprendizado de estruturas causais entre genótipos e fenótipos em estudos observacionais.
Palestra 5 - Desafios estatísticos na área de regulação de medicamentos
1Prof. Me. Gustavo Mendes Lima Santos1
1Coordenação de Equivalência Terapêutica / Agência Nacional de Vigilância Sanitária
1Coordenador da Coordenação de Equivalência Terapêutica da Anvisa. É graduado em Farmácia pela Universidade de São Paulo (USP), especialista em Saúde Pública pela Fundação Oswaldo Cruz (FIOCRUZ) e mestre em Toxicologia pela Universidade de Londrina (UEL). Desde 2003 tem trabalhado na Anvisa com inspeções em centros de bioequivalência/equivalência farmacêutica, análise de estudos de equivalência terapêutica para fins de registro de medicamentos e elaboração e revisão de normas para regulamentar esses estudos no país
RESUMO
Diversos modelos estatísticos são utilizados para avaliação de desempenho in vitro e in vivo de medicamentos com o objetivo de aprovação de registro junto à Anvisa e às agências reguladoras de outros países. Apesar de existirem abordagens estatísticas consagradas, uma série de desafios persistem no âmbito regulatório. Especialmente no que diz respeito à comparabilidade de medicamentos genéricos/similares e alterações pós-registro, as agências reguladoras divergem tanto nos modelos estatísticos sugeridos quantos nos critérios de aceitação. A apresentação tem como objetivo mostrar alguns dos desafios a serem enfrentados na área de estatística para a demonstração de eficácia, segurança e qualidade de medicamentos.
Palestra 6 - Análise de imagens de raio-X na seleção de sementes: uma abordagem usando a transformada discreta de ondaletas
1Profª. Dra. Thelma Sáfadi
1Universidade Federal de Lavras – UFLA-MG
1Possui graduação (Licenciatura e Bacharelado) em Matemática pela Universidade Federal de Minas Gerais (1979), especialização em Matemática pela Universidade Federal de Minas Gerais, mestrado em Matemática pela Universidade Federal de Minas Gerais (1987) e doutorado em Estatística pela Universidade de São Paulo (1997). Possui pós-doutoramentos na Universidad Carlos III de Madrid (2003/2004), na Universidade de São Paulo (2010) e na Georgia Institute of Technology (2015). É professora titular da Universidade Federal de Lavras. Atualmente utilizando wavelets e componentes independentes tem desenvolvido pesquisa no estudo de análise de imagens de raio-x e do biospeckel dinâmico obtido da iluminação laser.
RESUMO
A análise de sementes é essencial para a determinação da qualidade do lote e, consequentemente, o seu valor de semeadura. A avaliação da qualidade das sementes com imagens radiográficas foi usada como alternativa aos métodos usuais de laboratório. Aqui, aplicamos a transformada de ondaletas para o processamento automático de imagens radiográficas de sementes de girassol. A partir das imagens transformadas vários índices espectrais são derivados, estes índices estão directamente relacionados com o grau de regularidade da imagem. Uma metodologia foi desenvolvida para analisar as imagens e classificar cada semente como danificada ou não. Considerando a classificação supervisionada binária e multinominal, obtivemos uma taxa de classificação correcta de 82% para as sementes danificadas e cheias, e 57% para sementes com danos graves, comdanos leves e sementes cheias, respectivamente.
Palestra 7 – A Estatística na Pesquisa Clínica
Prof. PhD. Enrico Antonio Colosimo1
1Universidade Federal de Minas Gerais – UFMG-MG
1Formado em Engenharia Elétrica pela Universidade Federal de Minas Gerais (1981). Mestrado em Estatística pela Universidade Estadual de Campinas (1985). Ph.D. em Estatística - University of Wisconsin - Madison (1991). Pós-doutorado no IME-USP (1996/1997) e Fundação Osvaldo Cruz, RJ (2008/2009). Professor Titular do Departamento de Estatística da Universidade Federal de Minas Gerais. Publicou mais de 100 artigos em periódicos de estatística, medicina, engenharia como Biometrics, Journal of Statistical Planning and Inference, Journal of Quality and Technology, IEEE, Cadernos de Saúde Pública, Reliability Engineering and System Safety, Jour. Statistical Computation and Simulation, entre outros. Autor dos livros, Confiabilidade: Análise de Tempo de Falha e Testes de Vida Acelerados (com Marta Afonso Freitas) pela Editora da FCO e Análise de Sobrevivência Aplicada (com Suely Ruiz Giolo) pelo Editora Blucher e Projeto Fisher da ABE. Convidado para palestras e bancas em várias universidades brasileiras e algumas no exterior. Editor associado do Brazilian Journal of Probability and Statistics e da Revista Colombiana de Estadistica. Vice-presidente da Regional Brasileira de Biometria no período de 2002 a 2008 e ex-membro do conselho da Associação Brasileira de Estatística. Organizou o Workshop de Análise de Sobrevivência e Confiabilidade (Belo Horizonte, 2000) e o Workshop em Estudos Longitudinais (Juiz de Fora, 2007). Foi chefe do departamento de Estatística da UFMG no período de 1999 a 2001 e coordenador do programa de pós-graduação em Estatística da UFMG no período de 2004 a 2008. Assumiu novamente a coordenação da pós-graduação em estatística no período de 2012 a 2014. Revisor Estatístico do Periódico HEART (fator impacto superior a 5) desde março de 2014. Trabalha em Estatística, com ênfase em análise de dados longitudinais, análise de sobrevivência e confiabilidade de sistemas reparáveis.
RESUMO
O desenvolvimento de metodologia estatística teve um crescimento expressivo nas últimas décadas. A pesquisa na área da saúde tem sido beneficiária dos métodos estatísticos como uma fonte de novos desafios. Áreas da estatística, como modelos lineares generalizados, análise de sobrevivência, dados longitudinais, meta-análise, entre outras, direcionam a forma como a pesquisa clínica tem sido conduzida atualmente. Por outro lado, métodos estatísticos relevantes e já bem estabelecidos na literatura, como bootstrap, tratamento de dados perdidos, modelos não-paramétricos, entre outros, tem tido uma participação pífia na análise de dados clínicos. O objetivo desta palestra é apresentar uma visão pessoal da estatística na área clínica ilustrando com a análise de uma casuística de pacientes com melanoma coletada no ambulatório de dermatologia da Faculdade de Medicina da UFMG.
Minicurso 1 - Big data e visualização de dados no R
Paulo Canas Rodrigues1,2
1Departamentode Estatística, Universidade Federal da Bahia, Brasil
2CAST – Center for Statistics and Data Analytics, University of Tampere, Finland
1,2Graduado em Matemática pela Universidade Nova de Lisboa (2003), mestrado em Estatística pela Universidade Técnica de Lisboa (2007) e Doutorado pela Universidade Nova de Lisboa (2012). Tem experiência na área de Estatística, com ênfase em redução de dimensionalidade e visualização, séries temporais e análise espetral singular, métodos robustos e big data, entre outros. É atualmente Managing Editor do Jornal Statistics, Optimization & Information Computing (desde 2013); Co-Editor do jornal Biometrical Letter (desde 2013). É o Chair do ISI Young Statisticians Committeee, Council Member do ISI e Council Member do ISBIS. Líder do grupo de pesquisa do CNPq “Bioestatística e Big Data”, credenciado pela UFBA. Atualmente é o Research Director do CAST–Center for Applied Statistics and Data Analytics, University of Tampere, Finland)
Com o aumento da quantidade de dados coletados diariamente, em muitas áreas do conhecimento, o desenvolvimento de novas estratégias estatísticas para analisar esses dados num intervalo de tempo aceitável torna-se essencial. Estratégias como redução de dimensionalidade e visualização são fundamentais quando se lida com big data e dados não-estruturados.
Este minicurso será dividido em trêsblocos de duas horas cada. Nas primeiras duas horas irei fazer uma introdução geral sobreBig Data, redução de dimensionalidade, visualização e genética quantitativa. No segundo bloco de duas horas irei apresentar, em laboratório, várias técnicas de visualização de dados, básicas e avançadas, incluindo visualização de grandes conjuntos de dados, mapas, gráficos em 3D e séries temporais interativas. No terceiro bloco de duas horas, em laboratório, será terminada a exposição sobre visualização de dados iniciada no segundo bloco e apresentarei algumas técnicas de análise e visualização de dados com foco especial em genética de plantas.
Minicurso 2: Produção de relatórios dinâmicos com o uso dos pacotes Knitr e Rmarkdown
1Possui graduação em Estatística pela Universidade Federal do Paraná(UFPR), é aluno de mestrado do curso de Pós-graduação de Bioestatística pela Universidade Estadual de Maringá(UEM), sendo orientado pela Prof. Dra. Isolde Previdelli)
2Pós-doutorando pelo Programa de Pós-Graduação em Bioestatística da Universidade Estadual de Maringá, onde concluiu graduação em Agronomia (1998), bacharelado em Física (2008), mestrado em Agronomia (2001), mestrado em Física (2011) e doutorado em Agronomia (2006). Na Faculdade Integrada da Grande Fortaleza concluiu licenciatura em Física (2013).
Um dos grandes desafios para os pesquisadores é fazer com que a tarefa de atualização de seus relatórios se torne cada vez mais rápida e automática, com o menor esforço humano possível. Outra motivação é o princípio de gerar pesquisas científicas reprodutíveis seguindo o pressuposto da disponibilidade dos códigos fontes e dados utilizados. Diante desses aspectos, a utilização de ferramentas que automatizem uma análise de dados é muito atraente. A proposta deste minicurso é apresentar uma introdução de dois recursos que integram as linguagens de marcação do “Latex”e “Markdown”com a linguagem de análise estatística “R” e assim possibilitar a produção de relatórios mais ágil. O analista adquirindo a habilidade e facilidade de documentar seus resultados com essas ferramentas, não apenas alcança seu objetivo, mas também contribui para divulgação dessas funcionalidades e do conhecimento científico.
Minicurso 3: Meu primeiro pacote no R
1Mariana Ragassi Urbano, 2Rodrigo Rossetto
1Possui graduação em Estatística pela Universidade Estadual Paulista Júlio de Mesquita Filho (2006), mestrado em Agronomia (Estatística e Experimentação Agronômica) pela Universidade de São Paulo (2008) e doutorado em Agronomia (Estatística e Experimentação Agronômica) pela Universidade de São Paulo (2012). Atualmente é professora da Universidade Estadual de Londrina. Tem experiência na área de Probabilidade e Estatística, Modelos Lineares Generalizados, Bioestatística e Epidemiologia.
O R é um software estatístico, livre e de código aberto, e muitas de suas funções estão disponibilizadas nos pacotes (packages), que são desenvolvidos por alunos e/ou pesquisadores e disponibilizados no site http://cran.r-project.org/. Esse minicurso tem como objetivo ensinar a construir um pacote no R, para que os alunos e/ou pesquisadores possam ter suas próprias funções implementadas no software estatístico R. Há várias formas de se construir um pacote no R, e para esse curso especificamente, não é necessário nenhum conhecimento avançado de programação em outras linguagens, tudo será realizado diretamente no R e no RStudio. Após desenvolver o pacote, este poderá ser disponibilizado no site http://cran.r-project.org/ para uso geral.