Relatório de produção acadêmica da Universidade Federal de São Carlos (UFSCar)
Departamento de Estatística (Des)

Centro de Ciências Exatas e de Tecnologia (CCET)
Campus São Carlos

Plataforma Lattes / outubro de 2020

Rafael Izbicki

Bacharel e Mestre em Estatística pela Universidade de São Paulo, Rafael é PhD em Estatística pela Carnegie Mellon University (2014). Atualmente é Professor Adjunto da UFSCar- Universidade Federal de São Carlos. Tem experiência na área de Probabilidade e Estatística, com ênfase em Machine Learning (aprendizado de máquina), Bioestatística, Astroestatística, Fundamentos da Estatística, Inferência Bayesiana, Inferência Não Paramétrica e Inferência em Dados com Alta Dimensionalidade. Mais informações: http://www.rizbicki.ufscar.br (Texto informado pelo autor)


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (7)
    1. 2020-Atual. Modelagem estatistica por meio de ondaletas
      Descrição: Um dos principais objetivos na Estatística é a modelagem satisfatória de dados nos mais diversos contextos, nas mais diversas áreas. Com os avanços computacionais nos últimos anos, o uso de abordagens não paramétricas tem ganhado cada vez mais atenção de pesquisadores, muito em decorrência da capacidade dessas abordagens na proposição e/ou na validação de outras abordagens já existentes. Além disso, vale destacar, modelos não paramétricos têm como característica a flexibilidade, bem como melhor capacidade de se adequar a singularidades inerentes aos conjuntos de dados de interesse. Uma ferramenta não paramétrica que vem ganhando cada vez mais destaque são as bases de ondaletas. O principal motivo dessas funções estarem ganhando força dentro do campo da Estatística não paramétrica diz respeito a sua capacidade de auxílio na estimação de funções de forma mais satisfatória que outras metodologias, como é o caso de séries de Fourier. Devido ao modo como essas bases são construídas, ondaletas conseguem captar de forma bastante efetiva irregularidades inerentes nas funções de interesse, através de uma representação esparsa dessas bases. Neste projeto, temos como objetivo a modelagem de dados sob o enfoque de bases de ondaletas. Como objetivo principal, vamos focar aqui na proposta de novas metodologias para estimar funções discriminantes para dados de alta dimensão, como é o caso de dados funcionais, e estimação de funções densidade de probabilidade de dados viesados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Rafael Izbicki - Integrante / Michel Helcias Montoril - Coordenador / Aluísio de Souza Pinheiro - Integrante.
      Membro: Rafael Izbicki.
    2. 2020-Atual. Uncertainty estimation of crypto currency price
      Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) . Integrantes: Rafael Izbicki - Coordenador / STERN, RAFAEL B. - Integrante. Financiador(es): Fundação Getúlio Vargas - Bolsa.
      Membro: Rafael Izbicki.
    3. 2019-Atual. Redes neurais em problemas de inferencia estatistica
      Descrição: Na última década, os avanços computacionais fizeram com que redes neurais ressurgiram como uma ferramenta poderosa para a realização de tarefas de aprendizado supervisionado, como classificação e regressão. Contudo, essa ferramenta foi subutilizada como forma de realizar inferência estatística. Por exemplo, soluções dadas por redes neurais são tipicamente um caixa preta e, portanto, difíceis de interpretar. Neste trabalho, exploraremos o poder das redes neurais para resolver três desafios em inferência estatística: (i) ajustar estimadores de regressão lineares locais não paramétricos para grandes conjuntos de dados (ii) medir incertezas nas previsões dadas por métodos supervisionados através da estimativa de densidades condicionais para dados de alta dimensão, e (iii) criar testes de independência condicional.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (3) / Doutorado: (2) . Integrantes: Rafael Izbicki - Coordenador / STERN, RAFAEL BASSI - Integrante.
      Membro: Rafael Izbicki.
      Descrição: Na última década, os avanços computacionais fizeram com que redes neurais ressurgiressem como uma ferramenta poderosa para a realização de tarefas de aprendizado supervisionado, como classificação e regressão. Contudo, essa ferramenta foi subutilizada como forma de realizar inferência estatística. Por exemplo, soluções dadas por redes neurais são tipicamente um caixa preta e, portanto, difíceis de interpretar. Neste trabalho, exploraremos o poder das redes neurais para resolver três desafios em inferência estatística: (i) ajustar estimadores de regressão lineares locais não paramétricos para grandes conjuntos de dados (ii) medir incertezas nas previsões dadas por métodos supervisionados através da estimativa de densidades condicionais para dados de alta dimensão, e (iii) criar testes de independência condicional.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Rafael Bassi Stern - Integrante / Rafael Izbicki - Coordenador. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa.
      Membro: Rafael Bassi Stern.
    4. 2019-Atual. Parametric and nonparametric methods applied to high-dimensional data to detect genetic variants interactions associated with Amyotrophic Lateral Sclerosis
      Descrição: Amyotrophic Lateral Sclerosis (ALS) is a degenerative neuropathy that affects motor neurons, resulting in progressive loss of muscle strength and consequent paralysis. The current proposal will explore statistical approaches to dimensionality reduction and analysis of large-scale data aiming to detect genetic variants interactions associated with ALS. Genome-wide Association Studies (GWAS) have been used in the context of statistical genetics to identify new variants with additive (marginal) effects on disease occurrence. In recent years, over 20 genes have been described as associated with ALS. However, even today, there is no reliable molecular biomarkers that enable the screening or early diagnosis of ALS. Regarding pharmacological treatment, the available options contributes to increase short-term survival and to reduced paralysis rate but are not effective in stopping or reversing disease progression. Interactions between genetic variants have the potential to qualify the genetic understanding of complex diseases, such as ALS. These interactions are especially important when the marginal effect of a given variant is not sufficient, and even not necessary, for the disease occurrence, but its interaction with one or more variants may be associated with the disease. Given this setting, using Mega-GWAS ALS I and Whole Exome and Transcriptome Sequencing in Sporadic ALS datasets, we will be working on implementing both parametric and nonparametric methods, such as penalized logistic regression and based-tree algorithms, to detect potential genetic variants interactions associated with ALS. Since changes are frequently applied in order to improve techniques for constructing and evaluating these models and little is known about the advantages for preferring one method over another, we will compare these methods considering its computational complexity, scalability, accuracy and interpretability.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Rafael Izbicki - Integrante / SANTOS, HELLEN GEREMIAS DOS - Coordenador / Fabio Passetti - Integrante / Ticiana Della Justina Farias - Integrante / Patrícia Shigunov - Integrante / Bruno Dallagiovanna Muñiz - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Rafael Izbicki.
    5. 2017-2019. Interpretability and efficiency in hypothesis tests
      Descrição: Hypothesis testing is a very common and widespread statistical tool. Unfortunately, such methodology still presents several challenges to statisticians. This project aims at developing hypothesis tests by filling several existing gaps. More precisely, the follows issues will be addressed: (1) Agnostic Tests. There is a disagreement about the interpretation of results from a hypothesis test: while some understand that a hypothesis test is able to either reject or accept the null hypothesis $H_0$, others believe its outcomes should be interpreted as either reject or not reject $H_0$. This often lead practitioners to have difficulties in understanding the conclusions from significance tests. In particular, the second (and most common) perspective is deeply linked to the development of non-inferiority tests used in clinical trials. Here, we propose an alternative formulation to hypothesis tests in which, besides the decisions ``accept $H_0$'' and ``reject $H_0$'', there is a third decision, namely the ``no conclusion'' decision, which we call the agnostic decision. (2) Bayesian Nonparametric Tests. Because of the large volume of data available today in several applications, nonparametric methods have been gaining a lot of attention as they allow one to make less assumption about the data generating process. Unfortunately, there is almost no literature on Bayesian nonparametric tests, even though the Bayesian paradigm is widespread today. Here, we investigate new tests that try to overcome such gap. In particular, we investigate Bayesian nonparametric two-sample tests. (3) FBST in High Dimensions. Another challenge that exits in several applications is the issue of high dimensionality: in many problems, the number of covariates is very large; many times larger than the sample size. This makes sevaral standard methods fail. In particular, it has been observed that the Full Bayesian Significance Test has difficulties dealing with such situation. We will propose improvements in such method so that it is able to overcome the issue of high dimensionality, and we will investigate their theoretical properties. As a part of this project, we will also develop R packages that implement the methods developed here.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (3) / Doutorado: (1) . Integrantes: Rafael Izbicki - Coordenador / STERN, RAFAEL BASSI - Integrante / Luis Ernesto Bueno Salasar - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Rafael Izbicki.
    6. 2017-Atual. Infeccao vertical pelo virus Zika e suas repercussoes na area materno-infantil
      Descrição: A transmissão materno-fetal de vírus é conhecida pelas graves consequências que podem acarretar para o feto durante a gravidez. Embora exista um nexo entre o Zika vírus (ZIKV) e microcefalia, o espectro de outras associações da gravidez e defeitos congênitos precisa ser esclarecido durante os primeiros meses ou anos de vida das crianças expostas. Alertas mundiais têm sido emitidos neste sentido. Determinar a incidência da infecção causada pelos ZIKV em gestantes e recém-nascidos nascidas na coorte, bem como analisar, descrever o espectro da apresentação clínica das gestantes ZIKV(+) e identificar, descrever e quantificar o espectro das anomalias e/ou resultados, incluindo microcefalia, em fetos e recém-nascidos das gestantes participantes da coorte. Métodos: estudo de coorte prospectivo, caso-controle aninhado, a ser conduzido no Hospital Universitário da Faculdade de Medicina de Jundiaí (HUJ), no período de 2016 a 2021. Amostragem estipulada de 500 gestantes e seus recém-nascidos (RN), subdivididos em com ou sem microcefalia. As mães serão divididas em três grupos: Grupo I (gestantes de alto risco, sem sintomas); Grupo II (gestantes de baixo risco, com exantema e/ou febre) e Grupo III (abortos). No seguimento ambulatorial de três anos será avaliado o desenvolvimento neuropsicomotor e a ocorrência de perdas auditivas, visuais e acometimento neurológico das crianças. Busca ativa de casos será conduzida semanalmente por telefone para determinação da exposição ao ZIKV das gestantes. As amostras (sangue, urina, saliva e líquor) serão examinadas por testes sorológicos: ELISA, Microrray, RT-PCR e os tecidos por análise anatomopatológica. As amostras determinantes positivas (PBMCs e biópsias) serão avaliadas por RNA-Seq. A análise estatística das variáveis preditoras visará o cálculo do risco, risco relativo, modelos de regressão logística univariada e múltipla, quando adequados. Os dados permitirão correlacionar a incidência de infecção Zika e seu potencial como um agente causador de problemas de saúde físico e mental de gestantes, recém-nascidos e crianças. O projeto é inovador e ajudará os investigadores a compreender o impacto desta doença emergente sobre a população especialmente em crianças.Palavras chaves: Zika virus , Transmissão Vertical de Doença Infecciosa , Transmissão Perinatal, microcefalia, Anormalidades Congênitas, estudos coorte, grupo de risco, Georreferenciamento.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Rafael Izbicki - Integrante / Saulo Duarte Passos - Coordenador / Antonio Fernandes Moron - Integrante / Adriana Cruanes Mingotti - Integrante / Ana Paula Antunes Pascalicchio Bertozzi - Integrante / Andre Prado Grion - Integrante / Andréa Cristina Botelho Silva - Integrante / Clóvis Antonio Lopes Pinto - Integrante / Dora Selma Fix Ventura - Integrante / Eduardo José Caldeira - Integrante / Eduardo Massad - Integrante / Felipe Favorette Campanharo - Integrante / Fernanda Alves Cangerana Pereira - Integrante / Fernanda Guerra Velasco - Integrante / Francisco del Moral Hernandez - Integrante / Geovane Ribeiro Santos - Integrante / Gilberto Lazaroni Theodoro da Cunha - Integrante / Hyun Mo Yang - Integrante / Hérbene José Figuinha Milani - Integrante / Laura Cunha Rodrigues - Integrante / Leslie Domenici Kulikowski - Integrante / Magda Maria Sales Carneiro-Sampaio - Integrante / Marcia Borges Machado - Integrante / Margareth Martha Arilha Silva - Integrante / Maria Manoela Duarte Rodrigues - Integrante / MAURICIO MENDES BARBOSA - Integrante / Mayana Zatz - Integrante / Milene Tavares Batista - Integrante / Paolo Marinho de Andrade Zanotto - Integrante / Patricia Cristina Baleeiro Beltrão Braga - Integrante / Patricia Palmeira Daenekas Jorge - Integrante / Ronei Luciano Mamoni - Integrante / Rosa Estela Gazeta - Integrante / Sandra Helena Alves Bonon - Integrante / stéphanno Gomes Pereira Sarmento - Integrante / Thamirys Cosmo Grillo Fajardo - Integrante.
      Membro: Rafael Izbicki.
    7. 2015-2016. Uma abordagem flexivel para a estimacao de uma densidade condicional em problemas com alta dimensionalidade
      Descrição: Diversas áreas do conhecimento humano, como a astronomia e a economia, necessitam cada vez mais de estimadores não-paramétricos para uma densidade condicional em altas dimensões. Um exemplo de extrema importância é a estimação da distância de galáxias até a Terra com base em dados fotométricos, um problema no qual o uso da densidade condicional possibilita a estimação de parâmetros cosmológicos com grande precisão, uma precisão maior que aquela dada por métodos de regressão. Infelizmente, a comunidade estatística tem se focado em resolver apenas o problema da estimação da função de regressão, apesar da grande necessidade de métodos eficientes (computacional e estatisticamente) para estimar densidades condicionais. Neste projeto propomos uma nova abordagem para estimar tal quantidade, na qual tomamos proveito de estimadores da função de regressão já existentes. Assim, devido à extensa literatura acerca de métodos de regressão, o modelo não-paramétrico que propomos é bastante flexível e pode ter boa performance em uma grande variedade de problemas. Neste projeto iremos comparar o estimador proposto com estimadores tradicionais tanto em problemas simulados quanto em problemas reais, assim como derivar taxas de convergência para este estimador e compará-las a taxas minimax. Finalmente, iremos implementar um código aberto à comunidade que permita ajustar o estimador proposto em bancos de dados grandes. Os dados reais que iremos utilizar incluem resultados da Sloan Digital Sky Survey sobre o problema cosmológico supracitado, assim como dados acerca da estimação da mortalidade de aves durante seu transporte para um abatedouro, em que a densidade condicional desempenha um papel importante por se tratar de um problema com superdispersão.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Rafael Izbicki - Coordenador / LEE, A. B. - Integrante / Afrânio Márcio Corrêa Vieira - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa. Número de produções C, T A: 11
      Membro: Rafael Izbicki.

Prêmios e títulos

  • Total de prêmios e títulos (5)
    1. Paraninfo dos formando do curso de Estatística da UFSCar, UFSCar.. 2019.
      Membro: Rafael Izbicki.
    2. Homenageado dos Formandos do Curso de Estatística, UFSCar.. 2018.
      Membro: Rafael Izbicki.
    3. Patrono dos Formandos do Curso de Estatística, UFSCar.. 2017.
      Membro: Rafael Izbicki.
    4. Umesh K. Gavasakar Thesis Award, Department of Statistics, Carnegie Mellon University.. 2014.
      Membro: Rafael Izbicki.
    5. Bolsa Jovem Talento (Não utilizado), CNPq.. 2014.
      Membro: Rafael Izbicki.

Participação em eventos

  • Total de participação em eventos (36)
    1. Seventh Brazilian Conference on Statistical Modelling in Insurance and Finance. Quantification Under Prior Probability Shift: the Ratio Estimator and its Extensions. 2020. (Congresso).
    2. 18ª ESTE - Escola de Séries Temporais e Econometria. ABC-CDE: Toward Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations. 2019. (Congresso).
    3. 1a Escola de Ciência de Dados.ABC-CDE: Toward Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations.. 2019. (Outra).
    4. Seminários UFMG.Quantification Under Prior Probability Shift: the Ratio Estimator and its Extensions. 2019. (Seminário).
    5. VI Congresso Bayesiano de América Latina (COBAL). ABC-CDE: Toward Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations. 2019. (Congresso).
    6. VII Workshop on Probabilistic and Statistical Methods.ABC-CDE: Toward Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations. 2019. (Encontro).
    7. Workshop on Stochastic Simulation Methods in Statistics (EMAP-FGV).ABC-CDE: Toward Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations. 2019. (Oficina).
    8. #meetingdata.FlexCode: modelando incertezas em problemas de predição. 2018. (Encontro).
    9. 63o RBRas. Towards Approximate Bayesian Computation with Complex High-Dimensional Data and Limited Simulations. 2018. (Congresso).
    10. 8o São Carlos Data Science Meetup.FlexCode: Modelando incertezas em problemas de predição.. 2018. (Encontro).
    11. II Workshop em Bioestatística.Machine learning. 2018. (Oficina).
    12. Seminário da Graduação em Estatística.Métodos preditivos em imagens e documentos de texto. 2018. (Seminário).
    13. SINAPE. Introdução a aprendizagem estatística de máquina. 2018. (Congresso).
    14. VI Encontro Baiano de Estatística.Machine Learning sob a ótica Estatística. 2018. (Encontro).
    15. 12a aMostra de Estatística IME-USP.Mesa Redonda: Rumos Possíveis do Bacharelado em Estatística. 2017. (Encontro).
    16. 1º Encontro da Pós-Graduação em Estatística do IME-USP.Minicurso: Aprendizado Estatístico de Máquina. 2017. (Encontro).
    17. 31o coloquio brasileiro de matematica. Approximate Bayesian Computation: a Conditional Density Estimation Perspective. 2017. (Congresso).
    18. WORKSHOP ON HIGH DIMENSION DATA.Converting High-Dimensional Regression to High-Dimensional Nonparametric Conditional Density Estimation. 2017. (Oficina).
    19. 3rd Workshop on Assessment of Risk.Converting High-Dimensional Regression to Conditional Density Estimators. 2016. (Oficina).
    20. Ciência de Dados - Instituto de Estudos Avançados e Estratégicos.Data Science: a Statistics Perspective. 2016. (Encontro).
    21. Encontro Brasileiro de Estatística Bayesiana.Prior Distributions as a Regularization Tool: an Application to Crowdsourcing. 2016. (Encontro).
    22. II Congresso Brasileiro de Jovens Pesquisadores em Matemática Pura e Aplicada. Converting High-dimensional Regression to High-dimensional Conditional Density-Estimation. 2016. (Congresso).
    23. Mostra de Estatística do IME-USP.Estatística e Machine Learning. 2016. (Encontro).
    24. São Paulo R Users Group Meetup.Uma introdução ao machine learning usando o R. 2016. (Seminário).
    25. Seminários Academicos do INSPER.Converting High-dimensional Regression to High-dimensional Conditional Density-Estimation. 2016. (Seminário).
    26. XII Encontro Estatístico do CONRE-3.Estatística e Machine Learning. 2016. (Encontro).
    27. XXII SINAPE. Converting High-Dimensional Regression to High-Dimensional Conditional Density Estimation. 2016. (Congresso).
    28. 60th World Statistics Congress - ISI2015. A flexible approach to high-dimensional conditional density estimation. 2015. (Congresso).
    29. 60ª Reunião Anual da RBras. Nonparametric Conditional Density Estimation in a High-Dimensional Regression Setting. 2015. (Congresso).
    30. Projeto temático: modelos de regressão e aplicações.A flexible approach to high-dimensional nonparametric conditional density estimation. 2015. (Seminário).
    31. Seminários de Probabilidade e Sistemas Complexos UFSCar/ICMC.Nonparametric conditional density estimation in high dimensions: some theoretical aspects. 2015. (Simpósio).
    32. XIV EMR - Escola de Modelos de Regressão. A Spectral Series Approach to High-Dimensional Nonparametric Inference. 2015. (Congresso).
    33. 21º SINAPE - Simpósio Nacional de Probabilidade e Estatística. Nonparametric Conditional Density Estimation in a High-Dimensional Regression Setting. 2014. (Congresso).
    34. AISTATS International Conference on Artificial Intelligence and Statistics 2014. High-Dimensional Density Ratio Estimation via Spectral Series Method. 2014. (Congresso).
    35. Brazilian Conference on Intelligent Systems. 2014. (Congresso).
    36. Seminário Conjunto UFSCar/ICMC.A Spectral Series Approach to High-Dimensional Nonparametric Inference. 2014. (Seminário).

Organização de eventos

  • Total de organização de eventos (5)
    1. Izbicki, Rafael; CURI, M. ; TOMAZELLA, V. L. D. ; BAZAN, J. L. ; GAVA, R. J.. 8th Workshop on Probabilistic and Statistical Methods. 2020. Congresso
    2. POLPO, A.; J. Stern ; Dias, Teresa Cristina Martins ; CATICHA, N. ; COBRE, J. ; CONCEICAO, K. ; Alves Diniz, M. ; FOSSALUZA, V. ; IZBICKI, R. ; LOUZADA-NETO, F. ; PEREIRA, C. A. DE B. ; STERN, R. B. ; TAKADA, H.. MaxEnt 2017 - 37th International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering. 2017. Congresso
    3. Izbicki, Rafael; Fossaluza, Victor ; et al. I Brazilian Congress of Young Researchers in Pure and Applied Mathematics. 2014. Congresso
    4. Izbicki, Rafael. Mostra de Estatística do IME-USP. 2008. (Outro).. . 0.
    5. Izbicki, Rafael. Mostra de Estatística do IME-USP. 2007. (Outro).. . 0.

Lista de colaborações



Data de processamento: 12/10/2020 23:38:40