Relatório de produção acadêmica da Universidade Federal de São Carlos (UFSCar) realizado em 21/11/2017

Helena de Medeiros Caseli

Professora associada (nível 1 desde 09/2016) do Departamento de Computação da Universidade Federal de São Carlos (UFSCar), a Dra. Helena Caseli possui graduação em Ciência da Computação pela Universidade Federal de Uberlândia (1997-2000), mestrado (2001-2003), doutorado (2003-2007) e pós-doutorado (2007-2007) em Ciência da Computação pela Universidade de São Paulo (ICMC-USP). Realizou, ainda, dois estágios na Universidad de Alicante (Espanha) durante (2004-2005) e após (2007-2008) o doutorado. A experiência de pesquisa da Profa. Dra. Helena Caseli na área de Computação está, principalmente, relacionada com a área de Inteligência Artificial, atuando nos temas: aprendizado de máquina (tradicional e deep learning), processamento automático de língua natural (português, inglês, espanhol e francês), tradução automática e alinhamento de textos paralelos. Atualmente é a coordenadora de projetos de pesquisa nacionais e internacionais (veja Projetos de pesquisa), com orientação de alunos de graduação e pós-graduação (veja Orientações). Também é responsável pela coordenação de projeto de extensão com a empresa MyBoo (http://boolabs.com.br/). Para outras informações sobre projetos de pesquisa, linhas de atuação e orientações consulte: http://www.lalic.dc.ufscar.br/ (Texto informado pelo autor)

  • http://lattes.cnpq.br/6608582057810385 (25/10/2017)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise: 2008-2017
  • Endereço: Universidade Federal de São Carlos, Centro de Ciências Exatas e de Tecnologia, Departamento de Computação. Rod. Washington Luiz, km 235 Vila Monjolinho 13565905 - São Carlos, SP - Brasil - Caixa-postal: 676 Telefone: (16) 33518584 URL da Homepage: http://www.dc.ufscar.br/~helenacaseli
  • Grande área: Ciências Exatas e da Terra
  • Área: Ciência da Computação
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (8)
    1. 2016-Atual. MMeaning - Representacao semantica distribuida multimodal (Auxilio FAPESP: 2016/13002-0)
      Descrição: Com a disponibilização cada vez maior de informação na web, o processamento e a recuperação de informação textual e visual são atividades imprescindíveis na geração automática de conhecimento. Como a maior parte da informação disponibilizada na web é composta de texto em língua natural e de imagens, processá-los de modo "inteligente" envolve, necessariamente, o entendimento (a interpretação) do significado da informação que eles transmitem. Uma das formas mais utilizadas para representação do conteúdo semântico é a representação semântica distribuída, a qual está baseada na hipótese distribucional que estabelece que o sentido de uma palavra é dado por seu contexto de ocorrência. Embora a fonte principal para extração de conhecimento semântico usando a hipótese distribucional sejam os corpora, outras fontes de informação extralinguísticas, como imagens, também devem ser levadas em consideração. A combinação de múltiplas fontes de informação na geração de representações semânticas é denominada representação semântica distribuída multimodal. A essa nova linha de investigação soma-se o recente interesse nos modelos de representação distribuída baseados em redes neurais, também conhecidos como modelos de aprendizado profundo (deep learning). Nesse contexto, este projeto visa investigar o uso de fontes diversas de conhecimento, como textos paralelos/comparáveis e imagens, na modelagem semântica distribuída de textos em língua natural a fim de enriquecer as informações utilizadas em aplicações de Processamento de Língua Natural e Recuperação de Informação.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (6) / Especialização: (0) / Mestrado acadêmico: (5) / Mestrado profissional: (0) / Doutorado: (0) . Integrantes: Helena de Medeiros Caseli - Coordenador / JANDER MOREIRA - Integrante / Eloize Rossi Marques Seno - Integrante / Cristiano Ornelas Ribeiro - Integrante / pablo botton da costa - Integrante / Márcio Lima Inácio - Integrante / Lucas Hochleitner da Silva - Integrante / Natalie Lourenço Vargas - Integrante / Fernando Tadao Ito - Integrante / Wellington Cristiano Veltroni - Integrante / Miguel Gonçalves Vieira - Integrante / Clarissa Lenina Scandarolli - Integrante / Jéssica Rodrigues da Silva - Integrante / Tulio Reis Carvalho - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Número de produções C, T A: 1 / Número de orientações: 9
      Membro: Helena de Medeiros Caseli.
    2. 2014-2017. AIM-WEST - Analysis And Integration Of Multiword Expressions In Speech And Translation (Auxilio FAPESP: 2013/50757-0)
      Descrição: This project aims to investigate techniques, resources and protocols for evaluating and integrating models of multiword expression (MWE) processing into machine translation and automatic speech recognition technology. MWEs like nominal compounds (machine learning, weapons of mass destruction) and verb­particle constructions (break down, clear up) are a challenge for current language technology. They often require additional knowledge for correct computational interpretation due to their often opaque and idiomatic semantics. For instance, failing to recognize that an MWE like kick the bucket needs to be interpreted as a unit (to die) may lead to incorrect translations. The AIM­WEST project addresses the automatic treatment of MWEs focusing on Portuguese, English and French, and on Portuguese↔English, French↔English and Portuguese↔French translation. The main contribution of the project will be the development of enabling multilingual human­machine interfaces that can take into account such complex phenomena as MWEs. For more information see: http://aim-west.imag.fr/. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (5) . Integrantes: Helena de Medeiros Caseli - Coordenador / Aline Villavicencio - Integrante / Ramisch, Carlos - Integrante / Laurent Besacier - Integrante / Alexandre Coelho Rondon - Integrante / pablo botton da costa - Integrante / Natalie Lourenço Vargas - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Número de produções C, T A: 8 / Número de orientações: 5
      Membro: Helena de Medeiros Caseli.
    3. 2014-2016. RITA - RIch Text Analysis through Enhanced Tools based on Lexical Resources
      Descrição: The objective of the project is the development of tools for the syntactico-semantic analysis of Spanish and Portuguese. To do this, we aim to build a framework to integrate the different capabilities and resources of the groups involved. In particular, we want to integrate different lines of work on compositional semantics and enriched lexica: the Lexicon-Grammar tables, verbal subcategorization frames, multiword expressions, grammatical formalisms with enough expressivity to integrate this information, and learning mechanisms capable of building complex models from examples at these levels of analysis. For more information see: http://lauraalonsoalemany.wix.com/rita. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Helena de Medeiros Caseli - Coordenador / Maria José Finatto - Integrante / Laura Alonso Alemany - Integrante / Aiala Rosá - Integrante / Jean-Luc Minel - Integrante / Éric Laporte - Integrante / pablo botton da costa - Integrante. Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio financeiro. Número de produções C, T A: 1 / Número de orientações: 1
      Membro: Helena de Medeiros Caseli.
    4. 2013-2016. Portal Min@s: corpora de fala e escrita
      Descrição: A presente proposta visa, por meio de um trabalho conjunto de especialistas em estudos da linguagem, linguística computacional e ciências da computação, desenvolver e implementar um portal integrado de corpora de fala e escrita com funcionalidades de uso de caráter inovador, a fim de potencializar os recursos e a capacidade instalada do Programa de Pós-graduação em Estudos Linguísticos da Faculdade de Letras da UFMG com o objetivo de dar visibilidade nacional e internacional a resultados de pesquisas realizadas no âmbito do Programa. Pautada num planejamento estratégico que contempla desenvolvimento científico e tecnológico, formação de recursos humanos e intercâmbio interinstitucional, a proposta consolida os percursos de quatro Laboratórios associados da FALE/UFMG através da integração de seus bancos de dados, realizada com o suporte de especialistas do NILC/USP e em interação com especialistas em corpora de grupos consolidados em nível nacional e Internacional. Os produtos terão fundamental contribuição na consolidação do Programa enquanto centro de excelência no Estado de Minas Gerais e no Brasil, servindo como referência para outros centros de pesquisa nacionais e internacionais. A proposta configura um projeto inovador com impacto na avaliação do Programa pela CAPES, reforçando seu perfil de conceito 6 e promovendo seu alçamento ao conceito 7. (Fonte: CVLattes da Profa. Dra. Célia Maria Magalhães). Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (1) / Doutorado: (1) . Integrantes: Helena de Medeiros Caseli - Integrante / Thiago Lima Vieira - Integrante / Leandro Henrique Mendonça de Oliveira - Integrante / Célia Maria Magalhães - Coordenador / Deise Prina Dutra - Integrante / Jânia Martins Ramos - Integrante / Adriana Pagano - Integrante / Stella Esther Ortweiler Tagnin - Integrante / Fabio Alves - Integrante / Tony Berber Sardinha - Integrante / Thais Cristófaro Silva - Integrante / Sandra Maria Aluísio - Integrante / Diana Santos - Integrante / Ronaldo Teixeira Martins - Integrante / Arnaldo Candido Junior - Integrante. Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio financeiro.
      Membro: Helena de Medeiros Caseli.
    5. 2013-2015. Aprendendo com a web a traduzir e parafrasear textos (Auxilio FAPESP: 2013/11811-0)
      Descrição: O reconhecimento automático de paráfrases e a tradução automática são duas subáreas do Processamento de Língua Natural (PLN) que compartilham semelhanças, como o fato de ambas lidarem com textos paralelos (textos que expressam o mesmo conteúdo) sejam eles monolíngues (no caso das paráfrases) ou bilíngues (no caso das traduções). Contudo, apenas recentemente alguns poucos estudos foram desenvolvidos explorando a combinação de métodos e técnicas dessas duas subáreas de PLN (BANNARD; CALLISON-BURCH, 2005; CALLISON-BURCH et al., 2006; BARREIRO, 2008; PANG et al., 2003). Neste projeto, visa-se investigar a extração automática de paráfrases e de conhecimento útil para a tradução automática usando a estratégia de aprendizado de máquina sem-fim (AMSF) e a web como fonte de conhecimento. Repositórios onlines de conhecimento como a Wikipédia, por exemplo, definem, explicam e exemplificam conhecimento de maneiras distintas. Repositórios onlines de legendas como OpenSubtitles e SubDB e letras de músicas como o Lyrics apresentam versões de um mesmo texto em vários idiomas. Esses repositórios são valiosas fontes de informação para os métodos de extração automática de paráfrases e de conhecimento útil para a tradução que serão projetados seguindo a estratégia de AMSF. O AMSF é uma estratégia de aprendizado de máquina recente baseada no aprendizado constante e incremental inspirada no modo como nós, humanos, aprendemos. A ideia do AMSF é que ao aprendermos conceitos simples e relações simples entre esses conceitos nós nos tornamos capazes de aprender, no futuro, algo novo e mais complexo (MITCHELL et al., 2008). Essa proposta é inovadora na aplicação de AMSF nas duas subáreas de PLN citadas e poderá dar origem a abordagens integradas contribuindo, assim, com o avanço nessas e outras áreas de pesquisa.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (4) . Integrantes: Helena de Medeiros Caseli - Coordenador / Carlos E. Ramisch - Integrante / Leonardo Sameshima Taba - Integrante / Thiago Lima Vieira - Integrante / Estevam Rafael Hruschka Júnior - Integrante / Débora Beatriz de Jesus Martins - Integrante / Eloize Rossi Marques Seno - Integrante / Cristiano Ornelas Ribeiro - Integrante / Paulo César Polastri - Integrante / Alexandre Coelho Rondon - Integrante / Rafael Oliveira Teixeira - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Número de produções C, T A: 7 / Número de orientações: 4
      Membro: Helena de Medeiros Caseli.
    6. 2011-2015. CAMELEON: Metodos Colaborativos e Automaticos para a Multilingualizacao de Lexicos e Ontologias (CAPES-COFECUB: 707/11)
      Descrição: Esse é um projeto de cooperação internacional de 4 anos que visa a criação, fortalecimento e extensão do intercâmbio acadêmico entre pesquisadores da França e do Brasil no domínio de léxicos e ontologias multilíngues. Esse projeto é cofinanciado por CAPES (Brasil) e COFECUB (França), como o projeto CAPES-COFECUB no. 707/11. O projeto teve início em 2011 e deve ser concluído no final de 2014. A Profa. Helena Caseli realizou Missão de Trabalho de 12 a 24/11/2011 ao grupo GETALP, Universidade de Grenoble, França.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (6) . Integrantes: Helena de Medeiros Caseli - Integrante / Renata Vieira - Integrante / Carlos E. Ramisch - Integrante / Aline Villavicencio - Coordenador / Leonardo Sameshima Taba - Integrante / Débora Beatriz de Jesus Martins - Integrante / Mário Machado - Integrante / Paulo Schreiner - Integrante / Viviane Moreira - Integrante / Viviane Pereira Moreira - Integrante / Marcos Idiart - Integrante / Christian Boitet - Integrante / Mathieu Mangeot-Nagata - Integrante / Jérôme Euzenat - Integrante / Cássia Trojahn dos Santos - Integrante / Didier Schwab - Integrante / Gilles Sérasset - Integrante / David Rouquet - Integrante / Cong-Phap Huynh - Integrante / Alexandre Coelho Rondon - Integrante. Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio financeiro / COFECUB - Auxílio financeiro. Número de produções C, T A: 1
      Membro: Helena de Medeiros Caseli.
    7. 2010-2012. Portal de Traducao Automatica: recursos e ferramentas para o portugues do Brasil (Auxilio FAPESP: 2010/07517-0)
      Descrição: Esse projeto pretende coletar, criar, implementar e avaliar recursos e ferramentas linguístico-computacionais que envolvam dois ou mais, idiomas incluindo o português do Brasil. Tais ferramentas e recursos serão disponibilizados por meio de um Portal de TA sendo, dessa maneira, úteis para aplicações multilíngues como a Tradução Automática. Para acessar os recursos e ferramentas do PorTAl acesse: http://www.lalic.dc.ufscar.br/portal/. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (6) . Integrantes: Helena de Medeiros Caseli - Coordenador / Bruno Akio Sugiyama - Integrante / Josué Garcia de Araújo - Integrante / Daniel Emílio Beck - Integrante / Leonardo Sameshima Taba - Integrante / Thiago Lima Vieira - Integrante / Débora Beatriz de Jesus Martins - Integrante / Cleber Takahito Kawamorita - Integrante / Thiago Müller Albertin - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Número de produções C, T A: 14 / Número de orientações: 6
      Membro: Helena de Medeiros Caseli.
    8. 2008-2011. Investigacao e implementacao de tecnicas de traducao automatica com o uso de informacao sintatica
      Descrição: Esse projeto propõe a investigação do uso de informação sintática em diferentes técnicas de tradução automática propostas recentemente, por meio da implementação e/ou adaptação e avaliação das mesmas envolvendo, em particular, o português do Brasil. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (2) . Integrantes: Helena de Medeiros Caseli - Coordenador / Israel Aono Nunes - Integrante / Laís Augusta da Silva Meuchi - Integrante / Josué Garcia de Araújo - Integrante / Daniel Emílio Beck - Integrante / Miguel Mêndola Antonio - Integrante. Financiador(es): Universidade Federal de São Carlos - Auxílio financeiro. Número de produções C, T A: 13 / Número de orientações: 5
      Membro: Helena de Medeiros Caseli.

Prêmios e títulos

  • Total de prêmios e títulos (3)
    1. Prêmio de Melhor Artigo Resumido (1º lugar), XXI Simpósio Brasileiro de Informática na Educação (SBIE 2010) realizado em João Pessoa, PB... 2010.
      Membro: Helena de Medeiros Caseli.
    2. Honra ao Mérito pelo Melhor Artigo Resumido no 21º Simpósio Brasileiro de Informática na Eduação, UFSCar.. 2010.
      Membro: Helena de Medeiros Caseli.
    3. Menção honrosa no VI Concurso de Teses e Dissertações em Inteligência Artificial (CTDIA), .. 2008.
      Membro: Helena de Medeiros Caseli.

Participação em eventos

  • Total de participação em eventos (30)
    1. 11th International Conference on Computational Processing of Portuguese. 2014. (Congresso).
    2. International Conference on Language Resources and Evaluation. Automatic Semantic Relation Extraction from Portuguese Texts. 2014. (Congresso).
    3. Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish (ToRPorEsp). 2014. (Oficina).
    4. Computational Processing of the Portuguese Language. Bayesian Induction of Syntactic Language Models for Brazilian Portuguese. 2012. (Congresso).
    5. Encontro de Linguística de Corpus (ELC). 2012. (Encontro).
    6. Alternativas à pesquisa acadêmica no Google (palestra proferida pela Ms. Eliane Colepícolo durante a I Jornada sobre Trabalhos Acadêmicos e Científicos). 2011. (Outra).
    7. Brazilian Symposium in Information and Human Language Technology (STIL). Combining Models for the Alignment of Parallel Syntactic Trees. 2011. (Congresso).
    8. CTRL+C, CTRL+V: e o Plágio? (palestra proferida pela Profa. Dra. Maria Cristina Comunian Ferraz durante a I Jornada sobre Trabalhos Acadêmicos e Científicos). 2011. (Outra).
    9. EaDay - Encontro da comunidade do Bacharelado em Sistemas de Informação. 2011. (Encontro).
    10. I Jornada sobre Trabalhos Acadêmicos e Científicos. 2011. (Outra).
    11. Iniciação Científica: Objetivos e Oportunidades (palestra proferida pelo Prof. Dr. Luiz Antonio Pessan durante a I Jornada sobre Trabalhos Acadêmicos e Científicos). 2011. (Outra).
    12. International Workshop on Using Linguistic Information for Hybrid Machine Translation. 2011. (Oficina).
    13. Brazilian Symposium on Artificial Intelligence (SBIA).Factored Translation between Brazilian Portuguese and English. 2010. (Simpósio).
    14. IV Seminário de Inovações Pedagógicas no Ensino de Graduação na UFSCar: Inovando nos Processos de Ensino e Aprendizagem. 2010. (Seminário).
    15. Workshop in Natural Language Processing and web-based technologies (collocated with IBERAMIA).Alignment of Portuguese-English syntactic trees using part-of-speech filters. 2010. (Oficina).
    16. Workshop on Computational Processing of Written and Spoken Portuguese (PROPOR). Transfer rule and bilingual dictionary automatic induction in the ReTraTos project. 2010. (Congresso).
    17. 8ª Jornada de Iniciação Científica e Tecnológica da UFSCar.Sessão Oral - Ciência da Computação. 2009. (Outra).
    18. Brazilian Symposium in Information and Human Language Technology (STIL).Statistical Machine Translation: little changes big impacts. 2009. (Simpósio).
    19. Data-Show + Power Point = lousa + giz? (minicurso integrante do III Seminário de Inovações Pedagógicas no Ensino de Graduação na UFSCar: Inovando nos Processos de Ensino e Aprendizagem). 2009. (Oficina).
    20. III Seminário de Inovações Pedagógicas no Ensino de Graduação na UFSCar: Inovando nos Processos de Ensino e Aprendizagem. 2009. (Seminário).
    21. I Workshop do NILC.Tradução Automática: Perspectivas e Desafios. 2009. (Oficina).
    22. Semana da Computaçao da UFSCar (SeComp 2009). 2009. (Outra).
    23. The character and structure of American academic speech (palestra proferida pelo Prof. Dr. John Malcon Swales). 2009. (Outra).
    24. VI Experimental Software Engineering Latin American Workshop (ESELAW'09). 2009. (Congresso).
    25. Workshop on Multiword Expressions (ACL-IJCNLP).Statistically-Driven Alignment-Based Multiword Expression Identification for Technical Domains. 2009. (Oficina).
    26. XII Simpósio de Teses e Dissertações do Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional.Membro da Mesa Redonda. 2009. (Simpósio).
    27. Brazilian Symposium on Artificial Intelligence (SBIA).On the automatic learning of bilingual resources: some relevant factors for machine translation. 2008. (Simpósio).
    28. Jornada de Iniciação Científica e Tecnológica da UFSCar.Sessão Oral - Ciência da Computação. 2008. (Outra).
    29. Mixing Approaches to Machine Translation.From free shallow monolingual resources to machine translation systems: easing the task. 2008. (Oficina).
    30. VI Best MSc Dissertation/PhD Thesis Contest (CTDIA).Automatic induction of bilingual resources for machine translation: the ReTraTos project. 2008. (Oficina).

Organização de eventos

  • Total de organização de eventos (5)
    1. MATOS, D. M. ; CASELI, H. M.. PROPOR's PhD and MSc Dissertation Contest. 2014. Concurso
    2. CASELI, H. M.; RAMISCH, C. E. ; BALAGE FILHO, P. P.. Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic). 2013. Outro
    3. CASELI, H. M.; VILLAVICENCIO, A. ; PERDIGAO, F. ; TEIXEIRA, A.. Computational Processing of the Portuguese Language - Editorial Chair. 2012. Congresso
    4. BONFANTE, A. G. ; MARTINS, C. A. ; CASELI, H. M. ; SPECIA, L.. Simpósio Brasileiro em Tecnologia da Informação e Linguagem Humana (STIL) - Program Chair. 2011. Congresso
    5. PARDO, T.A.S. ; NUNES, M. G. V. ; VILLAVICENCIO, A. ; SAGGION, H. ; CASELI, H. M. ; MACHADO, M.. Simpósio Brasileiro em Tecnologia da Informação e Linguagem Humana (STIL) - Member of the Local Organizing Committee. 2009. Congresso

Lista de colaborações



Data de processamento: 24/11/2017 12:06:51