Relatório de produção acadêmica da Universidade Federal de São Carlos (UFSCar) realizado em 21/11/2017

Ariani Di Felippo

Possui graduação em Licenciatura em Letras pela Universidade Federal de São Carlos (2000), mestrado (2004) e doutorado (2008) em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho. Desde 2009 é professora no Departamento de Letras da Universidade Federal de São Carlos, exercendo atualmente o cargo de Docente Associado (Nível 1). Sua área de pesquisa é o Processamento Automático das Línguas Naturais (ou Linguística Computacional), com ênfase em Semântica Lexical Computacional e Sumarização Automática. Realizou estágio de pós-doutoramento entre set/2015 e set/2016 no Departamento de Computação e Ciência da Informação da Universidade da Pensilvânia (UPenn) (Filadélfia/EUA) no qual tratou de questões relativas à correferência com aplicação na Sumarização Automática Multidocumento. (Texto informado pelo autor)

  • http://lattes.cnpq.br/8648412103197455 (11/09/2017)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise: 2009-2017
  • Endereço: Universidade Federal de São Carlos, Centro de Educação e Ciências Humanas. Rodovia Washington Luís, km. 235, SP-310 Monjolinho 13565905 - São Carlos, SP - Brasil - Caixa-postal: 676 Telefone: (16) 33518358 Ramal: 6458 URL da Homepage: http://www.nilc.icmc.usp.br/nilc/index.php/team?id=22
  • Grande área: Lingüística, Letras e Artes
  • Área: Lingüística
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (5)
    1. 2015-2016. Revisao de sumarios baseada em conhecimento: transformando extratos multidocumento em abstracts
      Descrição: De modo geral, as aplicações de Sumarização Automática Multidocumento produzem extratos, ou seja, sumários compostos por sentenças selecionadas integralmente dos textos-fonte. Apesar da evolução das estratégias de seleção de sentenças, os sumários extrativos ainda apresentam uma série de problemas relativos à informatividade e qualidade linguística. Um deles é o baixo nível de generalização. Com base em alinhamentos de textos-fonte e seus respectivos sumários humanos (multidocumento), identificou-se que o tipo mais frequente de generalização ocorre no nível sintagmático e diz respeito a entidades nomeadas. Assim, ao descrever as cadeias de correferência de sumários humanos em que tais generalizações ocorrem, geraram-se regras de reescrita que, uma vez aplicadas a extratos automáticos, podem contribuir para elevar a qualidade linguística ao diminuir o nível de especificidade dos extratos. Como tais reescritas transformam os extratos em textos mais coerentes e legíveis, esta pesquisa cumpre com o objetivo inicial de avançar a SAM extrativa do português em direção à produção de abstracts, ou seja, sumários que englobam a reescrita de parte do material linguístico advindo dos textos-fonte.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Ariani Di Felippo - Coordenador / Ani Nenkova - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa. Número de produções C, T A: 1
      Membro: Ariani Di Felippo.
    2. 2012-Atual. SUSTENTO - Geracao de conhecimento linguistico para a Sumarizacao Automatica Multidocumento
      Descrição: Dada a grande quantidade de informação disponível em várias línguas, sobretudo na web, a Sumarização Automática Multidocumento (SAM) tem ocupado lugar de centralidade no Processamento Automático das Línguas Naturais (PLN) na medida em que facilita o acesso à informação. Originada em meados de 1990, a SAM objetiva produzir automaticamente um único sumário (resumo) a partir de uma coleção de textos sobre um mesmo tópico. Para o português do Brasil (PB), as pesquisas começaram somente nos últimos anos. Apesar de incipientes, os sistemas/métodos que envolvem o PB igualam-se ao estado da arte e, em alguns casos, superam os resultados obtidos para outras línguas. Mesmo diante de cenário tão promissor, a SAM, de um modo geral, carece de subsídios linguísticos que permitam aproximar a tarefa automática à humana. Assim, neste projeto, objetiva-se gerar subsídios linguísticos para avançar o estado da arte em SAM, principalmente que envolve o PB. Para tanto, investigar-se-ão 3 frentes de pesquisa correlatas: (i) caracterização linguística de sumários multidocumento produzidos por humanos, (ii) investigação aprofundada dos fenômenos multidocumento (p.ex.: redundância), e (iii) descrição e formalização de conhecimento semântico-conceitual. As frentes (i) e (ii) justificam-se pelo fato de que a SAM, ao contrário da monodocumento, pauta-se apenas em indícios sobre a sumarização humana (multidocumento) e em estudos superficiais de seus fenômenos. A frente (iii) justifica-se pelo fato de que os métodos de SAM para o PB poderão ser enriquecidos ou totalmente baseados nesse tipo de conhecimento. Tendo em vista a geração de descrições e formalizações linguísticas nas três frentes, acredita-se que este projeto tem potencial para contribuir com a SAM e a Linguística Descritiva. Ademais, salienta-se a formação de recursos humanos no PLN, área ainda pequena no Brasil.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (3) . Integrantes: Ariani Di Felippo - Coordenador / Lucia Helena Machado Rino - Integrante / Maria das Graças Volpe Nunes - Integrante / Thiago A S Pardo - Integrante / Jackson Wilke da Cruz Souza - Integrante / Renata Tironi Camargo - Integrante / Fabricio Elder da Silva Tosta - Integrante / Andressa Caroline Inácio Zacarias - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro / Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Ariani Di Felippo.
    3. 2010-Atual. CLARIN - Common Language Resources and Technology Infrastructure
      Descrição: CLARIN is committed to establish an integrated and interoperable research infrastructure of language resources and its technology.. Situação: Desativado; Natureza: Pesquisa. Integrantes: Ariani Di Felippo - Integrante / Maria das Graças Volpe Nunes - Integrante / Thiago A S Pardo - Coordenador / Sandra Maria Aluísio - Integrante / João Luis Garcia Rosa - Integrante.
      Membro: Ariani Di Felippo.
    4. 2009-2011. TermiNet - Instanciacao e Aplicacao de uma Metodologia para o Desenvolvimento de Wordnets Terminologicas em Portugues do Brasil
      Descrição: Neste documento, propõe-se uma pesquisa no âmbito do Processamento Automático das Línguas Naturais (PLN), área interdisciplinar que busca desenvolver sistemas que processam as línguas naturais (p.ex.: sistemas de sumarização). Para o desenvolvimento de vários sistemas de PLN, são necessários certos recursos lingüísticos (os lingwares) que desempenham papel central na arquitetura dos sistemas, p.ex.: as ?bases de conhecimento lexical?. Dada a necessidade crescente de se processar textos especializados, bases de conhecimento lexical especializado (ou terminológico) passaram a ser desenvolvidas para várias línguas, principalmente no formato wordnet. Embora exista um número razoável de wordnets terminológicas em diversas línguas, observa-se a carência de uma metodologia suficientemente clara que facilite e, sobretudo, estimule a criação dessas bases. Para o português do Brasil (PB), aliás, não há bases de conhecimento especializado no formato wordnet. Assim, propõe-se (i) a instanciação de uma metodologia para o desenvolvimento de wordnets terminológicas e (ii) a sua aplicação na construção de uma base desse tipo em PB. Tal metodologia, proposta para a realização de quaisquer pesquisas no PLN, destaca-se por conciliar a face lingüística e a computacional dessa área. Com isso, acredita-se que o projeto pode beneficiar não só o PLN, mas também a Terminologia/ Terminografia em PB, pois o formato wordnet é um modelo elegante e eficaz para a representação do conhecimento léxico-conceitual, fundamental também para o desenvolvimento de produtos terminográficos tradicionais.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) . Integrantes: Ariani Di Felippo - Coordenador / Maria das Graças Volpe Nunes - Integrante / Thiago A S Pardo - Integrante / Sandra Maria Aluísio - Integrante / Gladis Maria de Barcelos Almeida - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro / Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Ariani Di Felippo.
    5. 2009-Atual. SUCINTO - summarization for clever information access
      Descrição: The sucinto project aims at investigating and exploring generic and topic-focused multi-document summarization strategies for providing a more feasible and intelligent access to on-line information provided by news agencies. This commitment brings back old and well-known scientific challenges from the first studies in summarization in the 50s as well as introduces several new and exciting challenges, e.g., to deal with redundant, complementary and contradictory information, to normalize different writing styles and referring expression choices, to balance different perspectives and sides of the same events and facts, to properly deal with evolving events and their narration in different moments, and to arrange information pieces from different texts to produce coherent and cohesive summaries, among several others. An ultimate goal of this project is to pull the developed tools together as on-line applications for final users. This project takes into consideration not only classical approaches to single and multi-document summarization, but also new ones, following different paradigms and using knowledge of varied nature ranging from empirical and statistical data to semantic and discourse models. Research interests include (i) the modeling of the summarization process (content selection, planning, aggregation, generalization, substitution, information ordering, etc.) by means of Cross-document Structure Theory (CST), Rhetorical Structure Theory (RST), ontologies, and language and summarization statistical models, (ii) the investigation of related tasks as discourse parsing, topic detection, temporal annotation and resolution, coreference resolution, text-summary alignment, and multilingual processing, and (iii) the linguistic characterization of multi-document summaries and their manual production.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (4) / Mestrado acadêmico: (3) / Doutorado: (3) . Integrantes: Ariani Di Felippo - Integrante / Lucia Helena Machado Rino - Integrante / Maria das Graças Volpe Nunes - Integrante / Thiago A S Pardo - Coordenador / Erick G. Maziero - Integrante / Maria Lucia C. Jorge - Integrante / Eloize Rossi Seno - Integrante / Renata Tironi Camargo - Integrante / Verônica Agostini - Integrante / Rafael Ribaldo - Integrante / Ademar Takeo Akabane - Integrante / Jader Bruno Pereira Lima - Integrante / Paula Christina Figueira Cardoso - Integrante / Luiz Antônio de Menezes Filho - Integrante / Juan Manuel Torres-Moreno - Integrante / Fernando Antônio Asevedo Nóbrega - Integrante.
      Membro: Ariani Di Felippo.

Prêmios e títulos

  • Total de prêmios e títulos (1)
    1. Prêmio de 2o melhor artigo no evento 10th Brazilian Symposium in Information and Human Language Technology (STIL 2015)., Sociedade Brasileira de Computação.. 2015.
      Membro: Ariani Di Felippo.

Participação em eventos

  • Total de participação em eventos (27)
    1. 11th International Conference on Computational Processing of Portuguese. 2014. (Congresso).
    2. I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish. 2014. (Congresso).
    3. I Workshop on Tools and Resources for Automatically Processing Portuguese and Spanish. 2014. (Congresso).
    4. 3a Jornada de Descrição do Português. Em Busca de Métodos de Detecção da Complementaridade para a Sumarização Automática Multidocumento. 2013. (Congresso).
    5. IX Brazilian Symposium in Information and Human Language Technology. 2013. (Congresso).
    6. Student Workshop on Information and Human Language Technology (TILic). Identificação da redundância na Sumarização Automática Multidocumento: explorando métodos superficiais. 2013. (Congresso).
    7. I Seminário de Produção em Linguística.Grupo de Linguagem Humana e Tecnologia (LHTec). 2012. (Seminário).
    8. VI Escola Brasileira de Linguística Computacional. 2012. (Outra).
    9. XI Encontro de Linguística de Corpus (XI ELC). Analysis of Aspects in a Corpus of Human Multi-document Summaries of Sports News. 2012. (Congresso).
    10. XI Encontro de Linguística de Corpus (XI ELC). Alinhamento manual de textos e sumários em um corpus jornalístico multidocumento. 2012. (Congresso).
    11. 18o Intercâmbio de Pesquisas em Linguística Aplicada (Inpla). A construção de wordnets terminológicas a partir de corpora e a extração automática de termos. 2011. (Congresso).
    12. 59o Seminário do Grupo de Estudos Linguísticos do Estado de São Paulo (Gel). Terminologia baseada em corpus: a extração de candidatos a termo segundo a abordagem estatística no projeto TermiNet. 2011. (Congresso).
    13. 8th Brazilian Symposium in Information and Human Language Technology (STIL). 2011. (Congresso).
    14. I Congresso Internacional de Estudos do Léxico (CIEL). Os termos nas wordnets: estratégias de identificação automática da sinonímia em corpus especializado. 2011. (Congresso).
    15. II Jornada de Descrição do Português (JDP). 2011. (Congresso).
    16. 58o Seminário do Grupo de Estudos Linguísticos do Estado de São Paulo (Gel). Delimitação do domínio da Educação a Distância com vistas à construção da base lexical WordNet.EaD. 2010. (Congresso).
    17. 9th International Conference on Computational Processing of the Portuguese Language (PROPOR). 2010. (Congresso).
    18. Groupe de Linguistique Appliqué des Telecommunications (GLAT). An introduction ot the TermiNet project. 2010. (Congresso).
    19. IV Escola de Linguística Computacional (EBRALC). 2010. (Outra).
    20. IX Encontro de Linguística de Corpus (ELC). O Corpus.EaD no projeto TermiNet: estratégias de construção. 2010. (Congresso).
    21. Young Investigators Workshop on Computational Approaches to Languages of the Americas. The TermiNet project: an overview. 2010. (Congresso).
    22. 57o Seminário do Grupo de Estudos Linguísticos do Estado de São Paulo (Gel).O alinhamento léxico-conceitual na base de dados REBECA. 2009. (Seminário).
    23. 7th Brazilian Symposium in Information and Human Language Technology (STIL). 2009. (Simpósio).
    24. III Escola Brasileira de Linguística Computacional (EBRALC). 2009. (Outra).
    25. I Seminário de Estudos do Léxico (SELEX).O léxico sob o olhar do Processamento Automático das Línguas Naturais e o projeto TermiNet. 2009. (Seminário).
    26. I Worskhop do Núcleo Interinstitucional de Linguística Computacional.Trabalhos em Lexicografia e Terminografia Computacional. 2009. (Encontro).
    27. VIII Encontro de Linguística de Corpus (ELC). Projetando o corpus para a construção de uma wordnet terminológica. 2009. (Congresso).

Organização de eventos

  • Total de organização de eventos (9)
    1. DI FELIPPO, Ariani; BARROS, C. D. ; VALE, O. A.. III Jornada de Descrição do Português (JDP). 2013. Congresso
    2. ABREU, A. S. C. ; DI FELIPPO, Ariani ; HOFLING, C. ; FERREIRA, C. A. ; FERREIRA, L. C. ; ALVES-BEZERRA, W.. 16a Jornada de Letras da UFSCar. 2012. Outro
    3. DI FELIPPO, Ariani; DURAN, M. S.. II Jornada de Descrição do Português (JDP). 2011. Congresso
    4. DI FELIPPO, Ariani. 58o Seminário do Grupo de Estudos Linguísticos do Estado de São Paulo (GEL). 2010. (Congresso).. . 0.
    5. DI FELIPPO, Ariani; ROSA, J. L.. I Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana (TILic). 2009. Congresso
    6. DI FELIPPO, Ariani. 7th Brazilian Symposium in Information and Human Language Technology (STIL). 2009. (Congresso).. . 0.
    7. DI FELIPPO, Ariani; BARBOSA, L. M. A.. I Seminário de Estudos do Léxico (SELEX). 2009. Outro
    8. DI FELIPPO, Ariani; ROSA, J. L.. I Olimpíada Brasileira de Linguística Computacional (OlinCom). 2009. Outro
    9. DI FELIPPO, Ariani. V Encontro de Corpora. 2005. (Outro).. . 0.

Lista de colaborações



Data de processamento: 24/11/2017 12:06:48