CVNLP PPI: Residência em TIC 13 - Heterogeneous Computing for Computational Vision and Natural Language Processing - Programas e Projetos Prioritários (PPI) - MCTI, Softex
Francielle Alves Vargas
Doutora e Mestre em Ciência da Computação e Matemática Computacional pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC/USP), com ênfase em Inteligência Artificial. Cursou graduação em Sistemas de Informação pela Pontifícia Universidade Católica de Minas Gerais (PUC Minas) e em Linguística pela Universidade Federal de Minas Gerais (UFMG). Durante o doutorado, foi pesquisadora visitante na University of Southern California (USC), nos Estados Unidos, e pesquisadora palestrante no Leibniz Institute for the Social Sciences (GESIS), na Alemanha. Sua pesquisa de doutorado foi premiada pelo Google Latin America Research Awards (LARA) dentro de um projeto voltado ao combate à desinformação. Atualmente, faz parte de comitês de programa de prestigiosas conferências e workshops internacionais nas áreas de Processamento de Linguagem Natural (EMNLP, ACL, NAACL, LREC, COLING), Mineração de Dados (CIKM) e Computação Social (ICWSM). Também integra o comitê organizador do internacional Workshop Online Abuse and Harms (WOAH) e, por três anos consecutivos, participou do comitê de organização da principal conferência internacional de Inteligência Artificial sobre Web e Mídias Sociais (ICWSM). Seus interesses de pesquisa estão concentrados na área de Inteligência Artificial, mais especificamente, Processamento de Linguagem Natural, Aprendizado de Máquina e Inteligência Artificial Responsável, atuando principalmente nas tarefas de detecção de discurso de ódio, checagem automatizada de fatos, explicabilidade e interpretabilidade, mitigação de viés e justiça. (Texto informado pelo autor)
VARGAS, F. A.; SCHMEISSER-NIETO, W. S. ; RABINOVICH, Z. ; PARDO, T. A. S. ; BENEVENUTO, F.. Discourse annotation guideline for low-resource languages. Natural Language Engineering. v. 1, p. 1-44, issn: 1469-8110, 2024.
VARGAS, FRANCIELLE ; CARVALHO, ISABELLE ; PARDO, THIAGO A. S. ; BENEVENUTO, FABRÍCIO. Context-Aware and Expert Data Resources for Brazilian Portuguese Hate Speech Detection. Natural Language Engineering. v. 1, p. 1-22, issn: 1469-8110, 2024.
Livros publicados/organizados ou edições (0)
Capítulos de livros publicados (4)
MACHADO, M. T. ; PARDO, T. A. S. ; RUIZ, E. E. S. ; FELIPPO, A. ; VARGAS, F. A.. Implicit Opinion Aspect Clues in Portuguese Texts: Analysis and Categorization. Lecture Notes in Computer Science. 1ed. Em: . : Springer International Publishing. 2022.v. 13208, p. 68-78.
Vargas, Francielle Alves; Pardo, Thiago Alexandre Salgueiro. Studying dishonest intentions in Brazilian Portuguese texts. Em: Sarkadi S., Wright B., Masters P., McBurney P.. (Org.). Communications in Computer and Information Science. 1ed.Switzerland. : Springer. 2021.v. 1296, p. 166-178.
Vargas, Francielle Alves; Pardo, Thiago Alexandre Salgueiro. Aspect Clustering Methods for Sentiment Analysis. Lecture Notes in Computer Science. 1ed. Em: . : Springer International Publishing. 2018.p. 365-374.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Hierarchical clustering of aspects for opinion mining: a corpus study. Em: Maria José Bocorny Finatto; Rozane Rodrigues Rebechi; Ana Eliza Pereira Bocorny; Simone Sarmento. (Org.). Linguística de Corpus: Perspectivas. 1ed.Porto Alegre. : Instituto de Letras da UFRGS. 2018.v. 1, p. 69-92.
Textos em jornais de notícias/revistas (0)
Trabalhos completos publicados em anais de congressos (21)
SALLES, I. A. ; VARGAS, F. A. ; BENEVENUTO, F.. HateBRXplain: A Benchmark Dataset with Human-Annotated Rationales for Explainable Hate Speech Detection in Brazilian Portuguese. Em: 31st International Conference on Computational Linguistics, p. 6659-6669, 2025.
THAPA, S. ; RAUNIYAR, K. ; JAFRI, F. ; VEERAMANI, H. ; JAIN, R. ; JAIN, S. ; VARGAS, F. A. ; HURRIYETOĞ ; NASEEM, U.. Extended Multimodal Hate Speech Event Detection During Russia-Ukraine Crisis. Em: 7th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text, p. 221-228, 2024.
VARGAS, FRANCIELLE ; GUIMARÃES, SAMUEL ; MUHAMMAD, SHAMSUDDEEN HASSAN ; ALVES, DIEGO ; AHMAD, IBRAHIM SAID ; ABDULMUMIN, IDRIS ; MOHAMED, DIALLO ; PARDO, THIAGO ; BENEVENUTO, FABRÍCIO. HausaHate: An Expert Annotated Corpus for Hausa Hate Speech Detection. Em: Proceedings of the 8th Workshop on Online Abuse and Harms (WOAH 2024), p. 52-58, 2024.
VARGAS, FRANCIELLE ; SALLES, I. ; ALVES, D. ; AGRAWAL, A. ; PARDO, THIAGO A.S. ; BENEVENUTO, FABRÍCIO. Improving Explainable Fact-Checking via Sentence-Level Factual Reasoning. Em: Seventh Fact Extraction and VERification Workshop (FEVER), v. 1, p. 192-204, 2024.
VARGAS, F. A. ; CARVALHO, I. ; HURRIYETOGLU, A. ; PARDO, THIAGO A.S. ; BENEVENUTO, F.. Socially Responsible Hate Speech Detection: Can Classifiers Reflect Social Stereotypes?. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1187-1196, 2023.
VARGAS, F. A. ; CARVALHO, I. ; SCHMEISSER-NIETO, W. ; BENEVENUTO, F. ; PARDO, THIAGO A. S.. NoHateBrazil: A Brazilian Portuguese Text Offensiveness Analysis System. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1180-1186, 2023.
VARGAS, F. A. ; JAIDKA, K. ; PARDO, THIAGO A. S. ; BENEVENUTO, F.. Predicting Sentence-Level Factuality of News and Bias of Media Outlets. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1197-1206, 2023.
THAPA, S. ; JAFRI, F. A. ; HURRIYETOĞ ; VARGAS, F. A. ; LEE, R. K. ; NASEEM, U.. Multimodal Hate Speech Event Detection. Em: 6th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text, p. 151-159, 2023.
VARGAS, F. A. ; D?ALESSANDRO, J. ; RABINOVICH, Z. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Rhetorical Structure Approach for Online Deception Detection: A Survey. Em: 13th Edition of the Language Resources and Evaluation Conference (LREC), v. 1, p. 5906-5915, 2022.
VARGAS, F. A.; CARVALHO, I. ; GÓES, F. ; PARDO, T. A. S. ; BENEVENUTO, F.. HateBR: A Large Expert Annotated Corpus of Brazilian Instagram Comments for Abusive Language Detection. Em: 13th International Conference on Language Resources and Evaluation, p. 7174-7183, 2022.
HURRIYETOĞ ; MUTLU, O. ; ̧ ; UCA, O. ; GUREL, A. S. ; RADFORD, B. ; DAI, Y. ; HETTIARACHCHI, H. ; STOEHR, N. ; NOMOTO, T. ; SLAVCHEVA, M. ; VARGAS, F. A. ; JAVID, A. ; BEYHAN, F. ; YORUK, E.. Extended Multilingual Protest News Detection. Em: 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text, p. 223-228, 2022.
VARGAS, F. A. ; GOES, F. ; CARVALHO, I. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Contextual-Lexicon Approach for Abusive Language Detection. Em: Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1442-1451, 2021.
VARGAS, F. A. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Toward Discourse-Aware Models for Multilingual Fake News Detection. Em: Recent Advances in Natural Language Processing, v. 1, p. 210-218, 2021.
NURSE, J. R. ; VARGAS, F. A. ; N Hassan ; WANG, D. ; ANDRIOTIS, P. ; GHENAI, A. ; JAIDKA, K. ; MUSTAFARAJ, E. ; JOSEPH, K. ; WELLES, B. F.. Towards a Diverse, Inclusive, Accessible and Equitable AAAI International Conference on Web and Social Media. Em: 15th International AAAI Conference on Web and Social Media, p. 1-12, 2021.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Linguistic Rules for Fine-Grained Opinion Extraction. Em: 5th International Workshop on Social Sensing: Special Edition on Narrative Analysis on Social Media, v. 1, p. 1-6, 2020.
VARGAS, F. A.; SANTOS, R. S. S. ; ROCHA, P. R.. Identifying Fine-Grained Opinion and Classifying Polarity on Coronavirus Pandemic. Em: 9th Brazilian Conference on Intelligent Systems, p. 511-520, 2020.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Aspect Clustering Methods for Sentiment Analysis. Em: 13th International Conference on the Computational Processing of Portuguese (PROPOR), v. 11122, p. 365-374, 2018.
VARGAS, F. A.; PARDO, T. A. S.. Clustering and Hierarchical Organization of Opinion Aspects: A Corpus Study. Em: IX Escola Brasileira de Linguística Computacional e XIV Encontro de Linguística de Corpus, p. 20-30, 2017.
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
CAMBRAIA, C. N ; VARGAS, F. A. ; TAVARES, P. C. ; SANTOS, T. N.. A Arquitetura da Repressão: As Narrativas nos Inquéritos Policiais Militares. Em: III Encontro do GETHL: Política das Narrativas Políticas, p. 83-103, 2014.
SALES, S. ; FERREIRA, A. G. ; VARGAS, F. A.. Juventudes brasileiras na conexão entre as redes sociais e as escolas de ensino médio. Em: Congreso de la Asociación Latinoamericana de Sociología (ALAS), v. 1, p. 1-15, 2013.
Resumos expandidos publicados em anais de congressos (1)
VARGAS, F. A.; PARDO, T. A. S.. An Automatic Explicit and Implicit Opinion Clustering Tool for Portuguese. Em: 14th International Conference on the Computational Processing of Portuguese, 2020. Proceedings of the 14th PROPOR Software Demonstration Workshop. Évora, Portugal: ACM, v. 1, p. 1-3, 2020.
Resumos publicados em anais de congressos (0)
Artigos aceitos para publicação (0)
Apresentações de trabalho (16)
VARGAS, F. A. HausaHate: An Expert Annotated Corpus for Hausa Hate Speech Detection. 2024. Apresentação de Trabalho/Congresso
VARGAS, F. A. Improving Explainable Fact-Checking via Sentence-Level Factual Reasoning. 2024. Apresentação de Trabalho/Congresso
VARGAS, F. A. Socially Responsible Hate Speech Detection: Can Classifiers Reflect Social Stereotypes?. 2023. Apresentação de Trabalho/Congresso
VARGAS, F. A. Predicting Sentence-Level Factuality of News and Bias of Media Outlets. 2023. Apresentação de Trabalho/Congresso
VARGAS, F. A. NoHateBrazil: A Brazilian Portuguese Text Offensiveness Analysis System. 2023. Apresentação de Trabalho/Congresso
VARGAS, F. A. Rhetorical structure approach for online deception detection: a survey. 2022. Apresentação de Trabalho/Congresso
VARGAS, F. A. HateBR: A large expert annotated corpus of Brazilian Instagram comments for offensive language and hate speech detection. 2022. Apresentação de Trabalho/Congresso
VARGAS, F. A. Contextual-lexicon approach for abusive language detection. 2021. Apresentação de Trabalho/Congresso
VARGAS, F. A. Towards discourse-aware models for multilingual fake news detection. 2021. Apresentação de Trabalho/Congresso
VARGAS, F. A. Linguistic rules for fine-grained opinion extraction. 2020. Apresentação de Trabalho/Congresso
VARGAS, F. A. Studying dishonest intentions in Brazilian Portuguese texts. 2020. Apresentação de Trabalho/Congresso
VARGAS, F. A. Identifying fine-grained opinion and classifying polarity on coronavirus pandemic. 2020. Apresentação de Trabalho/Congresso
VARGAS, F. A. Clustering and hierarchical organization of opinion aspects: a corpus study. 2017. Apresentação de Trabalho/Comunicação
VARGAS, F. A. Agrupamento semântico de aspectos para mineração de opinião. 2017. Apresentação de Trabalho/Comunicação
VARGAS, F. A. Mineração de opiniões. 2016. Apresentação de Trabalho/Conferência ou palestra
VARGAS, F. A. Arquitetura da repressão: as narrativas nos inquéritos policiais militares. 2014. Apresentação de Trabalho/Seminário
Demais tipos de produção bibliográfica (1)
VARGAS, F. A. ; PARDO, THIAGO A.S.. Estudo empírico sobre agrupamento e organização hierárquica de aspectos para mineração de opinião. São Carlos - SP: Instituto de Ciências Matemáticas e de Computação. 2017. Relatório Técnico - ICMC/USP
Produção técnica
Programas de computador com registro (0)
Programas de computador sem registro (4)
VARGAS, F. A.; CARVALHO, I. ; BENEVENUTO, F.. NoHateBrazil: A Brazilian Portuguese text offensiveness analysis system. 2022.
VARGAS, F. A. OPCluster-PT 2.0: Automatic extraction and clustering of fine-grained opinions (web version). 2020.
VARGAS, F. A. OpCluster-PT : Automatic extraction and clustering of fine-grained opinions. 2017.
VARGAS, F. A.; BATISTA, M. H. S.. Repositório de aprendizagem sobre teoria dos autômatos, linguagens formais e computação. 2015; Tema: teoria da computação. 2015.
Produtos tecnológicos (0)
Processos ou técnicas (0)
Trabalhos técnicos (0)
Demais tipos de produção técnica (8)
VARGAS, F. A.; GUIMARAES, S. S. ; MUHAMMAD, S. H. ; ALVES, D. ; AHMAD, I. S. ; ABDULMUMIN, I. ; MOHAMED, D. ; PARDO, T. A. S. ; BENEVENUTO, F.. HausaHate: A benchmark dataset for Hausa hate speech detection. 2024. base de dados técnico-científica
SALLES, I. A. ; VARGAS, F. A. ; BENEVENUTO, F.. HateBRXplain: A benchmark dataset for explainable hate speech detection in Brazilian Portuguese. 2024. base de dados técnico-científica
VARGAS, F. A.; JAIDKA, K. ; PARDO, T. A. S. ; BENEVENUTO, F.. FactNews: Sentence-level annotated dataset to predict factually and media bias. 2023. base de dados técnico-científica
VARGAS, F. A.; CARVALHO, I. ; PARDO, T. A. S. ; BENEVENUTO, F.. MOL: Multilingual offensive lexicon annotated with contextual information. 2023. base de dados técnico-científica
VARGAS, F. A.; CARVALHO, I. ; GÓES, F. ; PARDO, T. A. S. ; BENEVENUTO, F.. HateBR: A Large-scale expert annotated dataset of Brazilian Instagram comments for hate speech detection. 2022. base de dados técnico-científica
VARGAS, F. A. OPCovidBR: An aspect-based annotated dataset of COVID-19 tweets for sentiment analysis in Portuguese. 2020. base de dados técnico-científica
VARGAS, F. A. Elaboração de questões para as avaliações de proficiência nacional do curso superior de Ciência da Computação. 2018. Desenvolvimento de material didático ou instrucional - Elaboração de Material Didático
VARGAS, F. A. Elaboração de questões para as avaliações de proficiência nacional do curso superior de Letras. 2017. Desenvolvimento de material didático ou instrucional - Elaboração de Material Didático
Produção artística
Total de produção artística (0)
Orientações em andamento
Supervisão de pós-doutorado (0)
Tese de doutorado (0)
Dissertação de mestrado (0)
Monografia de conclusão de curso de aperfeiçoamento/especialização (0)
Trabalho de conclusão de curso de graduação (0)
Iniciação científica (0)
Orientações de outra natureza (0)
Supervisões e orientações concluídas
Supervisão de pós-doutorado (0)
Tese de doutorado (0)
Dissertação de mestrado (0)
Monografia de conclusão de curso de aperfeiçoamento/especialização (0)
Trabalho de conclusão de curso de graduação (0)
Iniciação científica (1)
Lucas Sobral Fontes Cardoso. Web resources for an aspect identification and clustering tool in fine-grained opinion mining (Coorientadora). (Graduando em Bacharelado em Ciências de Computação) - Universidade de São Paulo, Outra. 2020. Orientadores: Thiago Alexandre Salgueiro Pardo, Francielle Alves Vargas.
Orientações de outra natureza (0)
Projetos de pesquisa
Total de projetos de pesquisa (6)
2024-2024. Google Latin America Research Awards (LARA) Descrição: Desenvolvimento das atividades relativas ao subprojeto intitulado: "Responsible and Explainable Fact-Checking through Fine-Grained Factual Reasoning". Tais atividades envolvem coleta de dados, experimentação e escrita de artigos científicos para apresentação de resultados.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Francielle Alves Vargas - Integrante / Fabrício Benevenuto - Coordenador. Membro: Francielle Alves Vargas.
2022-2023. MultiCrowsPairs: Measuring Social Biases in Mutilingual Masked Language Models (Sorbonne Université - LORIA) Descrição: Pretrained language models, especially masked language models (MLMs) have seen success across many NLP tasks. However, there is ample evidence that they use the cultural biases that are undoubtedly present in the corpora they are trained on, implicitly creating harm with biased representations. To measure some forms of social bias in language models against minority groups. To fill this relevant research gap, in this project we are creating the MultiCrowsPairs Stereotype Pairs benchmark (MultiCrows) multilingual dataset. MultiCrows has 1508 examples (short texts) that cover stereotypes dealing with nine types of bias, like race, religion, and age. We intend to build a model based on: (i) a pair of text that is more stereotyping and another pair of text that is less stereotyping. The data focuses on stereotypes about historically disadvantaged groups and contrasts them with advantaged groups.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Francielle Alves Vargas - Integrante / Karen Fort - Coordenador / aurelie neveo - Integrante / yoa dupont - Integrante / julien bezancon - Integrante / Laura Alonso Alemany - Integrante / wolfgang schmeisser - Integrante / sergio zanotto - Integrante / claudia borg - Integrante / margot mieskes - Integrante / Luciana Benotti - Integrante. Membro: Francielle Alves Vargas.
2020-2024. Towards Socially Responsible and Explainable Hate Speech Detection (University of São Paulo) Descrição: Hate speech have a surely negative impact on society especially in conflict-affected areas and politically polarized countries. In essence, there are longstanding and ingrained social, cultural, political, ethnic, religious or other divisions and rivalries fueling hate speech, boosted often by misinformation through a sophisticated unbelief system, including propaganda and conspiracy theories. In regard to this, a wide range of hate speech detection models have been proposed. Nevertheless, although Natural Language Processing (NLP), traditionally, have been mostly based on techniques that are inherently explainable (also known as white box techniques, such as rules-based algorithms, decision trees, hidden Markov models, logistic regressions, and others), after the advent and popularity of Large-Scale Language Models (LLMs) (also known as black box techniques), and the use of language embeddings as features, theses recent models becoming less interpretable. As a result, most existing hate speech detection models are not able to explain their decisions by providing relevant rationales (explanations) for their predictions. It highlights a lack of transparency posing unwanted risks as the prevalence of unintended biases, which has been recently identified as a major concern for the field. For example, social bias in hate speech technologies may reinforce discrimination against groups based on their social identity when propagated at scale. To fill these relevant gaps, this project introduces a study on hate speech detection language technologies and their potential ethical implications. Specifically, we aim propose methods for hate speech detection to ensure that the data, and models are explainable and socially responsible. Finally, we hope that our study, data resources and methods may boost hate speech research, mainly contributing to the ongoing discussion on responsible AI, explainability and interpretability, and fairness in natural language processing and machine learning.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Francielle Alves Vargas - Coordenador / Thiago Alexandre Salgueiro Pardo - Integrante / Ali Hürriyetoğlu - Integrante / Fabiana Góes - Integrante / Isabelle Carvalho - Integrante / Fabrício Benevenuto - Integrante / Kokil Jaidka - Integrante / wolfgang schmeisser - Integrante / diego alves - Integrante / Isadora Alves Salles - Integrante / Ameeta Agrawal - Integrante. Membro: Francielle Alves Vargas.
2018-2020. Opinion Mining for Portuguese: Concept-based Approaches and Beyond (University of São Paulo) Descrição: The OPINANDO project aims at investigating issues of concept-level analysis for the Brazilian Portuguese language. We are particularly interested on three main research fronts, namely: (i) the identification of relevant texts to mine, which includes tackling text importance and filtering deceptive content; (ii) the analysis of the selected texts, performing the necessary semantic and discourse analysis and identifying subjective content and the corresponding aspects and polarities; and (iii) the synthesis of the relevant information, using text summarization and generation strategies and dealing with the related challenges in these tasks.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Francielle Alves Vargas - Integrante / Thiago Alexandre Salgueiro Pardo - Coordenador. Membro: Francielle Alves Vargas.
2015-2017. Sumarização Automática Multidocumento para o Português: Novas Fronteiras (Universidade de São Paulo) Descrição: A Sumarização Automática Multidocumento (SAM) visa à criação de um único sumário (ou resumo, como mais comumente chamado) a partir de um conjunto de textos-fonte sobre um mesmo assunto. Com a enorme quantidade de informação disponível atualmente, principalmente on-line, a utilidade desse tipo de recurso é evidente. A SAM começou a ser investigada em meados dos anos 90 para a língua inglesa, e somente mais recentemente, a partir de meados da década passada, ela passou a ser alvo de investigações sistemáticas para a língua portuguesa. Com isso, atualmente há para o português corpora de referência para a SAM, ferramentas básicas de processamento e análise textual, e métodos de sumarização do estado da arte, que resultaram em recursos, ferramentas e aplicações amplamente disponíveis para a comunidade de pesquisa.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Francielle Alves Vargas - Integrante / Thiago Alexandre Salgueiro Pardo - Coordenador / Rafael Torres Anchíeta - Integrante / Márcio de Souza Dias - Integrante / Erick Galani Maziero - Integrante / Pedro Paulo Balage Filho - Integrante / Fernando Antônio Asevedo Nóbrega - Integrante / Roque E. López Condori - Integrante / Guilherme Gonçalves - Integrante / Antonio Aliberte A. Machado - Integrante. Membro: Francielle Alves Vargas. Descrição: A Sumarização Automática Multidocumento (SAM) visa à criação de um único sumário (ou resumo, como mais comumente chamado) a partir de um conjunto de textos-fonte sobre um mesmo assunto. Com a enorme quantidade de informação disponível atualmente, principalmente on-line, a utilidade desse tipo de recurso é evidente. A SAM começou a ser investigada em meados dos anos 90 para a língua inglesa, e somente mais recentemente, a partir de meados da década passada, ela passou a ser alvo de investigações sistemáticas para a língua portuguesa. Com isso, atualmente há para o português corpora de referência para a SAM, ferramentas básicas de processamento e análise textual, e métodos de sumarização do estado da arte, que resultaram em recursos, ferramentas e aplicações amplamente disponíveis para a comunidade de pesquisa. Neste projeto, objetiva-se dar continuidade a essa linha de pesquisa. Por um lado, visa-se dar continuidade ao desenvolvimento e aprimoramento de recursos linguístico-computacionais e ferramentas de análise textual, que são essenciais para o avanço na área de SAM; por outro, visa-se investigar as novas fronteiras da sumarização, já investigadas para outras línguas e ainda inéditas para o português, em particular, a sumarização de atualização e de opiniões. Na sumarização de atualização, busca-se criar sumários que narrem somente as informações desconhecidas/novas para o leitor, levando-se em conta, portanto, o conhecimento prévio deste; na sumarização de opinião, busca-se sintetizar diversos textos opinativos sobre determinados objetos, como produtos eletrônicos, de forma a apoiar possíveis decisões e avaliações de usuários. Se, na primeira frente, a sumarização de atualização consiste em um desafio metodológico que dá continuidade ao que se tem feito na SAM para o português, na outra frente, tem-se em vista tanto a pesquisa como a aplicação para o usuário final. Acredita-se que, além da formação de recursos humanos e da criação de uma massa crítica de pesquisadores na área, tão pequena no Brasil, esse projeto tem potencial de trazer contribuições significativas para a área como um todo pela proposta de metodologias inovadoras.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (3) / Doutorado: (6) . Integrantes: Thiago Alexandre Salgueiro Pardo - Coordenador / Pedro Paulo Balage Filho - Integrante / Erick Galani Maziero - Integrante / Paula Christina Figueira Cardoso - Integrante / Fernando Antônio Asevedo Nóbrega - Integrante / Márcio de Souza Dias - Integrante / Roque E. López Condori - Integrante / Guilherme Gonçalves - Integrante / Antonio Aliberte A. Machado - Integrante / Francielle Alves Vargas - Integrante / Rafael Torres Anchiêta - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Membro: Thiago Alexandre Salgueiro Pardo.
2013-2014. Lexicologia Social Aplicada à Realidade Brasileira: Período da Ditadura (1964-1985) (Universidade Federal de Minas Gerais) Descrição: Analisar o vocabulário de documentos produzidos por diferentes setores no período da ditadura no Brasil (1964-1985) para identificar neologismos e procurar a motivação sócio-histórica para seu surgimento.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (8) / Doutorado: (1) . Integrantes: Francielle Alves Vargas - Integrante / César Nardelli Cambraia - Coordenador / Paula Carvalho Tavares - Integrante / Thaynara Nascimento Santos - Integrante / Danívia da Cunha Mattozo - Integrante / Sandro Marcio Drumond Alves - Integrante / Beatriz Fusco Nogueira Simões - Integrante / Lucas de Lima Pinto - Integrante / Silvana Cristina Romero - Integrante / Lívia Elisa Lemos Melo - Integrante / Davi Pereira da Silva Ribeiro - Integrante. Membro: Francielle Alves Vargas.
Destaque acadêmico na XVII Semana de Graduação, UFMG Conhecimento e Cultura.. 2013. Membro: Francielle Alves Vargas.
Menção Honrosa na XVI Encontro de Extensão, UFMG Conhecimento e Cultura.. 2013. Membro: Francielle Alves Vargas.
Relevância Acadêmica e Menção Honrosa na XVI Semana de Graduação, UFMG Conhecimento e Cultura.. 2012. Membro: Francielle Alves Vargas.
Participação em eventos
Total de participação em eventos (25)
7th Fact Extraction and VERification Workshop (FEVER@EMNLP). 2024. (Congresso).
8th Workshop on Online Abuse and Harms (WOAH@NAACL). 2024. (Congresso).
The 2024 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL). 2024. (Congresso).
The 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2024. (Congresso).
14th International Conference on Recent Advances in Natural Language Processing (RANLP). 2023. (Congresso).
17th International AAAI Conference on Web and Social Media (ICWSM). 2023. (Congresso).
4th Workshop on Computational Approaches to Discourse (CODI@ACL). 2023. (Congresso).
61st Annual Meeting of the Association for Computational Linguistics (ACL). 2023. (Congresso).
7th Workshop on Online Abuse and Harms (WOAH@ACL). 2023. (Congresso).
13th International Conference on Language Resources and Evaluation (LREC). 2022. (Congresso).
16th International AAAI Conference on Web and Social Media (ICWSM). 2022. (Congresso).
3rd Workshop on Computational Approaches to Discourse (CODI@EMNLP). 2022. (Congresso).
13th International Conference on Recent Advances in Natural Language Processing (RANLP). 2021. (Congresso).
15th International AAAI Conference on Web and Social Media (ICWSM). 2021. (Congresso).
2nd Workshop on Computational Approaches to Discourse (CODI@EMNLP 2021). 2021. (Congresso).
14th International AAAI Conference on Web and Social Media (ICWSM). 2020. (Congresso).
1st Workshop on Computational Approaches to Discourse (CODI@EMNLP). 2020. (Congresso).
58th Annual Meeting of the Association for Computational Linguistics (ACL). 2020. (Congresso).
5th International Workshop on Social Sensing: Special Edition on Narrative Analysis on Social Media (SocialSens@ICWSM). 2020. (Congresso).
9th Brazilian Conference on Intelligent Systems (BRACIS). 2020. (Congresso).
The 2020 Conference for Truth and Trust Online (TTO). 2020. (Congresso).
The 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2020. (Congresso).
9th Escola Brasileira de Linguística Computacional (EBRALC). 2017. (Congresso).
29th Congresso Latino Americano de Sociología - Crisis e Emergencias Sociales en America Latina (ALAS ). 2013. (Congresso).
4th Simpósio Internacional de Letras e Linguística (SILEL). 2013. (Simpósio).
Organização de eventos
Total de organização de eventos (9)
VARGAS, F. A.. 9th Workshop on Online Abuse and Harms (WOAH @ ACL 2025). 2025. (Congresso).. . 0.
VARGAS, F. A.. Explainable Deep Neural Networks for Responsible AI: Post-Hoc and Self-Explaining Approaches (DeepXplain @ IJCNN 2025). 2025. (Congresso).. . 0.
VARGAS, F. A.. Extended Multimodal Hate Speech Event Detection During Russia-Ukraine Crisis - Shared Task (CASE @ EACL 2024). 2024. (Congresso).. . 0.
VARGAS, F. A.. 6th International Workshop Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE @ RANLP 2023). Steering Committee. 2023. (Congresso).. . 0.
VARGAS, F. A.. Multimodal Hate Speech Event Detection - Shared Task (CASE @ RANLP 2023). 2023. (Congresso).. . 0.
VARGAS, F. A.. 17th International Conference on Web and Social Media (ICWSM'23). Dataset Co-chair. 2023. (Congresso).. . 0.
VARGAS, F. A.. 16th International Conference on Web and Social Media (ICWSM'22). Accessibility Chair. 2022. (Congresso).. . 0.
VARGAS, F. A.. 5th International Workshop Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE @ EMNLP 2022). Steering Committee. 2022. (Congresso).. . 0.
VARGAS, F. A.. 15th International Conference on Web and Social Media (ICWSM'21). Diversity, Equity, & Inclusion Chair. 2021. (Congresso).. . 0.
VARGAS, FRANCIELLE ; CARVALHO, ISABELLE ; PARDO, THIAGO A. S. ; BENEVENUTO, FABRÍCIO. Context-Aware and Expert Data Resources for Brazilian Portuguese Hate Speech Detection. Natural Language Engineering. v. 1, p. 1-22, issn: 1469-8110, 2024.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Hierarchical clustering of aspects for opinion mining: a corpus study. Em: Maria José Bocorny Finatto; Rozane Rodrigues Rebechi; Ana Eliza Pereira Bocorny; Simone Sarmento. (Org.). Linguística de Corpus: Perspectivas. 1ed.Porto Alegre. : Instituto de Letras da UFRGS. 2018.v. 1, p. 69-92.
VARGAS, FRANCIELLE ; GUIMARÃES, SAMUEL ; MUHAMMAD, SHAMSUDDEEN HASSAN ; ALVES, DIEGO ; AHMAD, IBRAHIM SAID ; ABDULMUMIN, IDRIS ; MOHAMED, DIALLO ; PARDO, THIAGO ; BENEVENUTO, FABRÍCIO. HausaHate: An Expert Annotated Corpus for Hausa Hate Speech Detection. Em: Proceedings of the 8th Workshop on Online Abuse and Harms (WOAH 2024), p. 52-58, 2024.
VARGAS, FRANCIELLE ; SALLES, I. ; ALVES, D. ; AGRAWAL, A. ; PARDO, THIAGO A.S. ; BENEVENUTO, FABRÍCIO. Improving Explainable Fact-Checking via Sentence-Level Factual Reasoning. Em: Seventh Fact Extraction and VERification Workshop (FEVER), v. 1, p. 192-204, 2024.
VARGAS, F. A. ; CARVALHO, I. ; SCHMEISSER-NIETO, W. ; BENEVENUTO, F. ; PARDO, THIAGO A. S.. NoHateBrazil: A Brazilian Portuguese Text Offensiveness Analysis System. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1180-1186, 2023.
VARGAS, F. A. ; CARVALHO, I. ; HURRIYETOGLU, A. ; PARDO, THIAGO A.S. ; BENEVENUTO, F.. Socially Responsible Hate Speech Detection: Can Classifiers Reflect Social Stereotypes?. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1187-1196, 2023.
VARGAS, F. A. ; JAIDKA, K. ; PARDO, THIAGO A. S. ; BENEVENUTO, F.. Predicting Sentence-Level Factuality of News and Bias of Media Outlets. Em: 14th Conference on Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1197-1206, 2023.
VARGAS, F. A. ; D?ALESSANDRO, J. ; RABINOVICH, Z. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Rhetorical Structure Approach for Online Deception Detection: A Survey. Em: 13th Edition of the Language Resources and Evaluation Conference (LREC), v. 1, p. 5906-5915, 2022.
VARGAS, F. A. ; GOES, F. ; CARVALHO, I. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Contextual-Lexicon Approach for Abusive Language Detection. Em: Recent Advances in Natural Language Processing (RANLP), v. 1, p. 1442-1451, 2021.
VARGAS, F. A. ; BENEVENUTO, F. ; PARDO, THIAGO A.S.. Toward Discourse-Aware Models for Multilingual Fake News Detection. Em: Recent Advances in Natural Language Processing, v. 1, p. 210-218, 2021.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Linguistic Rules for Fine-Grained Opinion Extraction. Em: 5th International Workshop on Social Sensing: Special Edition on Narrative Analysis on Social Media, v. 1, p. 1-6, 2020.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Aspect Clustering Methods for Sentiment Analysis. Em: 13th International Conference on the Computational Processing of Portuguese (PROPOR), v. 11122, p. 365-374, 2018.
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
VARGAS, F. A. ; PARDO, THIAGO A.S.. Estudo empírico sobre agrupamento e organização hierárquica de aspectos para mineração de opinião. São Carlos - SP: Instituto de Ciências Matemáticas e de Computação. 2017. Relatório Técnico - ICMC/USP
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.