CVNLP PPI: Residência em TIC 13 - Heterogeneous Computing for Computational Vision and Natural Language Processing - Programas e Projetos Prioritários (PPI) - MCTI, Softex

Sandra Maria Aluísio

Sandra Maria Aluisio possui Bacharelado em Ciência da Computação pela Universidade Federal de São Carlos (1986), Mestrado em Ciência da Computação pela Universidade de São Paulo (1989) e Doutorado em Inteligência Artificial, mais especificamente, Processamento de Língua Natural, pela Universidade de São Paulo (1995). As áreas de pesquisa, colaborações e orientação são: Linguística de Córpus, PoS Tagging, Simplificação Textual, Anotação de Papéis Semânticos e Criação de Recursos Semânticos, Detecção Automática da Estrutura do Discurso Científico e Ferramentas de Suporte à Escrita, Extração Automática de Termos, Testes Computadorizados, Sistemas de Perguntas & Respostas, Reconhecimento de Inferência Textual, Raciocínio Baseado em Casos, Análise Automática de Distúrbios de Linguagem nas Demências, Reconhecimento de Fala e Inteligibilidade (Readability) Textual e Sentencial. Foi docente e pesquisadora, de 1988 a agosto de 2018, no Instituto de Ciências Matemáticas e da Computação, da Universidade de São Paulo (USP) em São Carlos, onde hoje atua no Programa Professor Sênior. (Texto informado pelo autor)

  • http://lattes.cnpq.br/4793072701914550 (12/12/2024)
  • Rótulo/Grupo: Orientador
  • Bolsa CNPq:
  • Período de análise:
  • Endereço: Universidade de São Paulo, Instituto de Ciências Matemáticas e de Computação, Departamento de Ciências da Computação. ICMC-USP - CP 668 Centro 13560-970 - Sao Carlos, SP - Brasil - Caixa-postal: 668 Telefone: (16) 2739663 URL da Homepage: www.icmc.usp.br
  • Grande área: Ciências Exatas e da Terra
  • Área: Ciência da Computação
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (18)
    1. 2023-Atual. Computação Heterogênea para Visão Computacional e Processamento de Linguagem Natural
      Descrição: Trata-se de um projeto de pesquisa no âmbito das Ciências da Computação, em subáreas inter-relacionadas de grande destaque atual e de interesse acadêmico e industrial, a saber: Processamento de Imagens e Processamento de Linguagem Natural. Com a análise, a modelagem e o tratamento computacional de dados de imagens e de língua, prevê-se o avanço da fronteira de conhecimento nessas frentes e, consequentemente, das aplicações relacionadas a essas duas modalidades complementares de dados. Financiador(es): Sociedade para Promoção da Excelência do Software Brasileiro - Auxílio financeiro.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Sandra Maria Aluísio - Coordenador / Marcelo Finger - Integrante / Solange Oliveira Rezende - Integrante / Thiago Alexandre Salgueiro Pardo - Integrante / Arnaldo Candido Junior - Integrante / Ariani Di Felippo - Integrante / Moacir Antonelli Ponti - Integrante / Ricardo Marcondes Marcacini - Integrante / Fabio Gagliardi Cozman - Integrante / Roberto Marcondes Cesar Junior - Integrante / Miguel Oliveira Junior - Integrante / Norton T. Roman - Integrante / Roberto Hirata Junior - Integrante / Nina Sumiko Tomita Hirata - Integrante.
      Membro: Sandra Maria Aluísio.
      Descrição: Projeto de Pesquisa Desenvolvimento e Inovação (PD\&I) em Tecnologia de Informática e Comunicação (TIC), no âmbito dos programas e projetos de interesse nacional na área de informática e automação considerados prioritários (PPI) pelo Comitê da Área de Tecnologia da Informação -- CATI, do Ministério da Ciência, Tecnologia e Inovações, com recursos da Lei nº 8.248/91. Trata-se assim de um projeto de pesquisa no âmbito das Ciências da Computação (Convênio USP 1014984, Processo 22.1.13242.01.0), em Processamento de Imagens e Processamento de Língua Natural.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Norton Trevisan Roman - Integrante / Thiago Alexandre Salgueiro Pardo - Coordenador / Ariani Di Felippo - Integrante.
      Membro: Norton Trevisan Roman.
      Situação: Em andamento; Natureza: Pesquisa. Integrantes: Nina Sumiko Tomita Hirata - Integrante / Roberto Marcondes Cesar Junior - Coordenador / Roberto Hirata Junior - Integrante / Thiago Salgueiro Pardo - Integrante. Financiador(es): Sociedade para Promoção da Excelência do Software Brasileiro - Auxílio financeiro.
      Membro: Nina Sumiko Tomita Hirata.
      Descrição: Trata-se de um projeto de pesquisa no âmbito das Ciências da Computação, em subáreas inter-relacionadas de grande destaque atual e de interesse acadêmico e industrial, a saber: Processamento de Imagens e Processamento de Língua Natural. Com a análise, a modelagem e o tratamento computacional de dados de imagens e de língua, prevê-se o avanço da fronteira de conhecimento nessas frentes e, consequentemente, das aplicações relacionadas a essas duas modalidades complementares de dados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Ariani Di Felippo - Coordenador / Thiago Alexandre Salgueiro Pardo - Integrante / Sandra Maria Aluísio - Integrante / Arnaldo Cândido Jr. - Integrante / Solange Oliveira Rezende - Integrante / Ricardo Marcondes Marcacini - Integrante / Norton Trevisan Roman - Integrante / Fabio Gagliardi Cozman - Integrante / Roberto Marcondes Cesar Junior - Integrante / Miguel Oliveira Junior - Integrante / Moacir Antonelli Ponti - Integrante / Marcelo Finger - Integrante / Roberto Hirata Junior - Integrante / Nina Sumiko Tomita Hirata - Integrante. Financiador(es): Sociedade para Promoção da Excelência do Software Brasileiro - Auxílio financeiro.
      Membro: Ariani Di Felippo.
    2. 2022-Atual. Transcrição Automática de Áudios anotada com Tópicos: uma aplicação nas Histórias de Vida do Museu da Pessoa
      Descrição: Formalização de uma parceria com o Instituto Museu da Pessoa (Museu da Pessoa) - https://museudapessoa.org/) para receber a cessão de um banco de vozes de 300 horas de histórias de vida que serão usadas para desenvolver e avaliar três métodos computacionais sendo explorados no C4AI: (i) segmentação de áudios em elocuções de natureza prosódica, (ii) transcrição automática via Reconhecimento Automático de Fala, e (iii) anotação automática de tópicos para trechos transcritos. Os métodos serão usados em diversos aplicativos que serão desenvolvidos futuramente pelo Museu da Pessoa, além de serem usados nas versões do aplicativo de demonstração, resultante do convênio.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (1) . Integrantes: Sandra Maria Aluísio - Coordenador / Edresson Casanova - Integrante / Ricardo Marcacini - Integrante / Odilon Gonçalves - Integrante / Marcos Terra - Integrante / Anderson Soares - Integrante / Arnaldo Cândido Jr. - Integrante / Lucas Gris - Integrante / Solange Rezende - Integrante.
      Membro: Sandra Maria Aluísio.
    3. 2020-2022. SPIRA: Sistema de detecção Precoce de Insuficiência Respiratória por meio de análise de Áudio
      Descrição: O objetivo deste estudo é desenvolver uma ferramenta que possa detectar precocemente as pessoas com insuficiência respiratória devido a COVID-19 usando dados de fala. Para tanto iremos coletar registros em áudio de pessoas infectadas bem como de pessoas normais, a fim de explorar diferenças associadas à saturação de O2 e à frequência respiratória que permitam distinguir os dois grupos. A ferramenta de classificação automática proposta será baseada em técnicas de inteligência artificial, processamento de sinais e aprendizado de máquina, e servirá inicialmente para facilitar a triagem de pacientes que precisam procurar auxílio médico-hospitalar. Numa segunda etapa, a ferramenta poderá ajudar sistemas de telemedicina a monitorar pacientes de forma contínua, permitindo o acompanhamento da evolução de pacientes internados. Website: https://spira.ime.usp.br/coleta/. Suporte: FAPESP.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (3) / Doutorado: (4) . Integrantes: Sandra Maria Aluísio - Integrante / Marcelo Finger - Coordenador / Arnaldo Candido Junior - Integrante / Anna Sara Levin Shafferman - Integrante / Ester Cerdeira Sabino - Integrante / Alfredo Goldman - Integrante / Flaviane R. Fernandes Svartma - Integrante / Marcelo Gomes de Queiróz - Integrante.
      Membro: Sandra Maria Aluísio.
      Descrição: O objetivo deste estudo é desenvolver uma ferramenta que possa detectar precocemente as pessoas com insuficiência respiratória devido a COVID-19 usando dados de fala. Para tanto iremos coletar registros em áudio de pessoas infectadas bem como de pessoas normais, a fim de explorar diferenças associadas à saturação de O$_2$ e à frequência respiratória que permitam distinguir os dois grupos.A ferramenta de classificação automática proposta será baseada em técnicas de inteligência artificial, processamento de sinais e aprendizado de máquina, e servirá inicialmente para facilitar a triagem de pacientes que precisam procurar auxílio médico-hospitalar. Numa segunda etapa, a ferramenta poderá ajudar sistemas de telemedicina a monitorar pacientes de forma contínua, permitindo o acompanhamento da evolução de pacientes internados.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (3) / Doutorado: (4) . Integrantes: Marcelo Finger - Coordenador / Alfredo Goldman - Integrante / Sandra Maria Aluísio - Integrante / Marcelo Gomes de Queiroz - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Marcelo Finger.
      Descrição: O objetivo deste estudo é desenvolver uma ferramenta que possa detectar precocemente as pessoas com insuficiência respiratória devido a COVID-19 usando dados de fala. Para tanto iremos coletar registros em áudio de pessoas infectadas bem como de pessoas normais, a fim de explorar diferenças associadas à saturação e à frequência respiratória que permitam distinguir os dois grupos. A ferramenta de classificação automática proposta será baseada em técnicas de inteligência artificial, processamento de sinais e aprendizado de máquina, e servirá inicialmente para facilitar a triagem de pacientes que precisam procurar auxílio médico-hospitalar. Numa segunda etapa, a ferramenta poderá ajudar sistemas de telemedicina a monitorar pacientes de forma contínua, permitindo o acompanhamento da evolução de pacientes internados. Processo FAPESP 2020/06443-5.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Arnaldo Candido Junior - Integrante / Marcelo Finger - Coordenador.
      Membro: Arnaldo Candido Junior.
    4. 2020-Atual. TaRSila -- Reconhecimento Automático de Fala e Síntese de Fala no Centro de ia (C4AI)
      Descrição: The project TaRSila aims at growing speech datasets for Brazilian Portuguese language, looking to achieve state-of-the-art results for the following tasks: (a) automatic speech recognition (ASR) that automatically transcribes speech; (b) multi-speaker synthesis (TTS) that generates several voices from different speakers; (c) speaker identification/verification that selects a speaker from a set of predefined members (speakers seen during the training of the models --- called closed-set scenario --- or in open-set scenario in which the verification occurs with speakers not seen during the training of the models); and (d) voice cloning that uses a few minute/second voice dataset to train a voice model with synthesis methods, which can read any text in the target voice. In TaRSila, we are manually validating speech datasets of academic projects such as: (i) Nurc-Recife (OLIVEIRA JR, 2016); (ii) SP 2010 (MENDES, 2013); (iii) ALIP (GONÇALVES, 2019); and (iv) C-ORAL Brasil (RASO & MELLO, 2012). A collection of life-stories of the Museu da Pessoa (MuPe) is currently being negotiated to be part of our large corpus CORAA (COrpus de Aúdios Anotados) and NURC-SP is under preprocessing (audio-transcription alignment and automatic transcription) to start the human annotation and validation for the purpose of training ASR models. Regarding the tools, we aim to investigate recent deep learning methods for training robust ASR and TTS models for Portuguese. The project also foresees applications in semantic search from speech transcriptions, as well as sentiment analysis and automatic organization of speech datasets into topics. This project is part of the Natural Language Processing initiative (NLP2) of the Center for Artificial Intelligence (C4AI) of the University of São Paulo, sponsored by IBM and FAPESP (grant #2019/07665-4). The center is part of the FAPESP Engineering Research Centers Program and is committed to state-of-the-art research in Artificial Intelligence, exploring both foundational issues and applied research. This project was also funded by CEIA with support by the Goiás State Foundation (FAPEG grant \#201910267000527) (http://centrodeia.org/), Department of Higher Education of the Ministry of Education (SESU/MEC), Copel Holding S.A. (www.copel.com), and Cyberlabs Group (https://cyberlabs.ai/). CEIA was responsible for paying the annotation team composed of 63 students from October 2020 to November 2021. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (13) / Mestrado acadêmico: (1) / Doutorado: (2) . Integrantes: Sandra Maria Aluísio - Coordenador / Arnaldo Candido Junior - Integrante / Edresson Casanova - Integrante / Moacir Antonelli Ponti - Integrante / Alessandra Alaniz Macedo - Integrante / Flaviane Romani Fernandes Svartman - Integrante / Heliana Mello - Integrante / José Augusto Baranauskas - Integrante / Livia Oushiro - Integrante / Marli Quadros Leite - Integrante / Miguel Oliveira Jr. - Integrante / Ricardo Marcondes Marcacini - Integrante / Ronald Beline Mendes - Integrante / Sebastião Carlos Leite Gonçalves - Integrante / Solange Oliveira Rezende - Integrante / Tommaso Raso - Integrante.
      Membro: Sandra Maria Aluísio.
    5. 2019-2021. RASTROS: Um grande corpus com medidas de RASTReamento Ocular e normas de previsibilidade durante a leitura de estudantes do ensino Superior no Brasil
      Descrição: Currently, eye tracking corpora are often used in studies of language structure processing costs to, for example, (i) evaluate models and metrics of syntactic difficulty, (ii) improve or evaluate computational models of simplification via sentential compression, and (iii) evaluate the quality of machine translation with objective metrics. However, there are only few of these corpora for a small number of languages, for example: English (Luke and Christianson, 2018; Cop et al., 2017), English and French (Kennedy et al., 2013), German (Kliegl et al.., 2004), Russian (Laurinavichyute et al., 2018), Hindi (Husain et al., 2015) and Chinese (Yan et al., 2010). For Portuguese, there is no large eye tracking corpus with predictability norms like those mentioned above. This is a gap that hinders the advance of research in the areas of Cognitive Psychology, Psycholinguistics and Natural Language Processing (NLP) in Portuguese. In this project, we have two objectives: (i) to create and make publicly available a large corpus with eye tracking movements of short paragraphs during silent reading in Portuguese, by undergraduate students in Brazil, together with predictability norms that estimate the predictability of orthographic form, morphosyntactic and semantic information for each word in the paragraph, via a Cloze test, and (ii) to contribute to the dissemination of research using the eye movement techniques in the Psycholinguistics and PLN research areas. The methodology for developing the RastrOS corpus follows the same steps of the Provo project (Luke and Christianson, 2018), which used: (i) short paragraphs of various genres; (ii) the reading of 55 paragraphs for the eye tracking test and 5 paragraphs for the Cloze test; and (iii) each word of the corpus being read by at least 40 students. For RastrOS, the 50 paragraphs of the corpus were taken from various sources in journalistic, literary and popular science genres, at a rate of 40% for newspaper articles, 20% for literary texts and 40% for popular science communication. The 50 paragraphs were selected from a corpus larger than 100 paragraphs to account for the greatest diversity of linguistic factors relevant for processing cost assessment, reflected in the reading process: structural complexity of the period (simple vs. compound periods); verbal transitivity; sentence types (active / passive / relative); mechanisms of construction of correlation relations, among others. RastrOS uses a highly accurate eye-tracker - the EyeLink 1000 Desktop. Stimulus presentations were done by Experiment Builder software, data processing has been done by Data Viewer. We are evaluating 4 semantic similarity methods: (i) LSA (Landauer e Dumais 1997) and (ii) BERT (Devlin et al., 2019) trained with the corpus brWaC (Wagner Filho et al., 2018), (iii) Word2vec (Mikolov et al., 2013) and (iv) FastText (Bojanowski, et al., 2017) trained with the corpus PUC-RS that includes brWaC, BlogSet-BR (Santos et al., 2018) and a Brazilian Portuguese Wikipedia dump from March 2019. The words are annotated with morphosyntactic categories of the PALAVRAS parser (https://visl.sdu.dk/) with human revision.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) Doutorado: (1) . Integrantes: Sandra Maria Aluísio - Coordenador / Maria da Graça Pimentel - Integrante / Gustavo Henrique Paetzold - Integrante / Elisângela Nogueira Teixeira - Integrante / Erica dos Santos Rodrigues - Integrante / Renê Alberto Moritz da Silva e Forster - Integrante / Katerina Lukasova - Integrante / Maria Teresa Carthery-Goulart - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Sandra Maria Aluísio.
    6. 2019-2020. LexPorBr Infantil
      Descrição: LexPorBr Infantil: Compilação de um corpus tripartido (textos didáticos para serem lidos por crianças, textos ouvidos por crianças em filmes e series infantis e textos escritos por crianças em competições de redações) e disponibilização pública via interface online com métricas para pesquisas da área de psicolinguística, linguística computacional, dentre outras. Joint Project involving researchers of ICMC/USP, UFABC, UFPB.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Doutorado: (1) . Integrantes: Sandra Maria Aluísio - Coordenador / Nathan Siegle Hartmann - Integrante / Katerina Lukasova - Integrante / Maria Teresa Carthery-Goulart - Integrante / Gustavo Estivalet - Integrante / Vanessa Marquiafável SERRANI - Integrante.
      Membro: Sandra Maria Aluísio.
    7. 2015-2020. ANAA-Dementia: Aplicação de testes neuropsicológicos automatizados para acompanhamento de cidadãos brasileiros durante o percurso de uma vida
      Descrição: O objetivo do projeto é criar um avaliador neuropsicológico pessoal automatizado e acessível pela internet ou por dispositivos móveis, para detectar demências, tais como o comprometimento cognitivo leve (CCL). Esse indicador é considerado o estágio pré-clínico do mal de Alzheimer, em que a doença ainda é reversível.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Doutorado: (1) . Integrantes: Sandra Maria Aluísio - Coordenador. Financiador(es): GOOGLE/Fundep/Google Research Grant - Bolsa. Número de produções C, T & A: 1
      Membro: Sandra Maria Aluísio.
    8. 2015-2020. Aging@Brazil Novos paradigmas, escalabilidade e aplicações relacionadas ao diagnóstico e monitoramento automatizados no envelhecimento: avaliação das relações entre idosos saudáveis e com comprometimento cognitivo
      Descrição: A doença de Alzheimer (DA) é a forma mais comum de demência. Ele gera déficits cognitivos graves o suficiente para interferir na vida diária de um indivíduo. Também cresce em importância uma síndrome menos conhecida, chamada Comprometimento Cognitivo Leve (CCL); seu tipo mais frequente (o CCL amnéstico) tem a maior taxa de conversão para a DA (15% ao ano, contra 1-2% da população total). Estudos recentes têm reconhecido a heterogeneidade da DA e do CCL, o que aumenta a relevância da análise de outras habilidades cognitivas, como a linguagem, além de avaliar a memória. A avaliação de linguagem vê na produção discursiva uma alternativa atraente, principalmente nas narrativas, uma vez que é uma forma natural de comunicação e favorece a observação da funcionalidade do paciente na vida cotidiana. No entanto, a análise de amostras de fala, quando conduzida manualmente, é uma tarefa subjetiva, demorada, e difícil para se tornar escalável para atender uma grande demanda de pessoas idosas. Para resolver este problema, este projeto propõe uma nova infraestrutura computacional para apoiar e-Science em dados clínicos para detectar sinais precoces de demência, incluindo ferramentas de Processamento de Línguas Naturais e métodos de Aprendizado de Máquina (AM) para processar dados de fala de narrativas. Além disso, o projeto irá realizar uma avaliação neuropsicológica multicêntrica em tablets e armazenar diretamente os resultados em bancos de dados na nuvem. Também irá produzir versões validadas em Português de baterias largamente utilizadas em avaliações cognitivas como a UDS, os testes do reconto da ABCD e a mini-ACE. Quanto aos métodos, Redes Neurais Profundas serão fortemente usadas para analisar dados de fala, texto, sinais e imagem. Redes Complexas irão fornecer uma nova representação para as narrativas para a geração de novas métricas para os métodos de AM classificarem os pacientes controles, CCLs e DAs. Finalmente, os testes de reconto serão modelados como uma variação da tarefa de Reconhecimento de Implicação Textual (RIT) em que o reconhecimento de proposições é automatizado por métodos de alinhamento monolíngue, seguido por um estágio de RIT.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (2) . Integrantes: Sandra Maria Aluísio - Coordenador / Letícia Mansur - Integrante / Lilian Hubner - Integrante / Andre Carvalho - Integrante / Sonia Brucki - Integrante.
      Membro: Sandra Maria Aluísio.
    9. 2015-2018. ADEQUAÇÃO LINGUÍSTICA DE TEXTOS NÃO-FICCIONAIS EM NÍVEIS CRESCENTES DE DIFICULDADE
      Descrição: Os grandes focos de alcance do projeto são: (1) Definição das características linguísticas de textos não-ficcionais a serem lidos por crianças do 3º ao 7º ano escolar do Ensino Fundamental, que darão base aos níveis de dificuldade de leitura, e criação do córpus de estudo; (2) Classificação Automática de Complexidade de Textos não-ficcionais em níveis crescentes de dificuldades do Ensino Fundamental; e (3) Desenvolvimento de Métodos de Elaboração Lexical e Simplificação Léxica e Sintática embutidos em editores dedicados a níveis de dificuldade, visando à escrita de textos personalizados a alunos do Ensino Fundamental. Avaliação se os textos criados com ajuda das operações de simplificação e elaboração propostas melhoram as características de inteligibilidade dos textos para um dado nível de dificuldade e interferem positivamente nas habilidades de leitura, isto é, numa melhora da compreensão do texto, utilizando métodos da Teoria de Resposta ao Item unidimensional.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Doutorado: (2) . Integrantes: Sandra Maria Aluísio - Coordenador / Mariana Curi - Integrante. Financiador(es): GUTEN EDUCAÇÃO E TECNOLOGIA LTDA - Auxílio financeiro. Número de produções C, T & A: 1
      Membro: Sandra Maria Aluísio.
    10. 2015-2017. MAP: Aprendizado de Máquina: uma abordagem baseada em múltiplas estratégias
      Descrição: Esse projeto diz respeito a uma pesquisa conjunta em que técnicas de Aprendizado de Máquina (AM), com ênfase em uma abordagem baseada em múltiplas estratégias. De uma perspectiva da abordagem baseada em múltiplas estratégias, os objetivos são estudar \textit{trade-offs} entre diferentes estratégias de aprendizado e desenvolver sistemas de aprendizado que empregam múltiplas estratégias de inferência ou paradigmas computacionais em um processo de aprendizado. Como consequência, sistemas baseados em múltiplas estratégias têm o potencial de serem aplicáveis a um vasto grupo de problemas. A maioria dos problemas abordados será no contexto de aprendizado não supervisionado, ou análise de agrupamento. Por exemplo, nos iremos analisar a sinergia e os trade-offs entre agrupamento com restrições por programação com restrições (grupo francês) e agrupamento evolutivo multi-objetivo (grupo brasileiro). Os aspectos práticos das técnicas propostas serão abordados, por exemplo, no contexto de mineração e modelagem de dados biológicos, provenientes de texto e temporais. Outro importante objetivo do projeto é estimular a cooperação internacional reunindo pesquisadores brasileiros e Francês para a troca de idéias e experiências. Os grupos do Brasil e da França já possuem um histórico de colaboração que pode ser fortalecida com este projeto.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (10) . Integrantes: Sandra Maria Aluísio - Integrante / Katti Faceli - Integrante / Marcílio Souto - Integrante / Teresa Ludermir - Integrante / Renata M.C.R. de Souza - Integrante / Mariá Cristina Nascimento - Integrante / Ana Carolina Lorena - Integrante / Tiemi Sakata - Integrante / Gustavo Batista - Integrante / Andre Ponce de Leon Carvalho - Coordenador.
      Membro: Sandra Maria Aluísio.
    11. 2013-2015. Portal Min@s: corpora de fala e escrita
      Descrição: O projeto visa, por meio de um trabalho conjunto de especialistas em estudos da linguagem, linguística computacional e ciências da computação, desenvolver e implementar um portal integrado de corpora de fala e escrita com funcionalidades de uso de caráter inovador.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . Integrantes: Sandra Maria Aluísio - Coordenador / Helena de Medeiros Caseli - Integrante / Thiago Lima Vieira - Integrante / Leandro Henrique Mendonça de Oliveira - Integrante / Arnaldo Candido Junior - Integrante / Michelle Mendonça - Integrante / Célia Maria Magalhães - Integrante / Jânia Martins Ramos - Integrante / Adriana Pagano - Integrante / Fabio Alves - Integrante / Thais Cristófaro Silva - Integrante.
      Membro: Sandra Maria Aluísio.
      Descrição: O projeto visa, por meio de um trabalho conjunto de especialistas em estudos da linguagem, linguística computacional e ciências da computação, desenvolver e implementar um portal integrado de corpora de fala e escrita com funcionalidades de uso de caráter inovador, a fim de potencializar os recursos e a capacidade instalada do Programa de Pós-graduação em Estudos Linguísticos da Faculdade de Letras da UFMG com o objetivo de dar visibilidade nacional e internacional a resultados de pesquisas realizadas no âmbito do Programa. Pautada num planejamento estratégico que contempla desenvolvimento científico e tecnológico, formação de recursos humanos e intercâmbio interinstitucional, a proposta consolida os percursos de quatro Laboratórios associados da FALE/UFMG através da integração de seus bancos de dados, realizada com o suporte de especialistas do NILC/USP e em interação com especialistas em corpora de grupos consolidados em nível nacional e Internacional. Os produtos terão fundamental contribuição na consolidação do Programa enquanto centro de excelência no Estado de Minas Gerais e no Brasil, servindo como referência para outros centros de pesquisa nacionais e internacionais.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Arnaldo Candido Junior - Integrante / Helena de Medeiros Caseli - Integrante / Sandra Maria Aluísio - Coordenador / Célia Maria Magalhães - Integrante / Adriana Silvina Pagano - Integrante.
      Membro: Arnaldo Candido Junior.
    12. 2013-2015. Processamento Semântico de Textos em Português Brasileiro
      Descrição: O objetivo geral do projeto de pesquisa, em parceria entre o ICMC-USP e a SAMSUNG, é avançar o estado da arte em processamento semântico de textos/documentos escritos em Português Brasileiro (PB), mais especificamente, permitir a anotação de papéis semânticos (SRL) e a desambiguação lexical de sentido (WSD) de verbos, e, com base nesses recursos e ferramentas, construir aplicações de mineração e sumarização de textos, com especial enfoque em opiniões sobre produtos encontradas na web. O projeto é coordenado pelos Profs. Thiago A. S. Pardo e Sandra M. Aluísio.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (5) . Integrantes: Sandra Maria Aluísio - Coordenador / Maria das Gracas Volpe Nunes - Integrante / Thiago Alexandre Salgueiro Pardo - Integrante / Magali Sanches Duran - Integrante.
      Membro: Sandra Maria Aluísio.
      Descrição: O objetivo geral do projeto de pesquisa, em parceria entre o ICMC-USP e a SAMSUNG, é avançar o estado da arte em processamento semântico de textos/documentos escritos em Português Brasileiro (PB), mais especificamente, permitir a anotação de papéis semânticos (SRL) e a desambiguação lexical de sentido (WSD) de verbos, e, com base nesses recursos e ferramentas, construir aplicações de mineração e sumarização de textos, com especial enfoque em opiniões sobre produtos encontradas na web. O projeto é coordenado pelos Profs. Thiago A. S. Pardo e Sandra M. Aluísio.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (5) . Integrantes: Maria das Graças Volpe Nunes - Integrante / Thiago A. S. Pardo - Integrante / Sandra M Aluisio - Coordenador / Lucas Vinicius Avanço - Integrante / Magali S Duran - Integrante. Número de produções C, T & A: 7
      Membro: Maria das Graças Volpe Nunes.
    13. 2009-2012. Padrões do português popular escrito: o vocabulário do Jornal Diário Gaúcho. Fase 1
      Descrição: Descrição e estudo de padrões do vocabulário de jornais populares voltados para um público de menor poder aquisitivo. Nesta etapa da pesquisa será considerado apenas o jornal popular DIÁRIO GAÚCHO, publicado em Porto Alegre-RS, produzido pelo grupo RBS. O foco principal da pesquisa é a caracterização do léxico e da feição da linguagem como um todo em um texto que é feito, em tese, de um modo mais simplificado, para ser compreendido com facilidade por pessoas de um determinado grupo social e econômico, com uma bagagem cultural mais ou menos tipificada e com um grau de escolaridade relativamente baixo. Esse jornal tem grande tiragem, cerca de 160 mil exemplares/dia, sendo que cada 01 exemplar é lido por 05 pessoas em média. È o único do gênero publicado na cidade e sua tiragem atesta a enorme aceitação por parte de seu público-alvo na cidade de Porto Alegre e em todo o entorno da região metropolitana. O número de leitores supera, de longe, o de jornais da mesma cidade dirigidos a públicos mais tradicionais distribuídos em todo o Estado do Rio Grande do Sul. Suas contínuas grandes tiragens e a grande adesão de seu público a quaisquer eventos promovidos pelo jornal demonstram, em tese, uma metodologia bem-sucedida de elaboração de texto dirigido para o tipo de leitor antes citado. A pesquisa utiliza como corpus a publicação do jornal ao longo de todo o ano de 2008, com contraponto de pequena amostra de 2009. Os enfoques iniciais da pesquisa são de cunho estatístico e contam com o apoio de pesquisadores de Lingüística Computacional/Processamento da Linguagem Natural (PLN) do Instituto de Informática da UFRGS e da Faculdade de Informática (FACIN) da PUC-RS. Esses pesquisadores da área da Computação desenvolvem estudos sobre observações de expressões multipalavra e sobre geração de ontologias a partir desse corpus. São também feitas observações e contrastes com padrões de vocabulário do jornal Zero Hora (ZH), publicado pela mesma empresa do Diário Gaúcho, o qua. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (1) / Doutorado: (1) . Integrantes: Sandra Maria Aluísio - Integrante / Renata Vieira - Integrante / Maria José Bocorny Finatto - Coordenador / Aline Villavicencio - Integrante / Daniel Costa da Silva - Integrante / Kleber Valenti Schenk - Integrante / Bruna Rodrigues da Silva - Integrante / Heloísa Orsi Koch Delgado - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
      Membro: Sandra Maria Aluísio.
    14. 2007-2010. PorSimples: Simplificação Textual do Português para Inclusão e Acessibilidade Digital
      Descrição: Propomos o desenvolvimento de uma tecnologia que foca uma área de pesquisa do processamento de língua natural, a simplificação textual, sendo disponibilizada em dois sistemas destinados a públicos alvos diferentes: (i) um sistema de autoria para ajudar autores a produzir textos simplificados que serão validados pelos próprios autores, e (ii) um sistema facilitador para ajudar a leitura de um dado conteúdo da Web. Este último inclui tarefas de sumarização textual, simplificação, e apresentação do texto salientando as relações entre as idéias do texto. Quanto aos cenários de uso, esta tecnologia se destina a facilitar o acesso à informação dos analfabetos funcionais, principalmente e, de pessoas com outras deficiências cognitivas como surdes congênita e portadores de afasia e dislexia, na leitura de textos eletrônicos em português produzidos pelo governo ou por jornais de grande circulação; as crianças em fase de aprendizado de leitura; ou ainda adultos em fase de alfabetização.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (13) / Mestrado acadêmico: (3) / Doutorado: (2) . Integrantes: Sandra Maria Aluísio - Coordenador / Renata Pontin de Mattos Fortes - Integrante / Maria das Gracas Volpe Nunes - Integrante / Maria das Graças Pimentel - Integrante / Thiago Alexandre Salgueiro Pardo - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro / Fundação de Amparo à Pesquisa do Estado de São Paulo - Bolsa. Número de produções C, T & A: 2
      Membro: Sandra Maria Aluísio.
    15. 2007-2009. CROWS - Construção e mapeamento de ontologias para a Web Semântica
      Situação: Em andamento; Natureza: Pesquisa. Integrantes: Sandra Maria Aluísio - Integrante / Renata Vieira - Coordenador / Fernando Osório - Integrante / Rove Chishman - Integrante. Financiador(es): Universidade de São Paulo - Cooperação.
      Membro: Sandra Maria Aluísio.
    16. 2007-2009. Terminologia de Biocombustíveis: descrição semântica e morfológica com vistas à sistematização
      Situação: Em andamento; Natureza: Pesquisa. Integrantes: Sandra Maria Aluísio - Integrante / Arnaldo Cândido - Integrante / Ariani Di Felippo - Integrante / Gladis Maria Barcellos Almeida - Coordenador / Margarita Correia - Integrante / Douglas Henrique Perez Pino - Integrante / Kelly Marcomini - Integrante. Financiador(es): Universidade de São Paulo - Cooperação.
      Membro: Sandra Maria Aluísio.
      Descrição: Com o objetivo de promover uma comunicação mais eficiente e permitir a troca de informações científicas e tecnológicas entre usuários e pesquisadores da área de Biocombustíveis, o presente projeto pretende gerar a terminologia sistematizada deste campo do saber, contendo os termos fundamentais da referida área, o que inclui os subdomínios do etanol e do biodiesel. Uma das razões para o empreendimento deste trabalho é o fato de o domínio dos Biocombustíveis ainda não ter seu repertório terminológico sistematizado em nenhuma língua, o que significa uma grande lacuna, primeiro porque Energia é um setor estratégico em qualquer país e, segundo, porque o Brasil é detentor do título de país mais competitivo do mundo para a geração de energia a partir da biomassa (ROSCOE, 2006), ou energias renováveis, caso dos biocombustíveis. Assim, a partir da elaboração de corpus, extração de termos, estruturação semântica dos conceitos e descrição morfológica dos termos, pretendemos sistematizar este repertório terminológico de extrema relevância para o país, de forma a dar subsídios para a criação, a posteriori, do primeiro glossário desse domínio do conhecimento. (Processo 473414/2007-4).. Situação: Concluído; Natureza: Pesquisa. Integrantes: Arnaldo Candido Junior - Integrante / Gladis Maria de Barcellos Almeida - Coordenador.
      Membro: Arnaldo Candido Junior.
    17. 2005-2007. Padrões rítmicos, Fixação de parâmetros e Mudança lingüística, Fase II
      Descrição: Projeto Temático: Padrões rítmicos, Fixação de parâmetros e Mudança lingüística, Fase II (proc. nro 04/03643-0) Objetivos Este projeto situa-se na continuação do projeto homônimo, processo 1998/03382-0, cujo balanço final segue na Seção Resultados de Auxílios anteriores. O primeiro objetivo do presente projeto é a extensão e consolidação do Corpus Tycho Brahe (doravante CTB), , elaborado na fase anterior, tanto no que diz respeito aos textos que o compõem quanto à sua anotação morfológica e sintática. O segundo objetivo é usar o CTB para estudar a história do português a partir das seguintes questões: - Quais são as características da gramática intermediária entre a do português arcaico e do português europeu moderno? - Qual é a trajetória no tempo dessa gramática? - Como se dá a emergência do português europeu moderno? De uma maneira mais geral, este projeto se insere em duas grandes problemáticas da teoria da linguagem: - O que provoca a mudança lingüística? - Como essa mudança se dá ao longo do tempo? Enfim, o projeto enfrenta a questão metodológica da detecção da mudança nos textos escritos. Para isso pretende articular análise qualitativa - no âmbito da teoria da gramática gerativa - e análise quantitativa, lançando mão da estatística descritiva e da modelagem estocástica.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (0) / Especialização: (0) / Mestrado acadêmico: (0) / Mestrado profissional: (0) / Doutorado: (0) . Integrantes: Sandra Maria Aluísio - Integrante / Marcelo Finger - Integrante / Charlotte Galves - Coordenador / Maria Clara Paixão de Sousa - Integrante / Afrânio Barbosa - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro.
      Membro: Sandra Maria Aluísio.
    18. 2003-2005. Projeto Extração automática de termos e elaboração colaborativa de terminologias para intercâmbio e difusão de conhecimento especializado
      Descrição: O uso de terminologias sistematizadas contribui para tornar mais eficaz a comunicação entre especialistas. Entretanto, para se empreender a tarefa de sistematizar terminologias, é fundamental que haja ferramentas computacionais compatíveis com esse tipo de empreendimento. A Terminologia e a Informática são duas áreas que estão integradas, há pelo menos quatro décadas, em países desenvolvidos, com o objetivo de gerar produtos terminológicos melhores e mais fiáveis. É fato que, no Brasil, tal realidade vai se dar muito tardiamente e, ainda assim, os poucos terminólogos brasileiros que desenvolvem produtos terminológicos operam na maioria das vezes com ferramentas adaptadas e não elaboradas especificamente para a finalidade das suas pesquisas. Nossa proposta, então, é a de satisfazer algumas exigências básicas da pesquisa terminológica por meio de uma ferramenta computacional baseada na Web, composta de módulos para extração automática de termos, elaboração colaborativa, intercâmbio e difusão do conhecimento terminológico disponível, para que áreas técnicas e de pesquisa emergentes e/ou de influência na economia brasileira possam ser privilegiadas com a criação de glossários e dicionários terminológicos.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Especialização: (0) / Mestrado acadêmico: (1) / Mestrado profissional: (0) / Doutorado: (1) . Integrantes: Sandra Maria Aluísio - Integrante / Leandro Henrique Mendonça de Oliveira - Integrante / Maria Fernanda Teline - Integrante / Gladis Maria de Barcellos Almeida - Coordenador / Ivan Pereira de Souza - Integrante / Dayse Simon Landim de Souza - Integrante / Elisabete Rayel Assumpção - Integrante / Mauri Siqueira Montesi - Integrante. Financiador(es): Fundação de Amparo à Pesquisa do Estado de São Paulo - Auxílio financeiro. Número de produções C, T & A: 7
      Membro: Sandra Maria Aluísio.

Prêmios e títulos

  • Total de prêmios e títulos (2)
    1. 3o. Lugar no CTD-IE tese de doutorado, orientado Jean Piton-Gonçalves, Sociedade Brasileira de Informática na Educação / Sociedade Brasileira de Computação.. 2013.
      Membro: Sandra Maria Aluísio.
    2. Distinguished Paper, Comitê do ICCBR'95.. 1995.
      Membro: Sandra Maria Aluísio.

Participação em eventos

  • Total de participação em eventos (55)
    1. 4th Brazilian Workshop on Sentence Processing.RASTROS Project: a Large Eye-Tracking Corpus of Reading Data for Automatic Sentence Readability Assessment in Portuguese. 2019. (Oficina).
    2. Jornada de Descrição do Português - evento satélite do Simpósio de Tecnologia da Informação e Linguagem Humana.Anotação de unidades de informação em transcrições de fala na tarefa de reconto de narrativas em português. 2019. (Simpósio).
    3. Coling 2018. A Nontrivial Sentence Corpus for the Task of Sentence Readability Assessment in Portuguese. 2018. (Congresso).
    4. ACL 2017. Enriching Complex Networks with Word Embeddings for Detecting Mild Cognitive Impairment from Speech Transcripts. 2017. (Congresso).
    5. NAACL HLT 2015. Automatic Generation of a Lexical Resource to support Semantic Role Labeling in Portuguese. 2015. (Congresso).
    6. X RPDA - Reunião de Pesquisadores em Doença de Alzheimer e Desordens Relacionadas.Coh-Metrix-Dementia: Automatic analysis of discourse in Mild Cognitive Impairment and Dementia. 2015. (Outra).
    7. 9th edition of the Language Resources and Evaluation Conference. A Large Corpus of Product Reviews in Portuguese: Tackling Out-Of-Vocabulary Words. 2014. (Congresso).
    8. PROPOR 2014 : The 11th International Conference on the Computational Processing of Portuguese. Using Cross-linguitic Knowledge to Build VerbNet-style Lexicons: Results for a (Brazilian) Portuguese VerbNet. 2014. (Congresso).
    9. 9th Brazilian Symposium in Information and Human Language Technology.PROGRAM CHAIR do STIL 2013. 2013. (Simpósio).
    10. 9th Brazilian Symposium in Information and Human Language Technology.Approaches for Helping Brazilian Students Improve their Scientific Writings. 2013. (Simpósio).
    11. STIL 2013 ? The 9th Brazilian Symposium in Information and Human Language Technology.STIL 2013 Program Chair. 2013. (Simpósio).
    12. Workshop of PhD and MSc Research (WTD 2013).Membro da Organizaçao do Evento. 2013. (Outra).
    13. X Encontro Nacional de Inteligência Artificial e Computacional. 2013. (Encontro).
    14. Eight International Conference on Language Resources and Evaluation (LREC'12), Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis (editors). Propbank-Br: a Brazilian Treebank annotated with semantic role labels. 2012. (Congresso).
    15. Workshop on Creating Cross-language Resources for Disconnected Languages and Styles (CREDISLAS), LREC 2012.Towards a cross-linguistic VerbNet-style lexicon to Brazilian Portuguese. 2012. (Outra).
    16. II Jornada de Descrição do Português - Workshop do STIL 2011.O tratamento da partícula se para fins de anotação de papéis semânticos. 2011. (Outra).
    17. The 8th Brazilian Symposium in Information and Human Language Technology.Using machine learning methods to avoid the pitfall of cognates and false friends in Spanish-Portuguese word pairs. 2011. (Simpósio).
    18. VIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana. 2011. (Simpósio).
    19. X Encontro de Linguística de Córpus.Anotação de Córpus: uma área de integração entre linguistas e linguistas computacionais. 2011. (Encontro).
    20. The Seventh Conference on International Language Resources and Evaluation (LREC). Assigning Wh-Questions to Verbal Arguments: Annotation Tools Evaluation and Corpus. 2010. (Congresso).
    21. CompCorp 2008 - LREC 2008. Using a comparable corpus to investigate lexical patterning in English abstracts written by non-native speakers. 2008. (Congresso).
    22. DOCENG: ACM Symposium on Document Engineering. Towards Brazilian Portuguese Automatic Text Simplification Systems. 2008. (Congresso).
    23. DocEng 2008. Towards Brazilian Portuguese Automatic Text Simplification Systems. 2008. (Congresso).
    24. LATECH 2008 - LREC 2008. Building a large dictionary of abbreviations for named entity recognition in Portuguese historical corpora. 2008. (Congresso).
    25. Palestra Convidada no Programa de Pós-graduação em Desenvolvimento Regional e Meio Ambiente da Uniara.Diretrizes para a boa estruturação de textos científicos e a Ferramenta de Suporte à Escrita Científica em Português SciPo. 2008. (Outra).
    26. 6th International Conference Recent Advances in Natural Language Processing. A two-tiered approach to detecting English article usage: an application in scientific paper writing tools. 2007. (Congresso).
    27. VI Encontro de Lingüística de Corpus.Organizador do Evento. 2007. (Encontro).
    28. V Workshop em Tecnologia da Informação e da Linguagem Humana, TIL?2007.Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia. 2007. (Encontro).
    29. Fourth Workshop in Information and Human Language Technology (TIL'2006).e-Termos: um ambiente colaborativo web para criação de produtos terminológicos. 2006. (Outra).
    30. II Colóquio OS ESTUDOS LEXICAIS EM DIFERENTES PERSPECTIVAS.O papel do léxico do Unitex-PB no projeto Dicionário Histórico do Português do Brasil dos séculos XVI, XVII, XVIII. 2006. (Outra).
    31. International Joint Conference 2006 - IBERAMIA/SBIA and SBRN. 2006. (Congresso).
    32. PROPOR 2006. 2006. (Encontro).
    33. 12th International Conference on Artificial Intelligence in Education. 12th International Conference on Artificial Intelligence in Education. 2005. (Congresso).
    34. Palesta em Curso da Pós-graduação em Tecnologia Bioquímico-Farmacêutica-USP.Introdução ao Scipo-Farmácia. 2005. (Outra).
    35. Palestra Convidada no Programa de Pós-graduação em Genética e Evolução da UFSCar.Introdução ao SciPo-Farmácia. 2005. (Outra).
    36. V Encontro de Corpora.Corpora e Neologismos. 2005. (Encontro).
    37. 7th Conference on Intelligent Tutoring Systems. A Learning Environment for English for Academic Purposes based on Adaptive Tests and Task-based Systems. 2004. (Congresso).
    38. Fórum Permanente de Conhecimento & Tecnologia da Informação: Novas formas de produção e circulação do conhecimento.Linguagem e Tecnologia: construção de grandes corpora e suas ferramentas associadas. 2004. (Outra).
    39. IV Encontro de Corpora.Esquema de nomeação de arquivos, formatação dos textos e codificação do cabeçalho dos corpora do Projeto Lácio-Web: Quão longe estamos dos padrões internacionais para córpus?. 2004. (Encontro).
    40. IX Simpósio de Teses e Disseratções. 2004. (Simpósio).
    41. Palesta em Curso da Pós-graduação em Tecnologia Bioquímico-Farmacêutica-USP.Ferramentas de apoio à escrita de artigos em inglês como língua estrangeira. 2004. (Outra).
    42. 1º Workshop em Tecnologia da Informação e Linguagem Humana (TIL 2003). 2003. (Encontro).
    43. CORPUS LINGUISTICS 2003. Analysis of the rhetorical structure of computer science abstracts in Portuguese. 2003. (Congresso).
    44. III Encontro de Corpora.Projeto Lácio-Web: Como ele fará diferença para as pesquisas lingüísticas do PB e para a criação de ferramentas de PLN. 2003. (Encontro).
    45. III Jornada Internacional Saber Humano e Linguagem - Tecnologia de Arquivo.Fórum de Debates Tecnologia de Arquivos. 2003. (Encontro).
    46. Palestra em Disciplina da Faculdade de Ciências Farmacêuticas da USP.Amadeus: Recursos e Ferramentas para a Escrita de Artigos em inglês como Língua Estrangeira. 2003. (Outra).
    47. First Seminar on advanced Research in Eletronic Business (EBR´2002). 2002. (Seminário).
    48. Palesta em Curso da Pós-graduação em Tecnologia Bioquímico-Farmacêutica-USP.Recursos e Ferramentas para a Escrita de Artigos em Inglês. 2002. (Outra).
    49. Palestra convidada na Pós-graduação em Ciências da Engenharia do CCT/UENF.Amadeus: Recursos e Ferramentas para a escrita de artigos em inglês como Língua estrangeira. 2002. (Outra).
    50. IEEE International Conference on Advanced Learning Technologies 2001. How to Learn the Many Unwritten ´Rules of the Game´ of the Academic Discourse: A Hybrid Approach Based on Critiques and Cases to Support Scientific Writing. 2001. (Congresso).
    51. IBERAMIA-SBIA 2000. Congress Member. 2000. (Congresso).
    52. IHC 2000 3rd Workshop on Human Factors in Computer Systems. 2000. (Encontro).
    53. V Propor. 2000. (Encontro).
    54. 3rd Annual Computer Assisted Assessment Conference. An Innovative Computer Assisted Proficiency Test of English for Academic Purposes. 1999. (Congresso).
    55. ICCBR 1995. A Case-Based Approach for Developing Writing Tools Aimed at Non-native English Users. 1995. (Congresso).

Organização de eventos

  • Total de organização de eventos (12)
    1. QUARESMA, Paulo ; VIEIRA, Renata ; ALUÍSIO, Sandra Maria ; Moniz, H. ; Saias, J. ; Pinheiro, V. ; Gonçalves, T. ; Batista, F. ; Adami, A. ; Rodrigues, I. ; Gamalho, P.. The 14th edition of the International Conference on the Computational Processing of Portuguese (PROPOR 2020). 2020. Congresso
    2. ALUÍSIO, Sandra Maria; TAGNIN, Stella ; HUBNER, L. C. ; ESTIVALET, G. L.. VI Jornada de Descrição do Português - JDP 2019. 2019. Congresso
    3. ALUÍSIO, Sandra Maria; RINO, Lúcia H. Machado ; Duran, M. S. ; BALAGE FILHO, P.. The 11th International Conference on the Computational Processing of Portuguese - PROPOR 2014. 2014. Congresso
    4. ALUISIO, S. M.; FELTRIM, Valéria ; Pinheiro, V.. STIL 2013. 2013. Congresso
    5. ALUÍSIO, Sandra Maria; MOREIRA, E. S. ; RODRIGUES JUNIOR, J. F. ; PIMENTEL, M. G. C. ; ANDRETTA, M. ; BRAGA, R. T. V.. 14o Workshop de Teses e Dissertações (WTD 2013). 2013. Outro
    6. ALUÍSIO, S. M.; TAGNIN, Stella. XI Encontro de Linguística Computacional e VI Escola Brasileira de Linguística Computacional. 2012. Congresso
    7. ALUÍSIO, S. M.. 4th Workshop in Information and Human Language Technology (TIL 2006). 2006. (Congresso).. . 0.
    8. ALUÍSIO, S. M.; ALMEIDA, Gladis Maria Barcellos. V Encontro de Corpora. 2005. Congresso
    9. ALUÍSIO, S. M.; TAGNIN, Stella. IV Encontro de Corpora. 2004. Congresso
    10. NUNES, Maria das Gracas Volpe ; ALUÍSIO, S. M.. 1º Workshop em Tecnologia da Informação e da Linguagem Humana (TIL 2003). 2003. Congresso
    11. ALUÍSIO, S. M.; GALVES, Charlotte. III Encontro de Corpora. 2003. Congresso
    12. NUNES, Maria das Graças Volpe ; RINO, L. H. M. ; ALUÍSIO, S. M.. V Workshop em Processamento Computacional do Português Escrito e Falado, 2000. 2000. Congresso

Lista de colaborações

  • Colaborações endôgenas (11)
    • Sandra Maria Aluísio ⇔ Arnaldo Candido Junior (31.0)
      1. CASANOVA, EDRESSON ; JUNIOR, ARNALDO CANDIDO ; SHULBY, CHRISTOPHER ; Oliveira, Frederico Santos de ; Teixeira, João Paulo ; Ponti, Moacir Antonelli ; ALUÍSIO, SANDRA. TTS-Portuguese Corpus: a corpus for speech synthesis in Brazilian Portuguese. Language Resources and Evaluation. v. 2022.1, p. 1-13, issn: 1574-0218, 2022.
      2. CANDIDO JUNIOR, ARNALDO ; CASANOVA, EDRESSON ; SOARES, ANDERSON ; DE OLIVEIRA, FREDERICO SANTOS ; OLIVEIRA, LUCAS ; JUNIOR, RICARDO CORSO FERNANDES ; DA SILVA, DANIEL PEIXOTO PINTO ; FAYET, FERNANDO GORGULHO ; CARLOTTO, BRUNO BALDISSERA ; GRIS, LUCAS RAFAEL STEFANEL ; ALUÍSIO, Sandra Maria. CORAA ASR: a large corpus of spontaneous and prepared speech manually validated for speech recognition in Brazilian Portuguese. Language Resources and Evaluation. v. 1, p. 1-33, issn: 1574-020X, 2022.
      3. SANTOS, V. ; SOUZA, E. F. ; FELIZARDO, K. R. ; WATANABE, W. M. ; VIJAYKUMAR, N. L. ; ALUÍSIO, Sandra Maria ; CANDIDO JUNIOR, A.. Conceptual Map Creation from Natural Language Processing: a Systematic Mapping Study. Revista Brasileira de Informática na Educação (RBIE). v. 27, p. 150-176, issn: 2317-6121, 2019.
      4. Watanabe, W.M. ; Candido Jr., A. ; Amancio, M.A. ; Oliveira, M. ; PARDO, Thiago Alexandre Salgueiro ; FORTES, R. P. M. ; ALUÍSIO, Sandra Maria. Adapting Web content for low-literacy readers by using lexical elaboration and named entities labeling. New Review of Hypermedia and Multimedia. v. 16, p. 303-327, issn: 1361-4568, 2010.
      5. CANDIDO JUNIOR, A.; ALUÍSIO, S. M.. Building a Corpus-based Historical Portuguese Dictionary: Challenges and Opportunities. Revue TAL. v. 50, p. 73-102, issn: 1965-0906, 2009.
      6. CASANOVA, E. ; SANTOS, V. G. ; SVARTMAN, F. R. F. ; LEITE, M. Q. ; CANDIDO JR, A. ; Marcacini, R. M. ; Solange Oliveira Rezende ; ALUÍSIO, Sandra Maria. Recursos para o processamento de fala. Em: Helena Medeiros Caseli; Maria das Graças Volpe Nunes. (Org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 1ed. : São Carlos. 2023.v. 1, p. 61-82.
      7. DAYRELL, C. ; CANDIDO JUNIOR, A. ; Curi, M. ; TAGNIN, Stella Esther Ortweiler ; ALUÍSIO, Sandra Maria. PADRÕES LÉXICO-GRAMATICAIS NA ESPECIFICAÇÃO DE PROPÓSITO E RESULTADO EM ABSTRACTS DE ARTIGOS CIENTÍFICOS: APLICAÇÕES NO ENSINO DE EAP E NA CONSTRUÇÃO DE FERRAMENTAS DE SUPORTE À ESCRITA CIENTÍFICA. Em: Ana Maria T. Ibaños, Lívia Pretto Mottin, Simone Sarmento e Tony Berber Sardinha. (Org.). Pesquisas e Perspectivas em Linguística de Corpus. 1ed.Campinas. : Mercado das Letras. 2015.v. 1, p. 303-346.
      8. Coleti, J. S. ; Mattos, D. F. ; GENOVES JR, Luiz Carlos ; CÂNDIDO, Arnaldo ; FELIPPO, Ariani Di ; ALMEIDA, Gladis Maria Barcellos ; ALUÍSIO, S. M. ; OLIVEIRA JR., O.N.. A compilação de corpus em língua portuguesa na área de nanociência/nanotecnologia: problemas e soluções. Em: S. E. O.Tagnin; O. A. Vale. (Org.). Avanços da Lingüística de Corpus no Brasil. Avanços da Lingüística de Corpus no Brasil. 1ed.São Paulo. : Humanitas/FFLCH/USP. 2008.v. 1, p. 167-191.
      9. LEAL, S. E. ; CANDIDO JUNIOR, A. ; MARCACINI, R. M. ; CASANOVA, EDRESSON ; GONCALVES, O. ; SOARES, A. S. ; LIMA, R. F. ; GRIS, L. R. S. ; ALUÍSIO, S. M.. MuPe Life Stories Dataset: Spontaneous Speech in Brazilian Portuguese with a Case Study Evaluation on ASR Bias against Speakers Groups and Topic Modeling. Em: 31st International Conference on Computational Linguistics (COLING 2025), v. 1, p. 1-12, 2025.
      10. RODRIGUES, A. C. ; MACEDO, A. A. ; CANDIDO JUNIOR, A. ; SVARTMAN, F. R. F. ; CRAVEIRO, G. M. ; LEITE, M. Q. ; ALUÍSIO, S. M. ; SANTOS, V. G. ; GARCIA, V. M.. Portal NURC-SP: Design, Development, and Speech Processing Corpora Resources to Support the Public Dissemination of Portuguese Spoken Language. Em: The 16th International Conference on Computational Processing of Portuguese (PROPOR 2024), v. 1, p. 187-195, 2024.
      11. ARAUJO, G. E. ; GALDINO, J. C. ; LIMA, R. F. ; ISHIDA, L. ; LOPES, G. W. ; OLIVEIRA JUNIOR, M. J. A. ; CANDIDO JUNIOR, A. ; ALUÍSIO, S. M. ; PONTI, M. A.. EyetrackingMOS: proposta de um método de avaliação online para modelos de sı́ntese de fala. Em: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), v. 15, p. 87-96, 2024.
      12. LIMA, R. F. ; LEAL, S. E. ; CANDIDO JUNIOR, A. ; ALUÍSIO, S. M.. A Large Dataset of Spontaneous Speech with the Accent Spoken in São Paulo for Automatic Speech Recognition Evaluation. Em: 34th Brazilian Conference on Intelligent Systems (BRACIS 2024), v. 1, p. 1-15, 2024.
      13. Julio Cesar Galdino ; Gustavo Araújo ; Miguel Oliveira Jr ; CANDIDO JUNIOR, A. ; Moacir Ponti ; Sandra Maria Aluísio. Acoustic Analysis of Prosodic Features in Natural versus Synthesized Speech Samples from YourTTS and SYNTACC Models. Em: XXI Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2024), p. 1-12, 2024.
      14. CASANOVA, EDRESSON ; SHULBY, CHRISTOPHER ; KOROLEV, ALEXANDER ; JUNIOR, ARNALDO CANDIDO ; SOARES, ANDERSON DA SILVA ; ALUÍSIO, SANDRA ; Ponti, Moacir Antonelli. ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion. Em: INTERSPEECH 2023, v. 1, p. 1244-1248, 2023.
      15. GRIS, LUCAS RAFAEL STEFANEL ; CANDIDO JUNIOR, ARNALDO ; SANTOS, VINÍCIUS G. DOS ; DIAS, BRUNO A. PAPA ; LEITE, MARLI QUADROS ; SVARTMAN, FLAVIANE ROMANI FERNANDES ; ALUÍSIO, SANDRA. Bringing NURC/SP to Digital Life: the Role of Open-source Automatic Speech Recognition Models. Em: XIX ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), p. 330-341, 2022.
      16. CASANOVA, EDRESSON ; SHULBY, CHRISTOPHER ; GÖLGE, EREN ; MÜLLER, NICOLAS MICHAEL ; Oliveira, Frederico Santos de ; CANDIDO JR., ARNALDO ; SOARES, ANDERSON DA SILVA ; ALUISIO, SANDRA MARIA ; Ponti, Moacir Antonelli. SC-GlowTTS: An Efficient Zero-Shot Multi-Speaker Text-To-Speech Model. Em: Interspeech 2021, p. 3645-3649, 2021.
      17. CASANOVA, EDRESSON ; GRIS, LUCAS ; CAMARGO, AUGUSTO ; DA SILVA, DANIEL ; GAZZOLA, MURILO ; SABINO, ESTER ; LEVIN, ANNA ; CANDIDO JR, ARNALDO ; ALUISIO, SANDRA ; FINGER, Marcelo. Deep Learning against COVID-19: Respiratory Insufficiency Detection in Brazilian Portuguese Speech. Em: Findings of the Association for Computational Linguistics: ACLIJCNLP 2021, p. 625-633, 2021.
      18. CASANOVA, E. ; CANDIDO JUNIOR, A. ; SHULBY, C. ; OLIVEIRA, F. S. ; Gris, L.S. ; SILVA, H. P. ; ALUÍSIO, Sandra Maria ; PONTI, M. A.. Speech2Phone: A Novel and Efficient Method for Training Speaker Recognition Models. Em: The 10th Brazilian Conference on Intelligent Systems (BRACIS 2021), v. 1, p. 1-14, 2021.
      19. SANTOS, L. B. ; Duran, M. S. ; HARTMANN, N. S. ; CANDIDO JUNIOR, A. ; PAETZOLD, G. H. ; ALUÍSIO, Sandra Maria. A Lightweight Regression Method to Infer Psycholinguistic Properties for Brazilian Portuguese. Em: The 20th International Conference of Text, v. 10415, p. 281-289, 2017.
      20. CANDIDO JUNIOR, A.; VIEIRA, T. L. ; SERIKAWA, M. A. ; SILVA, M. A. R. ; ZANGIROLAMI, R. ; ALUÍSIO, S. M.. Portal Min@s: Uma Ferramenta de Apoio ao Processamento de Córpus de Propósito Geral. Em: X Brazilian Symposium in Information and Human Language Technology, v. 1, p. 69-74, 2015.
      21. DAYRELL, C. ; CÂNDIDO, Arnaldo ; Lima, G. ; MACHADO, D. ; Copestake, A. ; FELTRIM, Valéria D. ; TAGNIN, Stella e O ; ALUÍSIO, S. M.. Rhetorical Move Detection in English Abstracts: Multi-label Sentence Classifiers and their Annotated Corpora. Em: Eight International Conference on Language Resources and Evaluation (LREC'12), v. 1, p. 1604-1609, 2012.
      22. CANDIDO JUNIOR, A.; COPESTAKE, A. ; SPECIA, L. ; ALUÍSIO, S. M.. Towards an on-demand Simple Portuguese Wikipedia. Em: The 2nd Workshop on Speech and Language Processing for Assistive Technologies, v. 1, p. 137-147, 2011.
      23. Watanabe, W.M. ; Candido Jr., A. ; Amancio, M.A. ; Oliveira, M. ; PARDO, Thiago Alexandre Salgueiro ; FORTES, R. P. M. ; ALUÍSIO, Sandra Maria. Adapting web content for low-literacy readers by using lexical elaboration and named entities labeling. Em: The 2010 International Cross Disciplinary Conference on Web Accessibility (W4A), v. 1, p. 8:1-8:9, 2010.
      24. Candido Jr., A. ; Maziero, E.G. ; Gasperin, C. ; PARDO, Thiago Alexandre Salgueiro ; Specia, L. ; ALUÍSIO, Sandra Maria. Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. Em: 4th NAACL-HLT Workshop on Innovative Use of NLP for Building Educational Applications, v. 1, p. 34-42, 2009.
      25. Watanabe, W.M. ; Candido Jr., A. ; Uzêda, V.R. ; FORTES, R. P. M. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Facilita: reading assistance for low-literacy readers. Em: ACM International Conference on Design of Communication (SIGDOC 2009), v. 1, p. 29-36, 2009.
      26. VALE, O. A. ; CANDIDO JUNIOR, A. ; MUNIZ, M. C. M. ; BENGTSON, C. G. ; CUCATTO, L. A. ; ALMEIDA, G. M. B. ; BATISTA, A. ; PARREIRA, M. C. P. ; BIDERMAN, M. T. C. ; ALUÍSIO, S. M.. Building a large dictionary of abbreviations for named entity recognition in Portuguese historical corpora. Em: Language Technology for Cultural Heritage Data (LaTech - 2008) LREC 2008, v. 1, p. 1-10, 2008.
      27. CANDIDO JUNIOR, A.; ALUÍSIO, S. M.. Um Ambiente Computacional para o Processamento de Córpus de Português Histórico. Em: VI Best MSc Dissertation/PhD Thesis Contest (CTDIA 2008), v. 1, p. 1-10, 2008.
      28. CANDIDO JUNIOR, A.; ALUÍSIO, S. M.. Procorph: um Sistema de Apoio para Criação de Dicionários Históricos. Em: VI Workshop em Tecnologias da Informação e da Linguagem Humana (TIL 2008), v. 1, p. 347-352, 2008.
      29. GIUSTI, Rafael ; CÂNDIDO, Arnaldo ; MUNIZ, Marcelo ; CUCATTO, Lívia ; ALUÍSIO, S. M.. Automatic detection of spelling variation in historical corpus: An application to build a Brazilian Portuguese spelling variants dictionary. Em: Corpus Linguistics 2007 conference, 2007.
      30. Scarton, C. E. ; OLIVEIRA, M. ; CÂNDIDO, Arnaldo ; GASPERIN, C. ; ALUÍSIO, S. M.. SIMPLIFICA: a tool for authoring simplified texts in Brazilian Portuguese guided by readability assessments. Em: The 2010 Conference of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies (NAACL-HLT 2010), 2010, Los Angeles, California. Proceedings of the NAACL HLT 2010 Demonstration Session, v. 1, p. 41-44, 2010.
      31. DAYRELL, C. ; CÂNDIDO, Arnaldo ; TAGNIN, Stella ; Lima, G. ; FELTRIM, Valéria D. ; ALUÍSIO, S. M.. Towards a multi-label sentence classifier for automatic identification of rhetorical moves in English abstracts. Em: Corpus Linguistics, 2011, Birmingham. Proceedings of Corpus Linguistics, v. 1, p. 36-37, 2011.

    • Sandra Maria Aluísio ⇔ Thiago Alexandre Salgueiro Pardo (18.0)
      1. Watanabe, W.M. ; Candido Jr., A. ; Amancio, M.A. ; Oliveira, M. ; PARDO, Thiago Alexandre Salgueiro ; FORTES, R. P. M. ; ALUÍSIO, Sandra Maria. Adapting Web content for low-literacy readers by using lexical elaboration and named entities labeling. New Review of Hypermedia and Multimedia. v. 16, p. 303-327, issn: 1361-4568, 2010.
      2. NUNES, Maria das Graças Volpe ; ALUÍSIO, Sandra Maria ; PARDO, Thiago Alexandre Salgueiro. Um panorama do Núcleo Interinstitucional de Linguística Computacional às vésperas de sua maioridade (Artigo Convidado). Linguamática (Braga). v. 2, p. 13-27, issn: 1647-0818, 2010.
      3. ALUÍSIO, Sandra Maria; PARDO, T. A. S. ; Duran, M. S.. New corpora for ?new? challenges in Portuguese processing. Em: Tony Berber Sardinha; Telma de Lurdes São Bento Ferreira. (Org.). Working with Portuguese Corpora. 1ed.Londres. : Bloomsbury Academic. 2014.v. 1, p. 303-322.
      4. MELLO, H. ; RASO, T. ; OLIVEIRA JUNIOR, M. ; SARDINHA, A. P. B. ; FREITAS, C. ; ALUISIO, S. M. ; PARDO, THIAGO A.S. ; DURAN, M. ; LEAL, S. ; DAVIES, M. ; GALVES, C.. Brazilian Portuguese: Spoken, Written and Diachronic Corpora. Em: 54th Congress of the International Society of Italian Linguistics ''Corpora and Linguistic Studies'' (SLI), v. 1, p. 179-187, 2021.
      5. PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
      6. Duran, M. S. ; AVANCO, L. ; ALUÍSIO, Sandra Maria ; PARDO, T. A. S. ; NUNES, Maria das Gracas Volpe. Some issues on the normalization of a corpus of products reviews in Portuguese. Em: 9th Web as Corpus Workshop (WAC-9) ​EACL 2014, v. 1, p. 22-28, 2014.
      7. HARTMANN, N. S. ; AVANCO, L. V. ; Balage Filho, P.P ; DURAN, M. ; NUNES, Maria das Graças Volpe ; PARDO, THIAGO A.S. ; ALUÍSIO, Sandra Maria. A Large Corpus of Product Reviews in Portuguese - Tackling Out-Of-Vocabulary Words. Em: Ninth International Conference on Language Resources and Evaluation (LREC?14), v. 1, p. 3865-3871, 2014.
      8. Balage Filho, P.P ; ALUÍSIO, Sandra Maria ; PARDO, Thiago Alexandre Salgueiro. An Evaluation of the Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. Em: 9th Brazilian Symposium in Information and Human Language Technology, v. 1, p. 215-219, 2013.
      9. Watanabe, W.M. ; Candido Jr., A. ; Amancio, M.A. ; Oliveira, M. ; PARDO, Thiago Alexandre Salgueiro ; FORTES, R. P. M. ; ALUÍSIO, Sandra Maria. Adapting web content for low-literacy readers by using lexical elaboration and named entities labeling. Em: The 2010 International Cross Disciplinary Conference on Web Accessibility (W4A), v. 1, p. 8:1-8:9, 2010.
      10. Candido Jr., A. ; Maziero, E.G. ; Gasperin, C. ; PARDO, Thiago Alexandre Salgueiro ; Specia, L. ; ALUÍSIO, Sandra Maria. Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. Em: 4th NAACL-HLT Workshop on Innovative Use of NLP for Building Educational Applications, v. 1, p. 34-42, 2009.
      11. Watanabe, W.M. ; Candido Jr., A. ; Uzêda, V.R. ; FORTES, R. P. M. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Facilita: reading assistance for low-literacy readers. Em: ACM International Conference on Design of Communication (SIGDOC 2009), v. 1, p. 29-36, 2009.
      12. Gasperin, C. ; Maziero, E.G. ; Specia, L. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Natural language processing for social inclusion: a text simplification architecture for different literacy levels. Em: XXXVI Seminário Integrado de Software e Hardware, v. 1, p. 387-401, 2009.
      13. Watanabe, W.M. ; FORTES, R. P. M. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Facilita: auxílio à leitura de textos disponíveis na Web. Em: Brazilian Symposium on Multimedia and the Web, v. 2, p. 27-30, 2009.
      14. CASELI, Helena Medeiros ; Pereira, T. ; Specia, L. ; PARDO, Thiago Alexandre Salgueiro ; Gasperin, C. ; ALUÍSIO, Sandra Maria. Building a Brazilian Portuguese parallel corpus of original and simplified texts. Em: 10th Conference on Intelligent Text Processing and Computational Linguistics, v. 41, p. 59-70, 2009.
      15. ALUÍSIO, Sandra Maria ; Specia, L. ; PARDO, Thiago Alexandre Salgueiro ; Maziero, E.G. ; FORTES, R. P. M.. Towards Brazilian Portuguese Automatic Text Simplification Systems. Em: 8th ACM Symposium on Document Engineering, v. 1, p. 240-248, 2008.
      16. ALUÍSIO, Sandra Maria ; Specia, L. ; PARDO, Thiago Alexandre Salgueiro ; Maziero, E.G. ; CASELI, Helena Medeiros ; FORTES, R. P. M.. A Corpus Analysis of Simple Account Texts and the Proposal of Simplification Strategies: First Steps towards Text Simplification Systems. Em: The 26th ACM International Conference on Design of Communication, v. 1, p. 15-22, 2008.
      17. Maziero, E.G. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Ferramenta Automática de Simplificação Textual. Em: 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2009, São Carlos. Anais do 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2009, v. 1, p. 1-1, 2009.
      18. Uzêda, V.R. ; PARDO, Thiago Alexandre Salgueiro ; ALUÍSIO, Sandra Maria. Tratamento de Informações Redundantes e de Senso Comum. Em: 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2009, 2009, São Carlos. Anais do 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2009, v. 1, p. 1-1, 2009.

    • Sandra Maria Aluísio ⇔ Maria das Graças Volpe Nunes (13.0)
      1. NUNES, Maria das Graças Volpe ; ALUÍSIO, Sandra Maria ; PARDO, Thiago Alexandre Salgueiro. Um panorama do Núcleo Interinstitucional de Linguística Computacional às vésperas de sua maioridade (Artigo Convidado). Linguamática (Braga). v. 2, p. 13-27, issn: 1647-0818, 2010.
      2. FELTRIM, Valéria ; TEUFEL, Simone ; NUNES, Maria das Graças Volpe ; ALUÍSIO, S. M.. Argumentative Zoning Applied to Critiquing Novices'Scientific Abstracts. Em: Yan QU; James G. SHANAHAN; Janyce WIEBE. (Org.). Computing Attitude and Affect in Text: Theory and Applications. 1ed.Dordrecht, The Netherlands. : Springer. 2005.v. 1, p. 159-170.
      3. NUNES, Maria das Graças Volpe ; OLIVEIRA JR, Osvaldo Novais de ; ALUÍSIO, S. M. ; RINO, Lúcia H. Machado ; SILVA, Bento Carlos Dias da. Desafios na Construção de Recursos Lingüístico-Computacionais para o Processamento Automático do Português do Brasil. Em: Tony Berber Sardinha. (Org.). A língua portuguesa no computador. 1ed.Campinas. : Mercado de Letras. 2005.v. 1, p. 33-70.
      4. PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
      5. ALMEIDA, G. A. M. ; AVANCO, L. V. ; Duran M S ; FONSECA, E. ; Nunes, M.G.V. ; ALUÍSIO, Sandra M. Evaluating Phonetic Spellers for User-generated Content in Brazilian Portuguese. Em: PROPOR 2016 - The International Conference on the Computational Processing of Portuguese, v. 9727, p. 361-373, 2016.
      6. Duran, M. S. ; AVANCO, L. ; ALUÍSIO, Sandra Maria ; PARDO, T. A. S. ; NUNES, Maria das Gracas Volpe. Some issues on the normalization of a corpus of products reviews in Portuguese. Em: 9th Web as Corpus Workshop (WAC-9) ​EACL 2014, v. 1, p. 22-28, 2014.
      7. HARTMANN, N. S. ; AVANCO, L. V. ; Balage Filho, P.P ; DURAN, M. ; NUNES, Maria das Graças Volpe ; PARDO, THIAGO A.S. ; ALUÍSIO, Sandra Maria. A Large Corpus of Product Reviews in Portuguese - Tackling Out-Of-Vocabulary Words. Em: Ninth International Conference on Language Resources and Evaluation (LREC?14), v. 1, p. 3865-3871, 2014.
      8. ZAVAGLIA, Cláudia ; ALUÍSIO, S. M. ; NUNES, Maria das Gracas Volpe ; OLIVEIRA, Leandro Henrique Mendonça de. Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia. Em: V Workshop em Tecnologia da Informação e da Linguagem Humana, v. 1, p. 1575-1584, 2007.
      9. ALUÍSIO, S. M.; MONTILHA, Gisele ; FINGER, Marcelo ; NUNES, Maria das Graças Volpe ; TAGNIN, Stella O. The Lacio-Web Project: overview and issues in Brazilian Portuguese corpora creation. Em: CORPUS LINGUISTICS 2003, v. 16, p. 14-21, 2003.
      10. FELTRIM, Valéria Delisandra ; ALUÍSIO, S. M. ; NUNES, Maria das Graças Volpe. Analysis of the rhetorical structure of computer science abstracts in Portuguese. Em: CORPUS LINGUISTICS 2003, v. 16, p. 212-218, 2003.
      11. ALUÍSIO, S. M.; OLIVEIRA JR, Osvaldo Novais de ; NUNES, Maria das Graças Volpe ; KUHN, D. C. E. S. ; NASCIMENTO, A. C. ; MARCHI, Ana Raquel. Novos Rumos para o ReGra: extensão do revisor gramatical do português do Brasil para uma ferramenta de auxílio à escrita. Em: IV Encontro para o Processamento Computacional da Língua Portuguesa Escrita e Falada, v. 1, p. 167-182, 1999.
      12. SILVA, Bento C D ; SOSSOLOTE, Cassia ; ZAVAGLIA, Claudia ; MONTILHA, Gisele ; RINO, Lucia H M ; NUNES, M. G. V. ; OLIVEIRA JR, Osvaldo N ; ALUISIO, Sandra M. The Design of the Brazilian Portuguese Machine Tractable Dictionary for an Interlingua Sentence Generator. Em: III Workshop de Processamento da Língua Portuguesa Escrita e Falada, v. 1, p. 71-78, 1998.
      13. CALDEIRA, Sandra Maria Aluisio ; NUNES, M. G. V.. A Discourse Schema-Based Composing Tool. Em: 5th International Conference on Human-Computer Interaction, 1993, Orlando. Proceedings of 5th International Conference on Human-Computer Interaction, v. 1, p. 199, 1993.

    • Sandra Maria Aluísio ⇔ Moacir Antonelli Ponti (3.0)
      1. CASANOVA, EDRESSON ; JUNIOR, ARNALDO CANDIDO ; SHULBY, CHRISTOPHER ; Oliveira, Frederico Santos de ; Teixeira, João Paulo ; Ponti, Moacir Antonelli ; ALUÍSIO, SANDRA. TTS-Portuguese Corpus: a corpus for speech synthesis in Brazilian Portuguese. Language Resources and Evaluation. v. 2022.1, p. 1-13, issn: 1574-0218, 2022.
      2. CASANOVA, EDRESSON ; SHULBY, CHRISTOPHER ; KOROLEV, ALEXANDER ; JUNIOR, ARNALDO CANDIDO ; SOARES, ANDERSON DA SILVA ; ALUÍSIO, SANDRA ; Ponti, Moacir Antonelli. ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion. Em: INTERSPEECH 2023, v. 1, p. 1244-1248, 2023.
      3. CASANOVA, EDRESSON ; SHULBY, CHRISTOPHER ; GÖLGE, EREN ; MÜLLER, NICOLAS MICHAEL ; Oliveira, Frederico Santos de ; CANDIDO JR., ARNALDO ; SOARES, ANDERSON DA SILVA ; ALUISIO, SANDRA MARIA ; Ponti, Moacir Antonelli. SC-GlowTTS: An Efficient Zero-Shot Multi-Speaker Text-To-Speech Model. Em: Interspeech 2021, p. 3645-3649, 2021.

    • Sandra Maria Aluísio ⇔ Marcelo Finger (2.0)
      1. CASANOVA, EDRESSON ; GRIS, LUCAS ; CAMARGO, AUGUSTO ; DA SILVA, DANIEL ; GAZZOLA, MURILO ; SABINO, ESTER ; LEVIN, ANNA ; CANDIDO JR, ARNALDO ; ALUISIO, SANDRA ; FINGER, Marcelo. Deep Learning against COVID-19: Respiratory Insufficiency Detection in Brazilian Portuguese Speech. Em: Findings of the Association for Computational Linguistics: ACLIJCNLP 2021, p. 625-633, 2021.
      2. ALUÍSIO, S. M.; MONTILHA, Gisele ; FINGER, Marcelo ; NUNES, Maria das Graças Volpe ; TAGNIN, Stella O. The Lacio-Web Project: overview and issues in Brazilian Portuguese corpora creation. Em: CORPUS LINGUISTICS 2003, v. 16, p. 14-21, 2003.

    • Sandra Maria Aluísio ⇔ Ariani Di Felippo (1.0)
      1. PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.

    • Sandra Maria Aluísio ⇔ Jackson Wilke da Cruz Souza (1.0)
      1. PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.

    • Sandra Maria Aluísio ⇔ Ricardo Marcondes Marcacini (1.0)
      1. CASANOVA, E. ; SANTOS, V. G. ; SVARTMAN, F. R. F. ; LEITE, M. Q. ; CANDIDO JR, A. ; Marcacini, R. M. ; Solange Oliveira Rezende ; ALUÍSIO, Sandra Maria. Recursos para o processamento de fala. Em: Helena Medeiros Caseli; Maria das Graças Volpe Nunes. (Org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 1ed. : São Carlos. 2023.v. 1, p. 61-82.

    • Sandra Maria Aluísio ⇔ Roana Rodrigues (1.0)
      1. Torres, L. S. ; RODRIGUES, R. L. ; ALUÍSIO, Sandra Maria. Espanhol-Acadêmico-Br: A Corpus of Academic Portuguese Learners Produced by Native Speakers of Spanish. Em: Aluisio, S. M.; Tagnin. S. E. O.. (Org.). New Languages Technologies and Linguistic Research: a Two-Way Road. 1ed.Cambridge, England. : Cambridge Scholars Publishing. 2014.v. 1, p. 98-111.

    • Sandra Maria Aluísio ⇔ Solange Oliveira Rezende (1.0)
      1. CASANOVA, E. ; SANTOS, V. G. ; SVARTMAN, F. R. F. ; LEITE, M. Q. ; CANDIDO JR, A. ; Marcacini, R. M. ; Solange Oliveira Rezende ; ALUÍSIO, Sandra Maria. Recursos para o processamento de fala. Em: Helena Medeiros Caseli; Maria das Graças Volpe Nunes. (Org.). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. 1ed. : São Carlos. 2023.v. 1, p. 61-82.

    • Sandra Maria Aluísio ⇔ Francielle Alves Vargas (1.0)
      1. PARDO, THIAGO A.S.; BAPTISTA, J. ; DURAN, M. ; NUNES, Maria das Graças Volpe ; Nóbrega, F.A.A. ; ALUISIO, S. M. ; DI FELIPPO, Ariani ; SENO, Eloize Rossi Marques ; SILVA, R. R. ; ANCHIETA, R. T. ; BRUM, H. B. ; DIAS, MÁRCIO DE SOUZA ; MARTINS, R. S. O. ; Maziero, E.G. ; Souza, J.W.C. ; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.




Data de processamento: 03/02/2025 11:00:32