Recrutamento de dois/duas anotadores/as em regime de prestação de serviços, no âmbito do projeto MAICT

MAICT: A Multimodal Approach for Identifying Conspiracy Theories in Social Media

Projeto EXPL/LLT-LIN/1104/2021

Recrutamento de dois/duas anotadores/as em regime de prestação de serviços, no âmbito do projeto MAICT – A Multimodal Approach for Identifying Conspiracy Theories in Social Media – EXPL/LLT-LIN/1104/2021, financiado pela FCT FUNDAÇÃO PARA A CIÊNCIA E A TECNOLOGIA. 

Duração da prestação de serviços: 

5 meses, com início em outubro de 2022

Remuneração:

A remuneração mensal da presente prestação de serviços é de 875.98€ (equivalente aos valores estipulados no Regulamento de bolsas da Fundação para a Ciência e a Tecnologia, cujas tabelas estão disponíveis em https://www.fct.pt/apoios/bolsas/docs/Tabela_de_Valores_SMM_2022.pdf), valor a ser liquidado mensalmente por transferência bancária para a conta bancária indicada pelo/a prestador/a de serviços.

Objetivos/plano de trabalho:

O principal objetivo do projeto é investigar e formalizar de forma sistemática as principais propriedades linguísticas, discursivas e semióticas utilizadas na produção de teorias da conspiração, recorrendo a diferentes modos – tratando-se, por conseguinte, de uma abordagem multimodal. O projeto prevê a criação de recursos linguísticos inovadores que possam ser utilizados para prestar apoio à deteção e classificação automática de socioletos utilizados para produzir teorias da conspiração divulgadas nos media sociais contemporâneos.

O/a candidato/a a recrutar no âmbito deste projeto irá trabalhar na análise e na anotação de textos de um corpus multimodal de teorias da conspiração recolhidos a partir de meios online (tais como, mas não exclusivamente, plataformas das redes sociais e/ou blogs). A anotação manual basear-se-á numa taxonomia de elementos linguísticos e discursivos, conforme a investigação mais recente na área da linguística forense. Esta taxonomia inclui: i) características idiossincráticas identificadas na literatura como sendo discriminatórias; e ii) padrões identificados com base numa análise preliminar do corpus recolhido no âmbito do projeto.

Orientação científica:

As atividades serão orientadas por Rui Sousa-Silva, Professor Auxiliar da Faculdade de Letras da Universidade do Porto e investigador do CLUP, e por Paula Cristina Quaresma da Fonseca Carvalho, Investigadora do INESC-ID Lisboa.

Requisitos: 

O/A candidato/a deverá: 

(a) possuir Mestrado em Ciências da Linguagem ou área afim; ou 

(b) frequentar Mestrado em Ciências da Linguagem ou área afim; ou

(c) frequentar Doutoramento em Ciências da Linguagem ou área afim.

Fatores preferenciais:

Será dada preferência a candidatos que possuam:

– Conhecimentos/interesse na área da linguística forense, análise crítica do discurso, processamento de linguagem natural e/ou linguística computacional.

– Conhecimentos de linguística de corpus.

– Elevados conhecimentos de língua inglesa.

– Experiência prévia em anotação.

Formalização de candidaturas:

Para formalizarem a sua candidatura, os candidatos deverão enviar para o endereço de correio eletrónico rssilva@letras.up.pt os documentos infra, em formato pdf.  

– Cópia do certificado de habilitações;

– Lista detalhada de classificações;

– Prova de inscrição (no caso de se encontrar insrito/a em Mestrado ou Doutoramento a decorrer);        

– Curriculum Vitae detalhado;          

– Carta de motivação, justificando o interesse na prestação de serviços;    

Prazo de candidatura:

Até às 24 horas do dia 27 de setembro de 2022.

Resumo do projeto:

MAICT: A Multimodal Approach for Identifying Conspiracy Theories in Social Media

The aversive feelings that people experience in scenarios of crisis, such as fear, uncertainty, and the feeling of being out of control, stimulate adherence to conspiracies and promote their fast propagation [PROO17]. The COVID-19 pandemic, one of the most challenging global societal crises we are facing nowadays, has boosted the proliferation of conspiracy theories on social media to unprecedented levels. According to recent studies, denialism, i.e. the psychological predisposition to reject expert and authoritative information, the conspiracy thinking, i.e. tendency to view challenging societal events as the product of conspiracies, and partisanship are the the key ingredients behind COVID-19 conspiracy beliefs [USCI20]. While some conspiracy theories may have no huge impact on people’s lives, others, such as the ones related to medical and public health topics can be particularly dangerous for individuals and a menace to democratic societies. Therefore, research on misinformation, including conspiracy theories, is becoming  increasingly relevant.

Although there is a diversity of approaches on conspiracy theories from different fields, including psychology, political science, sociology, history, and media studies [DOUG19], research on the language mechanisms and strategies used in conspiracy narratives abounding in social media is still scarce. The advent of large social media platforms offers an unique opportunity to access an immensity of real-world data that will allow answering crucial research questions related to language use and communication dynamics. One critical question concerns the identification of the main conspiracy sociolects (i.e. the sociolinguistic characteristics shared by authors of conspiracy theories) in social media. Another important issue concerns the identification of the most important relationships between complementary modes of communication – particularly, text and image – co-occurring in the same conspiracy content.

Multimodal approaches, relying on the joint analysis of language patterns from multiple modalities, are critical to dissecting conspiracy theories, key to  the development of robust and reliable conspiracy detection systems. This exploratory project aims at developing an innovative multimodal (text-image) conspiracy grammar for Portuguese, based on a multidisciplinary approach, crossing knowledge and methods from Corpus Linguistics, Forensic Linguistics, Discourse Analysis, Social Semiotics, and Natural Language Processing (NLP).

The research will be based on a large and representative multimodal corpus composed of text-image conspiracy content posted by Portuguese speaking users in a variety of social media platforms and blogs. This corpus will be finely-grained annotated with syntactic-semantic, pragmatic-discursive, and social semiotic attributes. These will allow performing complex and refined queries on the corpus, in order to identify relevant multimodal patterns, which will be thus systematically described in our conspiracy grammar. The challenges in the grammar creation involve, among other aspects, the integration and articulation of objective and subjective knowledge from different sources, and the dynamic description of a huge set of relationships involving all the language dimensions considered in this study.

This innovative resource will contribute both to the systematic characterization of multimodal conspiracy narratives in social media, and will help to understand how linguistics, pragmatics and social semiotics interact to create new and engaging conspiracy narratives. Furthermore, it will support the development of methods for conspiracy detection, and machine-assisted conspiracy sociolects identification.  

We believe that this exploratory project will contribute to advancing the state-of-the-art in multimodal misinformation studies, answering, among others, the following research questions: 

1.         Which are the most predominant morphosyntactic, lexico-syntactic, semantic and discursive features in conspiracy theory narratives that abound in social media, and how do they relate to each other?

2.         Which meanings can be inferred from images that include conspiracy narratives, from a social semiotics point of view?

3.         How do text and image articulate in multimodal conspiracy narratives to create either a unified or a dissociated meaning?

4.         Which are the most suitable approaches to describe and formalize the multimodal properties from text and image, and respective interaction, in view of their automatic processing?

5.         How can Portuguese conspiracy sociolects be characterized from a multimodal point of view?

We have formed a multidisciplinary research team including researchers from corpus linguistics, forensic linguistics, discourse studies, social semiotics and natural language processing, critical to successfully achieve the project’s goals.