Call for projects 2023 / Appel à projets 2023
The 2023 call for proposal is now closed // L’appel à projets 2023 est maintenant terminé.
La version française suit
Call for proposals 2023 - Textual data in SSH
Access the research potential of massive collections of textual data
As part of Coalition Publica activities, Érudit is developing large corpora of textual data through partnerships with the country's leading documentary institutions: Library and Archives Canada, Bibliothèque et Archives nationales du Québec, Canadiana / CRKN and the Bibliothèque de l'Assemblée nationale du Québec. These corpora include the full text of entire collections of newspapers, scholarly and cultural journals, magazines and government documents published in Canada.
In total, there are nearly 5 million text files available for computer-assisted analysis. The corpora were updated in the fall of 2022, to improve access and the quality of optical recognition. The collections date back to the 19th century and are unique in their temporal scope. They constitute an important primary resource for research in many disciplines such as history, sociology, linguistics, economics, literature, computer science and information systems. You can find out more by consulting Coalition Publica’s Services for Researchers page or on the corpora documentation.
Eligible projects and use of corpora
Eligible projects must be solely for research purposes and may not be commercially oriented. The research corpora are accessible from the Digital Research Alliance of Canada and Calcul Québec infrastructure. They can be batch downloaded by SSH key or by the big data transfer tool Globus. The processing of textual data corpora requires skills in computer analysis of big data, automated text mining and/or digital humanities.
Examples of projects carried out with corpora
A study employing an emergening research methodology, sentometrics, which transforms qualitative data (sentiment) into quantitative data (expressions of sentiment in a text).
Research on transatlantic exchanges in the press between Europe and America and the phenomenon of "virality" in the French press in the 19th century.
The creation of a digital research tool to identify conversations taking place within a community of researchers on social networks and to contextualize them.
workshops
To learn more about the research possibilities offered by these corpora and how to use them, we recommend the workshops offered by Calcul Québec and the Digital Research Alliance of Canada.
You can also subscribe to the Calcul Québec newsletter to be informed of upcoming events.
Submit an application
We invite you to submit your research project via this short form so that we may efficiently evaluate your data needs. The deadline to apply is March 31, 2023.
If you have any questions about this call for proposals, you may contact our team at corpus@erudit.org.
Appel à projets 2023 - Données textuelles en SHS
Accédez au potentiel de recherche de vastes ensembles de données textuelles!
Dans le cadre des activités de Coalition Publica, Érudit développe de vastes corpus de données textuelles grâce à des partenariats établis avec les principales institutions documentaires au pays : Bibliothèque et Archives Canada, Bibliothèque et Archives nationales du Québec, Canadiana / RCDR et la Bibliothèque de l’Assemblée nationale du Québec. Ces corpus comprennent le plein texte de collections entières de journaux, de revues savantes et culturelles, de magazines et de documents gouvernementaux publiés au Canada.
Au total, ce sont près de 5 millions de fichiers textuels disponibles pour analyse assistée par ordinateur. Les corpus ont été mis à jour au cours de l’automne 2022, afin de faciliter leur accès et d’améliorer la qualité de la reconnaissance optique des textes. Remontant au 19e siècle, ces corpus sont uniques par leur amplitude temporelle. Ils constituent une ressource de première importance pour la recherche dans de nombreuses disciplines comme l’histoire, la sociologie, la linguistique, l’économie, la littérature, l’informatique et les systèmes d'information. Vous pouvez en découvrir plus en consultant la page des Services aux chercheurs de Coalition Publica et les pages de Documentation du projet.
Projets admissibles et utilisation des corpus
Les projets admissibles doivent être poursuivis à des fins de recherche et ne peuvent faire l’objet de visées commerciales. Les corpus de recherche sont accessibles depuis l’infrastructure de l’Alliance de recherche numérique du Canada et de Calcul Québec. Ils peuvent être téléchargés en lot par clé SSH ou par l’outil de transfert de données massives Globus. Le traitement des corpus de données textuelles nécessite des compétences en analyse informatique des données massives, en fouille de textes automatisée et/ou en humanités numériques.
Exemples de projets réalisés avec les corpus
Une étude portant sur l’émergence de méthodologies de recherche telle que la sensométrie, qui transforme des données qualitatives (sentiments) en données quantitatives (expression de sentiment dans un texte).
Une recherche consacrée aux échanges transatlantiques dans la presse entre l’Europe et l’Amérique et au phénomène de “viralité” dans la presse francophone au XIXe siècle.
La création d’un outil de recherche numérique permettant d’identifier une partie des conversations qui ont cours au sein d’une communauté de chercheur·e·s sur les réseaux sociaux et de les contextualiser.
Formations
Pour en apprendre plus sur les possibilités de recherche qu’offrent ces corpus et sur les façons de les utiliser, nous vous recommandons de consulter le programme des formations offertes par Calcul Québec et l’Alliance de recherche numérique du Canada.
Vous pouvez aussi vous inscrire à l’infolettre de Calcul Québec afin d’être au courant des prochains événements.
Présenter une demande
Nous vous invitons à présenter rapidement votre projet de recherche dans ce court formulaire pour que nous puissions répondre efficacement à vos besoins en matière de données. La date limite de présentation pour une demande est le 31 mars 2023.
Pour toute question concernant cet appel à projets, vous pouvez communiquer avec notre équipe à l’adresse corpus@erudit.org.