Services aux chercheurs
Coalition Publica soutient les pratiques de recherche novatrices en sciences humaines et sociales, arts et lettres, par le développement de vastes ensembles de données textuelles, la curation de données bibliométriques et la mise à disposition de logiciels libres d’édition savante numérique.
Données textuelles
Donner accès à un véritable réservoir de données massives (big data) de nature textuelle
Le texte joue un rôle central en sciences humaines et sociales, et en arts et lettres. Matière première de la recherche, le texte est aussi le véhicule privilégié de diffusion de ses résultats. Sous format numérique, et rassemblé en de vastes ensembles de publications en texte intégral, le texte devient une donnée de recherche dont le potentiel pour la génération de nouveaux savoirs est très grand.
Description de la collection : L’étendue des publications rassemblées fait de nos corpus de recherche une ressource de première importance pour la recherche dans de nombreux secteurs du savoir : histoire, sociologie, linguistique, économie, littérature et bien d'autres. Nos corpus soutiennent la recherche qui intègre de façons variées le numérique : analyse du discours, traitement automatique de la langue, intelligence numérique ou encore fouille textuelle.
Revues, quotidiens, magazines
Érudit, 342 revues, couverture de 1905 à 2024, 568,478 fichiers, 203 Go
Bibliothèques et Archives nationales du Québec, couverture à partir du 17e siècle, 4,627,040 fichiers, 18 To
Canadiana/RCDR, couverture à partir du 18e siècle jusqu’à 1930, 80 085 fichiers, 405 Go
Bibliothèque et Archives Canada, couverture de 1820 à 1917, 789 fichiers, 5 Go
Débats parlementaires
Bibliothèque et Archives Canada
Gazette du Canada, couverture de 1842 à 1997, 14 560 fichiers, 206 Go
Conclusion du Cabinet, couverture de 1944 à 1979, 41 249 fichiers, 10 Go
Bibliothèque de l'Assemblée nationale du Québec
Journal des débats de l’Assemblée nationale du Québec, couverture de 1908 à 2019, 33 339 fichiers, 31 Go
Rapports gouvernementaux
Centre national pour la vérité et la réconciliation, couverture de 2002 à 2021, 15 391 fichiers, 535 Mo
Données bibliométriques
Stimuler l’étude de l’écosystème de la recherche
Envisagées comme objets intellectuels portant les traces de l’évolution conceptuelle, sociale ou historique de la science, les publications scientifiques sont une ressource unique pour qui étudie la science comme objet social, questionnant comment la recherche se constitue, se communique, se relaie, ou encore comment l’écosystème de la recherche est structuré et comment les connaissances scientifiques se développent.
Description de la collection : la collection de données bibliométriques couvrent les revues diffusées sur erudit.org.
Métadonnées et texte intégral balisé sémantiquement (toute la collection)
Numéros d’archives et numéros courants, métadonnées et plein texte balisés en XML EruditArticle, compatible avec JATS XML, mise à jour annuelle
Pour un aperçu de la structuration du corpus, voir le schéma XML EruditArticle, et consulter notre documentation.
Métadonnées enrichies (articles publiés de 2015 à l’année civile la plus récente)
Métadonnées enrichies de plus de 30,000 articles savants publiés sur erudit.org : nombre d’auteurs, ordre d’apparition, genre du premier auteur, affiliation brut et normalisé, type d'accès, etc.
Pour la liste complète des métadonnées colligées ainsi que leur description, vous pouvez nous joindre à l’adresse suivante : corpus@erudit.org.
Modalités d’accès aux données
Données textuelles : l’accès aux corpus est réservé à des fins de recherche et d’enseignement. Il est soumis à la loi canadienne sur le droit d’auteur. Les chercheurs et étudiants qui accèdent aux corpus s'engagent à ne pas diffuser ni commercialiser les publications des corpus. La marche à suivre est la suivante :
Complétion et transmission d’un formulaire de description de projet (contactez nous à corpus@erudit.org pour demander le formulaire)
Évaluation du projet sur la base des critères suivants : la personne demanderesse est rattachée à une institution d’enseignement; elle confirme que les corpus ne seront pas utilisés à des fins commerciales ni diffusés dans leur intégralité
Signature d’un contrat d’utilisation
Création d’un compte sur Calcul Canada
Téléchargement (clé SSH, l’outil de transfert Globus).
Formations
Pour en apprendre plus sur les possibilités de recherche qu’offrent ces corpus et sur les façons de les utiliser, nous vous recommandons de consulter le programme des formations offertes par Calcul Québec et l’Alliance de recherche numérique du Canada. Vous pouvez aussi vous inscrire à l’infolettre de Calcul Québec afin d’être au courant des prochains événements.
Métadonnées enrichies : les métadonnées enrichies sont disponibles pour téléchargement sur Dataverse. Elles sont accessibles sous licence CC0. À des fins de suivi, il est demandé aux usagers de s’identifier lors du téléchargement.
Contact : une équipe d’experts vous guide pour un accès rapide et efficace aux données textuelles et bibliométriques de notre dépôt de recherche. Si vous avez des questions ou des commentaires, vous pouvez nous joindre à l’adresse suivante : corpus@erudit.org.
Logiciels ouverts d’édition scientifique
Soutenir l’avancement technologique des systèmes de production et de diffusion d’information scientifique
Les logiciels libres et les standards ouverts d’édition scientifique résultent de recherches appliquées sur les systèmes de production et de diffusion d’information. Ils assument par ailleurs un rôle de vecteur de recherche additionnelle dans le secteur de l’édition scientifique numérique : les logiciels libres peuvent être utilisés, étudiés, modifiés ou encore dupliqués par quiconque le souhaite, en fonction de la licence qui leur est attribuée et des besoins des communautés.
Description du logiciel : Open Journal Systems (OJS) est un logiciel de gestion éditoriale dédié aux revues savantes numériques hautement flexible. OJS peut être téléchargé gratuitement et installé sur un serveur Web local. OJS utilise PHP et JavaScript ainsi que MySQL/MariaDB comme base de données de stockage. OJS peut être exécutée sur des environnements de serveurs Linux/Mac et il est sous licence GNU GPL v3. L'intégration avec la plateforme erudit.org, ainsi qu’avec les services de plusieurs organisations et infrastructures oeuvrant à l’interopérabilité des systèmes et des contenus - tels que Crossref, ORCID, SWORD, etc. - est facilitée par l'utilisation de plugins, disponibles sous licences ouvertes.
Modalités d’accès et services : Les logiciels développés sont disponibles gratuitement sur la plateforme GitHub. Vous pouvez trouver la documentation OJS dans le centre de documentation de PKP, et pour contribuer à la documentation, lisez nos directives pour les contributeurs, contactez-nous, ou participez à un sprint de documentation virtuel. Nous encourageons les contributions au développement de notre logiciel, et fournissons de la documentation sur la façon d'écrire des plugins et d'étendre le logiciel (entre autres choses). Abonnez-vous à notre bulletin d'information pour les développeurs. Le personnel de PKP fournit un soutien gratuit dans le forum de la communauté PKP. PKP fournit également un soutien consultatif payant, directement par les développeurs et les techniciens de PKP, au cas par cas par le biais des services d'édition de PKP, et dans certains cas, entreprendra le développement sponsorisé de nouvelles fonctionnalités dans OJS, s'il existe un besoin démontré de la communauté.
Des questions?
Pour toute question concernant les services aux chercheurs, vous pouvez communiquer avec notre équipe à l’adresse corpus@erudit.org.