Le Pressoir est un générateur de sites statiques conçu pour la création de livres enrichis en html. Pensé en priorité par et pour des chercheur·se·s en sciences humaines et sociales, il permet de publier des textes riches en données et en informations comprenant, notamment, des métadonnées détaillées, des bibliographies structurées, des notes de bas de page, un balisage infra-textuel (permettant d’identifier des termes sélectionnés, de les relier à des autorités et de créer des objets éditoriaux : index, glossaire, cartographie…), des contenus additionnels (illustrations, vidéos, compléments textuels…), des index automatiques, un outil d’annotation (avec Hypothes.is), research queries …
En s’appuyant sur une chaîne de publication modulaire, ce générateur s’adapte aux besoins comme aux contraintes de l’édition numérique et peut être utilisé pour produire des livres enrichis, des supports de cours, de la documentation et tous types de publications numériques.
Le Pressoir est basé sur des outils libres et ouverts. Le code est disponible en open source sous licence GPLv3 sur un dépôt de l’instance GitLab d’Huma-Num.
Principes techniques
Les choix techniques et éditoriaux ont été établis selon cinq principes généraux :
- la granularité des contenus et la structuration fine des données,
- la modularité de la chaîne éditoriale et des différents formats,
- le low-tech appliqué aux formats et aux logiciels, comme garantie de soutenabilité et de pérennité de la chaîne et des contenus produits,
- la pérennité des données et de leur accessibilité,
- le logiciel libre, l’ouverture des sources et l’accès ouvert.
Suivant ces principes, les textes, les métadonnées et les références bibliographiques sont édités respectivement dans les formats markdown, yaml et bibtex, à partir desquels le Pressoir produit des fichiers html statiques. Les ouvrages peuvent donc être simplement déposés sur un serveur, ou déployés via une forge logicielle.
Historique
À l’origine du projet, en 2018, le script de production était écrit en bash, et mobilisait les logiciels et langages suivants : Pandoc (génération des contenus en html), XSLT (enrichissement des html), BaseX et XQuery (production des index). Il a par la suite été implémenté dans un script Python destiné à l’usage interne des deux collections impliquées dans son développement : Les Ateliers de [sens-public] et « Parcours Numériques » (pour les Presses de l’Université de Montréal). Courant 2024, il a finalement été distribué comme paquet Python accessible à tou·te·s et utilisable au-delà des collections pour lequel il avait été originellement pensé, et en 2025, accessible depuis le gestionnaire de paquets Python "UV".