Comment convertir facilement entre les formats de document sous Linux

Comment convertir facilement entre les formats de document sous Linux / Linux

L'un des problèmes souvent cités avec le passage à Linux est la compatibilité des fichiers. Vous enverrez invariablement des utilisateurs de fichiers d’autres systèmes d’exploitation. Ils ne seront plus les mêmes lorsqu’ils seront ouverts dans des applications telles que Word. Vous pouvez installer des polices, essayer des machines virtuelles ou des émulateurs. 4 façons de rendre Linux compatible avec encore plus de logiciels. 4 façons de rendre Linux compatible avec encore plus de logiciels. Lisez-en plus pour vous assurer de la cohérence de l'apparence, une autre approche consiste à effectuer votre travail. au format texte brut, puis convertissez-le une fois que vous avez terminé.

Pandoc, un outil essentiel dans la boîte à outils de tout utilisateur de Linux, est l'un des outils que vous pouvez utiliser pour convertir les formats..

Installation et utilisation de base de Pandoc

L'installation de pandoc sur la plupart des distributions Linux est une simple visite dans les référentiels. Sur les systèmes Ubuntu, la commande suivante l'installe pour vous:

sudo apt-get install pandoc

Une fois installé, vous pouvez commencer à utiliser le programme en ligne de commande pour convertir les fichiers. Excellent pour la gestion de Markdown et d’autres langages de balisage légers, si vous avez une .MARYLAND fichier qui traîne, vous pouvez le convertir en HTML avec les éléments suivants:

pandoc -o monfichier.html monfichier.md

le -o le drapeau indique le nom du fichier de sortie tu veux. Dans ce cas, le format de sortie (HTML) est également déduit par l'extension du nom de fichier. Vous pouvez utiliser le -r (pour lis) et -w (pour écrire) des drapeaux pour indiquer à pandoc le type de conversion souhaité. Supposons que vous ayez l'habitude d'écrire dans Markdown, mais que vous deviez publier quelque chose sur une page basée sur Mediawiki:

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md 

Dans ses versions précédentes, pandoc était centré sur “mise à niveau” fichiers, dans le sens où il pourrait convertir des formats plus simples (tels que Markdown) en des formats plus complexes (par exemple, ODT ou DOCX de Microsoft). Mais ça va maintenant lis ces formats plus compliqués aussi. Cela signifie que si vous êtes habitué à un traitement de texte mais que vous êtes tenté par toutes les raisons d'utiliser un format de texte brut plus petit et plus portable Qu'est-ce que Markdown? 4 raisons pour lesquelles vous devriez apprendre maintenant Qu'est-ce que Markdown? 4 raisons pour lesquelles vous devriez apprendre maintenant Fatigué des éditeurs HTML et WYSIWYG? Alors Markdown est la solution pour vous, peu importe qui vous êtes. Lire la suite, c'est devenu beaucoup plus facile.

Dans un répertoire rempli de fichiers Word, la commande suivante convertira chacun d’eux en Markdown:

pour le fichier dans * do pandoc -r docx -w markdown -o "$ fichier" .md "$ fichier" done

Notez que cela vous laissera avec des fichiers nommés filename.docx.md, vous aurez donc besoin d'exécuter une commande de renommage rapide (ou mieux encore, ajoutez-la à ce qui précède en tant que script shell. 5 Idées d'installation Linux débutant pour les tâches cron et scripts Scripts 5 Idées d'installation Linux débutant pour les tâches cron et les scripts Shell avec des scripts bash , vous pouvez effectuer rapidement une série complexe de tâches, ce qui en fait un outil idéal pour les besoins complexes et répétitifs, ainsi qu’un excellent moyen de connaître le terminal. Lire la suite).

Options de ligne de commande Pandoc

Maintenant que vous avez quelques notions de base, nous allons examiner certaines des options les plus avancées des options de ligne de commande de pandoc..

Fichiers de référence ODT / DOCX

Supposons que vous ayez converti tous vos anciens fichiers de traitement de texte volumineux en Markdown. Lorsque vous vous délectez de la joie de rédiger en texte brut, vous devrez éventuellement les partager avec quelqu'un. Et que quelqu'un ne soit pas aussi éclairé que vous. Vous pouvez simplement inverser la lis et écrire drapeaux pour reconvertir votre fichier au format Word:

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

Mais certains aiment leurs fichiers Word avec des polices particulières, des en-têtes numérotés, etc. Pandoc's DOCX back-end prend en charge les fichiers de modèle, appelés fichiers de référence, pour une telle occasion. Ceux-ci sont ODT ou DOCX les fichiers que vous avez configurés avec tout le style dont vous avez besoin. Puis pandoc applique ces styles lorsqu’il est converti si vous lui transmettez le fichier de référence à la ligne de commande:

pandoc -r markdown -w odt --reference-odt = / home / utilisateur / chemin / vers / ref-fichier.odt -o lowriter.odt lowriter.md

Notez que les polices configurées dans le fichier de référence ci-dessus (Arial Black pour l'en-tête 1, etc.) s'affichent dans le fichier converti ci-dessous. Vous pouvez créer autant de fichiers de référence que nécessaire (par exemple, un par client). Ignorez alors complètement la mise en forme pendant que vous écrivez et appliquez le style en une étape lors de la conversion..

Arrière-plans de rendu PDF

La création de fichiers PDF est également un exercice simple, une fois que vous avez installé certains packages nécessaires. Un moyen léger d’obtenir la capacité d’écriture PDF consiste à installer le wkhtmltopdf package, un outil de ligne de commande permettant de convertir HTML en PDF. pandoc le supporte de manière native, donc si vous définissez la écrire drapeau HTML, mais le fichier de sortie en tant que PDF, il interprétera cela comme votre intention d'utiliser wkhtmltopdf tout seul!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

Alternativement, vous pouvez choisir l'option complète en utilisant le système de composition TeTex. Profitez du fait que ces forfaits sont Installations suggérées pour le paquet pandoc en réinstallant avec la commande suivante:

sudo apt-get install --install-suggère à pandoc

Ensuite, installez-vous tranquillement pendant l'installation de nombreux paquets (en réalité). Une fois qu'ils sont terminés, vous pouvez convertir votre fichier directement au format PDF en le spécifiant comme fichier. écrire drapeau:

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

Tandis que le wkhtmltopdf Cette option nécessite l’installation d’un seul paquet. Vous pouvez obtenir des résultats plus faciles à imprimer avec TeTex. À savoir, les polices empattées sont utilisées par défaut et les pages sont automatiquement numérotées..

Ebook Generator

Enfin, pandoc peut convertir vos fichiers en livres numériques qui peuvent être lus sur un téléphone ou une liseuse. Comment gérer votre collection de livres électroniques sur Amazon Kindle avec Calibre Comment gérer votre collection de livres électroniques sur Amazon Kindle avec Calibre Le plus gros problème avec un lecteur de livre numérique tel que le Kindle d'Amazon est qu'il nécessite un effort déraisonnable pour déplacer des livres entre différents appareils. Avant Kindle, je suis tombée amoureuse de Calibre. Un peu lourd… Lire la suite. le epub et epub3 back-end vous donnera un ebook correctement formaté:

pandoc -r markdown -w epub -o mybook.epub mybook.md 

Conseils avancés

Pandoc va au-delà de sa puissance en tant qu'utilitaire de ligne de commande… par exemple, il prend en charge une version améliorée de Markdown et peut facilement être intégré à des applications graphiques..

Saveur Pandoc Markdown

En plus d'être un outil de conversion, pandoc prend en charge une version légèrement améliorée de Markdown. En utilisant pandoc au lieu de la norme réduction commande, vous disposez de fonctionnalités supplémentaires, notamment les suivantes:

  • Métadonnées - La version Pandoc de Markdown vous permet d'inclure des informations dans l'en-tête de votre document, telles que l'auteur, la date, l'adresse électronique, etc..
  • Décorations de texte - Vous pouvez appliquer des décorations de texte telles que barré ou super / indice qui ne sont pas pris en charge dans Markdown par pandoc..
  • les tables - Cela seul fait que pandoc vaut la peine comparé à “vanille” Réduction. En utilisant le caractère de canal pour séparer les cellules d'un tableau, vous pouvez créer un tableau qui va de très laid à lisible par l'homme en texte brut ainsi que dans le format de rendu..
  • Listes de fantaisie - Pandoc vous permet de formater des listes avec des niveaux de style de contour, par exemple. “1.,” puis “UNE.,” puis “je.,” etc. Vous pouvez également spécifier un numéro de départ pour les listes, où les listes en clair Markdown commencent à “1.”
  • Mise en évidence de la syntaxe du code - Vous pouvez appliquer la surbrillance à vos blocs de code en indiquant à pandoc le langage utilisé..

Ce qui précède ne représente qu’une sélection des fonctionnalités de pandoc Markdown. Visitez la page de manuel sur pandoc.org pour obtenir une liste complète des extras que cette variante de Markdown fournit..

Utiliser une interface graphique avec pandoc

Bien que pandoc soit efficace en tant qu'outil de ligne de commande, il contient de nombreuses options. Si vous débutez avec Linux, vous préférerez peut-être utiliser pandoc avec une interface graphique. Bien qu’il ne contienne pas d’interface graphique par défaut, vous pouvez installer PanDocElectrion convertir vos documents avec pointer-cliquer. Téléchargez le script d'installation à partir du site Web de l'application, puis exécutez-le pour installer tous les packages nécessaires et le programme lui-même..

Une fois installé, le npm start commande dans le PanDocElectron répertoire va lancer l'application. Avec des listes déroulantes pour les formats et la possibilité de choisir le fichier d’entrée avec une boîte de dialogue, cela vous aidera à vous habituer à la “entrées et sorties” de pandoc, pour ainsi dire.

Si vous êtes à l'aise avec la myriade d'options et de drapeaux de pandoc mais que vous voulez simplement un moyen de appel vous pouvez l’intégrer à votre éditeur de texte graphique. Par exemple, l'éditeur Atom contient un certain nombre de packages qui permettent d'enregistrer le fichier actuel dans différents formats à l'aide de pandoc (package pandoc-convert):

Une autre option consiste à exécuter des commandes pandoc à l'aide des fonctions intégrées d'un éditeur, telles que la commande build. Atome outils de construction package vous donne la possibilité de spécifier des commandes personnalisées:

Ensuite, vous pouvez appeler la commande build sur vos fichiers compatibles avec pandoc, comme vous le feriez avec le code source:

Pandoc soulage une partie du stress de la commutation

Avec pandoc dans votre boîte à outils, vous pouvez vous reposer plus facilement en sachant que vous pouvez toujours transmettre vos documents à d'autres personnes dans le format dont ils ont besoin. Dans le même temps, vous pouvez tirer parti de certaines fonctionnalités intéressantes de Linux (envisagez de donner à l'un des éditeurs de texte basés sur des terminaux, comme vim un essai).

Vous trouvez-vous souvent en train de convertir des fichiers entre deux formats? Si vous rencontrez des problèmes de compatibilité, veuillez nous en informer dans les commentaires, et nous verrons si nous pouvons utiliser pandoc pour vous aider.!

Crédit d'image: Nirat.pix via Shutterstock.com

En savoir plus sur: Conversion de fichier, Markdown.