accueil

Tex4ht

Parmi les nombreux logiciels de conversion TeX/LaTeX vers HTML, t4ht est sans aucun doute le plus puissant : à partir du fichier DVI classique, il peut produire une sortie HTML, XHTML, MathML, DocBook ou TEI. La documentation succinte, les commandes cryptique et l’absence de maintenance en sont la contrepartie. J’utilies les commandes suivantes :

mk4ht xhmlatex “charset=utf-8, unicode, fn-in, sec-filename, no-DOCTYPE"

Un fichier de configuration pourrait ressembler à ça :

\Preamble{xhtml,2,NoFonts}

% Configuration du charset
\Configure{charset}{charset=utf-8}

% Configuration du doctype
\Configure{DOCTYPE}
	{\HCode{
	<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN"
	\Hnewline
    "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
    \Hnewline}}

% Configuration de l'espace de nom
\Configure{HTML}
	{\HCode{
	<html xmlns="http://www.w3.org/1999/xhtml">
	\Hnewline}}

% Configuration des balises meta
\Configure{@HEAD}{}
\Configure{@HEAD}
	{\HCode{
	<link rel=\string"stylesheet\string" type=\string"text/css\string"
	href=\string"style.css\string" />}}

\begin{document}

% Suppression de la navigation
\Configure{crosslinks+}{}{}{}{}{}{}
	{\IgnorePar\EndP\HCode{}}
	{\HCode{}\par\ShowPar}
	{\IgnorePar\EndP\HCode{}}
	{\HCode{}\par\ShowPar}


% Supression des liens de la table des matières
\Configure{toToc}{}{chapter}

% Configuration chapitre
\Configure{chapter}{}{}
	{\IgnorePar\HCode{<h2>}}{\HCode{</h2>}}

% Suprimer le style de tous les paragraphes.
\Configure{HtmlPar}
	{\EndP\HCode{<p>}}
	{\EndP\HCode{<p>}}
	{\HCode{</p>}}
	{\HCode{</p>}}


% Remplacement de \emph par <em>
\Configure{emph}
	{\Protect\HCode{<em>}}
	{\Protect\HCode{</em>}}

% Configuration titre des poèmes
\Configure{poemtitle}
   {\par\IgnorePar\EndP
       \HCode{<h2 class="poemtitle">}}
   {\HCode{}}
   {\ifvmode \IgnorePar\fi \EndP \HCode{</h2>}\par}

% titre des poèmes dans leur version étoilée
\Configure{likepoemtitle}
   {\IgnorePar\HCode{<h2 class="poemtitle">}}
   {\IgnorePar\HCode{</h2>}}

\EndPreamble