Le mpg-blog

LaTeX et autres geekeries

Detexify

with 4 comments

Pour fêter la rentrée après des mois de silence, un tout petit billet en forme de lien vers un outil génial, que j’ai découvert cet été, et dont j’ai réalisé aujourd’hui que je n’en avais pas encore parlé à tous mes amis (on va voir si mes amis lisent ce blog) : detexify.

C’est un outil en ligne qui permet de dessiner un symbole quelconque, en général un symbole mathématique, et d’avoir en retour la commande LaTeX (avec le nom du package qui la fournit, le cas échéant). C’est une façon efficace et, avouons-le, bien marrante, de fouiller dans symbols-a4. Le seul avantage qui reste à ce document, est qu’on peut le consulter hors-ligne facilement (avec les commandes texdoc symbols-a4 sous TeX Live et mthelp symbols-a4 sous MiKTeX).

Written by mpg

octobre 16th, 2009 at 2:35

Posted in TeX et compagnie

Tagged with ,

4 Responses to 'Detexify'

  1. ouep, cet utilitaire est fort. J’ai contacté son auteur pour savoir si on pouvait généraliser cette approche à l’ensemble des caractères existants (je ne vois pas pourquoi ça ne serait pas possible). On pourrait alors imaginer (pour ma part) un programme capable de transformer un document scanné en source LateX :):):) Ça serait géant. Plein de vieux documents de qualité retraduits en Latex !! Je continue de rêver.

    pluton

    8 déc 09 at 22:51

  2. Ce qui risque d’être dur, c’est qu’au-delà des caractères, il y a d’une part leur agencement entre eux (indices, exposants, limites, matrices) d’autre part la structure du texte (sections, notes de bas de pages, références croisées) à récupérer. Et là, je n’y connais rien, mais j’imagine que c’est une autre paire de manches…

    mpg

    8 déc 09 at 22:57

  3. on pourrait entrevoir plusieurs passages: (1) appel à detexify pour reconnaître l’ensemble des caractères du fichier scanné directement traduit en source Latex (avec séparation des mots mais aussi avec toutes les erreurs que cela peut générer), (2) comparaison à un dictionnaire pour filtrer la plus grande partie des erreurs, (3) détection des environnements mathématiques et (4) appel au cerveau humain pour la finalisation. C’est déjà pas mal de travail associé à un algorithme.

    Les tableaux et autres figures attendront dans un premier temps :)

    pluton

    9 déc 09 at 21:42

  4. pluton

    13 déc 09 at 16:31