La Géométrie de l'Analyse de Script : Comment les Sous-Titres et Surtitres de Théâtre Détectent les Dialogues
Machine-translated article. If any wording differs, English text prevails.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "TechArticle",
"headline": "La géométrie de l'analyse de script : Comment les sous-titres de théâtre détectent les dialogues",
"datePublished": "2026-03-11",
"author": {
"@type": "Organization",
"name": "SurtitleLive"
},
"keywords": [
"sous-titres de théâtre",
"surtitres",
"analyse de script",
"détection de repères de sous-titres",
"technologie théâtrale"
],
"about": {
"@type": "SoftwareApplication",
"name": "SurtitleLive"
}
}
</script>
Les systèmes modernes de sous-titres de théâtre dépendent d'une capacité essentielle : la détection précise des repères à partir des scripts.
Qu'il s'agisse de générer des surtitres pour l'opéra, des sous-titres pour les productions scéniques ou des sous-titres en direct pour l'accessibilité, le système doit déterminer de manière fiable :
* **Qui parle**
* **Quand une ligne commence**
* **Où les blocs de dialogue apparaissent dans le script**
À première vue, cela ressemble à un problème de traitement du langage naturel. En pratique, ce n'est pas le cas. Au cours du développement de **SurtitleLive v2**, nous avons analysé près de 100 scripts de différentes langues et traditions théâtrales. Ce processus nous a conduits à une conclusion surprenante : **Un script de théâtre n'est pas principalement une donnée linguistique. C'est une donnée spatiale.**
## 1. Le problème du script occidental : Structure sans ponctuation
Un script théâtral anglais typique repose sur des conventions de mise en page plutôt que sur la ponctuation pour définir les rôles.
### Exemple : Une mise en page de script de scène typique
> **HAMLET**
> Être ou ne pas être, telle est la question.
>
> **OPHÉLIE**
> Monseigneur, j'ai des souvenirs de vous.
Pour un lecteur humain, l'interprétation est évidente :
| Bloc | Interprétation |
| :--- | :--- |
| **HAMLET** | Nom du personnage |
| **Texte indenté** | Dialogue |
| **OPHÉLIE** | Nom du personnage |
Mais pour un analyseur qui ne voit que du texte brut, la structure disparaît. Nous reconnaissons les motifs parce que les noms des personnages apparaissent en **MAJUSCULES**, le dialogue est **indenté** et les blocs sont séparés par un espacement vertical. La grammaire des scripts occidentaux est typographique, pas linguistique.
## 2. Des blocs de script aux repères de sous-titres
Dans un environnement de performance en direct, le logiciel de sous-titrage n'affiche pas simplement du texte. Il doit convertir un script en une séquence de **repères de sous-titres**.
Chaque bloc de dialogue détecté devient un repère de sous-titre qui peut être déclenché pendant une performance en direct. Si l'analyseur identifie mal un bloc de dialogue, le système de sous-titrage déclenchera le mauvais repère - un échec inacceptable au théâtre en direct.
## 3. Ponctuation vs. Mise en page : Une découverte interlinguistique
La performance varie considérablement en fonction de la dépendance de la langue à l'égard des marqueurs explicites ou implicites.
### Chinois / Cantonais : Axé sur la ponctuation
Les scripts théâtraux chinois encodent souvent la structure de manière explicite :
> **張三:今天下雨。** (Zhang San : Il pleut aujourd'hui.)
> **李四:真的嗎?** (Li Si : Vraiment ?)
> **(他們望向窗外)** ((Ils regardent par la fenêtre.))
| Motif | Classification |
| :--- | :--- |
| **角色:台詞** (Personnage : Dialogue) | Dialogue |
| **(...)** (Parenthèses) | Indication scénique |
Cette structure axée sur la ponctuation rend l'analyse presque triviale par rapport aux formats occidentaux.
### Modèles de fiabilité du parsing (2026-03)
| Langue / format | Signal structurel | Goulot d’étranglement courant |
| :--- | :--- | :--- |
| **Chinois / cantonais** | Ponctuation explicite (角色:台詞) | Cohérence du format |
| **Japonais** | Guillemets stables | Variations mineures de format |
| **Anglais (US/UK)** | Structure de mise en page implicite | Indentation et capitalisation |
| **Allemand / français** | Mise en forme théâtrale complexe | Frontières de blocs ambiguës |
## 4. Le coût caché de la conversion des scripts en texte brut
De nombreux systèmes de sous-titrage traitent les scripts en convertissant d'abord les documents en texte brut, en supprimant les informations de mise en page.
**Script formaté original :**
> **HAMLET**
> Être ou ne pas être
**Après la conversion en texte brut :**
`HAMLET Être ou ne pas être`
Sans indentation ni limites de blocs, l'analyseur doit s'appuyer sur la **devinette sémantique** pour déterminer si "HAMLET" est un nom de personnage ou une partie de la phrase.
## 5. Le pivot architectural : Analyse axée sur la mise en page
Au lieu de demander "Que signifie cette phrase ?", la machine demande : **"À quoi ressemble géométriquement ce bloc de texte ?"**
En utilisant l'**extraction OOXML** à partir des fichiers `.docx`, nous récupérons des attributs de mise en page précis comme l'indentation (mesurée en twips), les drapeaux de capitalisation et les styles de paragraphe.
### Exemple : Signaux de mise en page extraits d'un script
**Bloc A :**
* `indent = 72pt`, `caps_ratio = 1.0`, `line_length = 8`
* **→ Classé comme Personnage**
**Bloc B :**
* `indent = 36pt`, `caps_ratio = 0.2`, `line_length = 48`
* **→ Classé comme Dialogue**
## 6. Indications scéniques : Quand la typographie devient structure
Dans de nombreux scripts théâtraux, les indications scéniques sont indiquées uniquement par la typographie - souvent en **italique**.
### Exemple : La typographie comme structure
> **HAMLET**
> Être ou ne pas être.
>
> *Il s'arrête et regarde vers le public.*
>
> **OPHÉLIE**
> Monseigneur ?
| Bloc | Interprétation |
| :--- | :--- |
| **HAMLET** | Nom du personnage |
| **Phrase indentée** | Dialogue |
| **Texte en italique** | Indication scénique |
Une fois le formatage disparu, l'analyseur ne peut pas distinguer le dialogue du récit. Certains scripts utilisent des notes italiques encore plus minimales :
> *pause*
> *se détourne*
Ceux-ci ne contiennent presque aucun indice linguistique, s'appuyant à 100% sur des attributs de style typographique comme `italic=true`.
## 7. Un modèle d'IA à trois niveaux pour une détection fiable des repères
Nous avons repositionné l'IA comme un réviseur plutôt que comme un devineur :
* **Niveau 1 - Règles déterministes :** Gère les formats explicites avec une précision de 100 %.
* **Niveau 2 - Examen de l'IA :** Agit comme un correcteur d'épreuves pour valider les classifications incertaines.
* *Exemple :* `HAMLET (à voix basse)`. Le système détermine si "(à voix basse)" est une indication scénique ou un dialogue en fonction du contexte du document.
* **Niveau 3 - Classification de l'IA :** Classification complète pour les régions très ambiguës, ancrée par des motifs de mise en page trouvés ailleurs dans le même document.
## Conclusion
En passant de la devinette sémantique au parsing centré sur la mise en page, **SurtitleLive** peut produire des cues candidats plus faciles à relire, corriger et utiliser en représentation.
---
## FAQ
**Q : Qu'est-ce qu'un repère de sous-titre au théâtre ?**
**R :** Un repère de sous-titre est le moment où une ligne de dialogue doit apparaître sur l'écran de sous-titrage. La détection des repères nécessite l'identification des blocs de dialogue et des transitions de locuteur dans le script.
**Q : Comment le système gère-t-il le formatage incohérent ?**
**R :** Notre système regroupe les mises en page similaires. Si un profil de document change, l'analyseur effectue une segmentation de la mise en page pour adapter sa stratégie en temps réel.
**Q : Pourquoi la mise en page est-elle importante lors de l'analyse des scripts pour les sous-titres ?**
**R :** De nombreux scripts utilisent l'indentation et l'espacement au lieu de la ponctuation pour encoder la structure. Un analyseur axé sur la mise en page détecte les repères de manière plus fiable que les modèles sémantiques seuls.