Fonctionnement et évolution du texte

Mise à jour le   26/10/2022

Responsables :
David Banks et Geoffrey Williams)

 

1. Le Texte Spécialisé

Le texte spécialisé est devenu depuis plusieurs décennies un champ fécond d’études linguistiques. Ces études sont de double nature, fondamentales et appliquées : fondamentales car elles nous renseignent sur la structure et le fonctionnement de la langue, et appliquées car elles sont indispensables pour les questions de rédaction ou de traduction, et dans l’enseignement des langues. Néanmoins, bien que ces études soient menées de longue date, deux aspects n’ont encore reçu que très peu d’attention. D’abord la comparaison du français et de l’anglais. L’anglais est devenu la langue de communication internationale dans la majorité des domaines de la langue spécialisée et il est indispensable de davantage mener des études comparatives avec notre langue nationale. Deuxièmement, l’aspect diachronique des langues de spécialité a été jusqu’à nos jours négligé. En effet, il existe des études historiques et des études sociologiques (voire sociolinguistiques), mais très peu d’études purement linguistiques, l’application des outils de la linguistique aux textes spécialisés ou littéraires, à travers les siècles, n’est que très rare. Les membres de l’équipe se considèrent comme des pionniers en la matière (surtout en ce qui concerne le texte spécialisé), car ils ont entamé l’étude de ce domaine depuis plusieurs années. Ces deux aspects peuvent se rejoindre dans des études qui sont à la fois comparatives et diachroniques.
A titre d’exemple, dans le domaine scientifique, où le texte constitue un texte de spécialité par excellence, l’année 1665 s’avère une année primordiale. En effet, cette année a vu la naissance des deux premières revues intellectuelles en langues vernaculaires. Le premier, français, le Journal des Sçavans, est paru pour la première fois le 5 janvier 1665, suivi deux mois plus tard par le Philosophical Transactions, en anglais, paru pour la première fois le 3 mars de la même année. Le Journal des Sçavans avait été fondé par Denis de Sallo, grâce à l’appui de Colbert, avec l’intention de fournir des informations sur toute une gamme de sujets intellectuels de l’époque. La revue consistait principalement en des recensements de livres. Le Philosophical Transactions fut fondé quant à lui par Henry Oldenburg, un des secrétaires de la Royal Society of London. Etant au centre d’un réseau de correspondances, il espérait utiliser sa position afin de créer un bulletin d’informations, comme moyen d’augmenter ses revenus. L’éventail des sujets traités était plus restreint que dans le Journal des Sçavans, car le Philosophical Transactions se limitait à la « philosophie naturelle », ce qui correspond grossièrement à notre conception du champ scientifique. Il s’agissait donc d’un bulletin d’informations basé principalement sur les lettres reçues par H. Oldenburg. Dès le début, ces deux revues, pourtant avec des objectifs très similaires, ont pris des options totalement différentes, en termes de sujets à traiter, et en termes de genres, ce qui les amena à favoriser des traits linguistiques bien différents. La situation en France se compliqua avec la création de l’Académie Royale des Sciences en 1666, mais les mémoires des premières années, au dix-septième siècle, ne furent publiés qu’au cours du siècle suivant. Ce champ d’études foisonne de rapports de force : entre la nouvelle science et l’ancienne basée sur l’étude des auteurs de l’Antiquité ; entre l’usage de l’anglais et du français, et entre ces langues vernaculaires et le latin, jusqu’alors lingua franca ; entre la pensée cartésienne et l’empirisme ; entre différents choix de genres.
Il est intéressant de noter que ces deux revues existent toujours, le Journal des Savants (l’orthographe ayant changé) se limitant aux sciences humaines, le Philosophical Transactions demeurant dans le champ scientifique. Cela donne un exemple du champ d’investigations qu’il est utile et intéressant de défricher. Les deux revues citées constituent un corpus qui recouvre certes toute la période (de 1665 à nos jours), mais il est possible et bon de prendre en compte d’autres textes tels que les mémoires de l’Académie des Sciences.
On peut considérer que ces deux revues marquent le début des langues spécialisées en ce qui concerne le français et l’anglais. Partant de leur étude, les recherches peuvent s’étendre et porter également sur l’époque contemporaine, avec, toujours à titre d’exemple, l’analyse du discours de prévention dans le domaine du cancer du sein, ou l’analyse des discours tenus sur l’introduction des nouvelles technologies, comme les OGM dans l’alimentation. De telles études resteront ouvertes quant au cadre théorique, mais on peut mentionner, sans exclusivité, les approches propres à l’analyse de discours, à la linguistique systémique fonctionnelle, à la théorie de l’énonciation et à la sémantique lexicale.

 

2. La Linguistique de corpus

La linguistique de corpus est, par sa nature même, pluridisciplinaire. Nos activités sont concentrées autour des nouvelles technologies et de l’utilisation des recommandations de la Text Encoding Initiative pour la création de ressources numériques en littérature et en histoire.
L’approche employée est ascendante ou corpus-driven, ce qui consiste à construire un modèle linguistique à partir des données plutôt que des intuitions du linguiste. Le cœur de l’approche reste la collocation en tant que relation sémantique et statistique entre mots. Les applications de ses recherches appliquées servent à la création d’outils concrets tels que des dictionnaires, des outils d’aide à la rédaction (SCIENTEXT), la partie compréhension d’un robot (EMOTIROB), des outils de navigation (METTRIC) ou la perception identitaire (IntUne) – mais le développement de la partie théorique est central puisque tout découle du rôle de la collocation thématique comme moteur dans l’organisation de la langue.
La linguistique de corpus s’est considérablement développée depuis ses origines sur les ordinateurs des années soixante. Les ordinateurs sont désormais plus puissants et l’accès aux corpus de référence et autres ressources lexicales est de plus en plus aisé. Cependant, les résultats d’une analyse dépendent entièrement du corpus ; il est impossible de généraliser à partir d’un corpus dont le seul critère de constitution a été la facilité d’accès et la disponibilité des textes. Il est par conséquent vital d’analyser le contenu des corpus avec des modèles externes mais également internes afin de juger de leur représentativité.
Les travaux contextualistes ont démontré l’importance de la collocation dans l’organisation interne du lexique. Les deux principes défendus par Sinclair (1987), celui du choix ouvert (open-choice principle) et celui de l’idiome (idiom principle) organisent nos choix linguistiques. Il est de plus en plus évident qu’une fois un choix ouvert opéré, nous sommes confrontés à des restrictions idiomatiques, qu’elles soient lexicales ou syntaxiques. Dans cette hypothèse, la notion d’idiomatisme est très large et va au-delà même des catégories de formules figées et d’idiomes répertoriées par Moon (1998) pour inclure les formules collocationnelles (Renouf et Sinclair 1991) et les grammaires locales (Hunston et Francis 2000). Cependant, bien que, dans une classification linguistique, la collocation soit classée avec les autres phénomènes de figement, les travaux de l’équipe conduisent à lui attribuer une place à part. Le rôle joué par la collocation dans l’organisation du lexique à la fois au niveau psychologique et linguistique est primordial.
Les théories de la résonance collocationnelle et de l’amorçage lexical essaient d’expliquer les mécanismes de l’acquisition du langage, de l’emploi et de l’évolution des langues. Comme toutes les théories issues de la linguistique de corpus, ces mécanismes sont construits à partir des faits du langage. La question est de connaître la pertinence éventuelle en lexicographie, et, dans le cas présent, en lexicographie bilingue.
La première constatation est que la simple équivalence n’existe pas en dehors de la terminologie technologique. Il semble donc évident qu’un dictionnaire bilingue ne peut être équivalent de deux dictionnaires monolingues mis face à face. Il faut des corpus comparables afin d’explorer les systèmes de relations internes pour chaque langue afin de comparer les systèmes et les sous-systèmes. L’étude des collocations d’un verbe va permettre de construire les classes d’arguments possibles ; ainsi nous voyons les classes d’identité qui apparaissent pour les verbes « forger » et « construire ». Il n’est pas certain que ces classes seront présentes dans le corpus de comparaison, ou que les traductions auront le même poids. Dans ce cas, il faut pouvoir montrer que « forger », par exemple est une collocation importante de l’identité en français, ce qui n’est pas nécessairement le cas en L2. Il est aussi évident que, même si « forger » et « construire » entrent dans la même classe sémantique, ils ne seront pas nécessairement des synonymes, leurs poids sémantique étant différents.
Les travaux sur la résonance collocationnelle se situent dans le contexte des recherches sur l’identitaire politique menées au sein du projet PCRD 6 IntUne. L’objectif est de modéliser l’identité présentée dans la presse afin de créer une ontologie de référence utilisable initialement par les chercheurs du consortium IntUne. Les réseaux collocationnels seront utilisés pour créer et comparer les regroupements thématiques extraits des différentes langues afin de voir comment les différents aspects de l’identité peuvent être privilégiés à un moment ou un autre par la presse d’un pays. La résonance collocationnelle servira pour traiter l’emploi de la métaphore et de la connotation par la presse.