Verbs in specialised corpora: From Manual Corpus-Based Description to Automatic Extraction in an English-French Parallel Corpus, Proceedings of Corpus Linguistics 2003 - Université Paris Cité Accéder directement au contenu
Article Dans Une Revue UCREL Technical Paper Année : 2003

Verbs in specialised corpora: From Manual Corpus-Based Description to Automatic Extraction in an English-French Parallel Corpus, Proceedings of Corpus Linguistics 2003

Résumé

This paper tackles the issue of verbs in specialised corpora in the view of term extraction. Corpus-based manual descriptions to be used in various applications have highlighted the “deviant” uses of verbs in specialised corpora compared with general uses as well as the need for verb extraction. However, very few attention has been given to verbs both in the terminology theory and automatic term extraction. In the light of a manual corpus-based description, we investigate the status of verbs in an English-French (highly specialised) parallel corpus and advocate a verb-oriented analysis in the framework of a corpus-based parser adapted to verb extraction. Section 1 deals with the status of verbs in the terminology theory; section 2 introduces the framework of the experiment and focuses on the characterisation of the parallel corpus in the domain of Computer Science. Section 3 is dedicated to the corpus-based manual description. Finally, section 4 introduces a corpus-based automatic analysis.
Cet article aborde la question des verbes dans les corpus spécialisés dans l'optique de l'extraction de termes. Les descriptions manuelles basées sur corpus que l'on utilise dans diverses applications, ont mis en évidence les utilisations "déviantes" des verbes dans les corpus spécialisés par rapport aux utilisations générales, ainsi que la nécessité d'une extraction des verbes. Cependant, on a accordé très peu d'attention aux verbes, tant dans la théorie de la terminologie que dans l'extraction automatique de termes. A la lumière d'une description manuelle basée sur un corpus, nous étudions le statut des verbes dans un corpus parallèle anglais-français (hautement spécialisé) et préconisons une analyse orientée vers les verbes dans le cadre d'un analyseur syntaxique basé sur un corpus et adapté à l'extraction de verbes. La section 1 traite du statut des verbes dans la théorie terminologique ; la section 2 présente le cadre de l'expérience et se concentre sur la caractérisation du corpus parallèle dans le domaine de l'informatique. La section 3 est consacrée à la description manuelle basée sur le corpus. Enfin, la section 4 présente une analyse automatique basée sur le corpus.
Fichier principal
Vignette du fichier
kubler.pdf (389.85 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01217611 , version 1 (06-04-2024)

Identifiants

  • HAL Id : hal-01217611 , version 1

Citer

Natalie Kübler, Cécile Frérot. Verbs in specialised corpora: From Manual Corpus-Based Description to Automatic Extraction in an English-French Parallel Corpus, Proceedings of Corpus Linguistics 2003. UCREL Technical Paper, 2003, 16, pp.429-438. ⟨hal-01217611⟩
104 Consultations
1 Téléchargements

Partager

Gmail Facebook X LinkedIn More