<ENV 725> APPEL A PROPOSITIONS ELRA/DGLF 1999-2000


4/02/2000

**************Resumen en castellano**************

Convocatoria de la Asociación Europea de Recursos Lingüísticos (ELRA) y la Délégation générale à la langue française para la coproducción de recursos lingüísticos en francés.

*********Texte en français*********

ELRA sponsorise la production de ressources linguistiques Dans le cadre du projet de corpus du Français contemporain

Rendu public le 15 janvier 2000

1. Présentation de l'appel à proposition

1.1. Introduction

Cet appel à proposition est le troisième d'une série d'appels pour la co-production de ressources linguistiques et la mise au format de ressources linguistiques existantes. Cet appel s'inscrit dans la continuation de la collaboration entre l'Association Européenne pour les Ressources Linguistiques (ELRA), son agence de distribution (ELDA) et le ministère de la culture français, Délégation générale à la langue française (DGLF) dans le cadre du programme d'action gouvernemental pour la société de l'information (PAGSI) et suite à des appels d'offres qui ont été lancés en 1998. Cet appel concerne l'enrichissement de corpus du français contemporain. La mise au point d'une telle collection de corpus permettra de contribuer au bon traitement informatique du français.

Cet appel est ouvert à toutes les sociétés et organisations académiques, conformément aux conditions d'éligibilité décrites ci-dessous.

1.2. L'objectif de l'appel

Grâce au soutien du ministère de la culture, Délégation générale à la langue française, ELRA souhaite soutenir la production et/ou la mise au format de ressources linguistiques nécessaires au développement de l'Ingénierie Linguistique. Elle invite les candidats susceptibles de bénéficier de supports financiers de sa part à soumettre leurs propositions.

L'objectif de cet appel est d'assurer que les ressources nécessaires sont développées dans un environnement acceptable aussi bien en termes de temps de réalisation que de conditions juridiques. L'appel cible essentiellement des projets avec un délai de réalisation court, à savoir une dizaine de mois, et dont les besoins en terme de financement sont relativement modestes (il est préférable que les propositions ne dépassent pas 75KF). Le financement d'ELRA doit être vu comme une stimulation pour la production de ressources stratégiques. Les ressources qui seront sélectionnées doivent répondre à un besoin clairement identifié, existant ou prévisible, des industriels et centres de recherche s'intéressant au français.

Lors d'une récente analyse de la demande, ELRA a identifié quelques ressources clés dans les domaines de l'écrit et de l'oral, ce qui lui a permis de catégoriser et de hiérarchiser cette demande, comme indiqué en annexe. D'autres ressources peuvent bénéficier d'un support financier de la part d'ELRA mais il faut absolument justifier l'intérêt de leur développement et de leur exploitation par une large classe d'applications de l'Ingénierie Linguistique. Chaque proposition sera soumise à expertise. Au vu de ces expertises, le comité de pilotage du projet "Corpus du Français Contemporain" dressera la liste des projets sélectionnés. Le comité pourra suggérer une coopération entre les projets présentés indépendamment ou proposer d'associer de nouvelles compétences.

1.3. Rôle d'ELRA

ELRA a pour mission de promouvoir la création, la validation et la distribution des ressources linguistiques en Europe. Son principal objectif est de devenir le centre européen de promotion des ressources linguistiques, regroupant à la fois la collecte, la distribution et les contrats de licences d'utilisation. Elle permet ainsi aux producteurs et aux utilisateurs de ressources linguistiques, d'exploiter leurs ressources et d'en acquérir d'autres pour une grande variété d'utilisation.

Toutefois ELRA n'a pas pour objectif de dupliquer le travail de la Commission Européenne ni des organismes nationaux pour ce qui concerne la création/élaboration des ressources et infrastructures à long terme. Ceci n'est pas l'objectif d'ELRA et les fonds disponibles ne le permettraient pas. ELRA espère participer à la production et la mise au format des ressources clefs, de tailles raisonnables qui seraient essentielles et prêtes à être intégrées dans les applications. ELRA ne propose que des sommes modestes pour des projets qui nécessitent un soutien financier restreint et ponctuel.

2. Formalités de soumission

2.1. Les conditions d'éligibilité

Pour être éligible, l'institution proposante doit être légalement enregistrée en France.

2.2. Aspects juridiques

Le proposant devra s'engager à céder à ELRA une licence non exclusive de distribution des données. Les modalités de distribution, les rétributions du propriétaire et la propriété des données seront négociées dès l'acceptation du dossier, à partir des propositions qui doivent figurer dans le dossier de candidature.

2.3. Critères de sélection

La liste suivante, non exhaustive et donnée à titre d'exemple, énumère quelques critères de sélection qui seront considérés lors de l'évaluation des propositions: l'adéquation des propositions avec les exigences et l'esprit de l'appel, en particulier en s'appuyant sur l'efficacité des méthodes et procédures de production proposées ainsi que le rapport qualité/prix, l'utilisation des recommandations de standardisation, l'adhésion aux protocoles d'évaluation et de validation, l'adoption d'une gestion d'assurance qualité, la nature de la documentation, le plan d'exploitation et la liste des applications potentielles qui peuvent bénéficier de ces ressources, l'aspect partenariat avec d'autres institutions, la direction du projet (en relation avec l'échéancier qui doit être proposé, les tâches, les dépendances entre tâches et les spécifications), la description et la bonne connaissance du marché.

2.4. Découpage en lots

ELRA souhaite financer plusieurs propositions. Il est indispensable de présenter les propositions sous forme de lots (composants indépendants) avec des détails techniques suffisants. Chaque lot devra comporter ses propres délivrables. De cette façon, il sera possible au Comité de sélection de considérer un financement partiel de quelques lots pour les excellentes propositions retenues mais dont le coût dépasserait le budget prévu initialement.

2.5. Contact pour les renseignements et soumissions

Pour tout renseignement et pour la soumission des propositions, veuillez contacter:

Khalid CHOUKRI c/o ELRA/ELDA
55-57, rue Brillat-Savarin
75013 Paris FRANCE
Courriel: choukri@elda.fr
Tél.: (+33) 1 43 13 33 33
Télécopie: (+33) 1 43 13 33 30

3. Format des propositions

3.1. Généralités

Les candidats doivent soumettre une proposition, en français, qui consiste en une ou deux pages de résumé, une description détaillée de la proposition sur 5 pages maximum, un budget et un planning du projet sur 2 pages maximum, et sur 5 pages maximum, une proposition de l'exploitation commerciale des ressources et des applications qui en découleraient.

3.2. Description détaillée des sections de la proposition

1. Sommaire de la proposition (1 ou 2 pages),
1) coordonnées du/des proposants ;
2) descriptif de la ressource à développer ou à reformater (Est-ce une nouvelle ressource, l'amélioration d'une ressource existante, la (re)mise au format d'une ressource existante ?) ;
3) plan budgétaire global ;
4) expérience du/des proposant(s) dans ce domaine ;
5) plan d'exploitation (comment on utilisera la ressource, qui l'utilisera) et un planning de projet ;
6) conditions de distribution et propriété intellectuelle.

2. Descriptif détaillé de la proposition (jusqu'à 5 pages)
1) décrire succinctement en détaillant la ressource à produire, comment l'employer, et par quel(s) utilisateur(s) ;
2) Démontrer l'importance des données et leur production pour votre organisme et pour le secteur de l'ingénierie linguistique ;
3) indiquer si votre ressource sera incorporée dans certaines applications ou si elle sera créée pour le
développement de certaines applications ;
4) Expliquer pourquoi ELRA devrait soutenir la production de cette ressource ;
5) lister les participants de l'équipe et leurs connaissances/compétences pertinentes pour le projet ;
6) décrire en détail les procédures à suivre pour la production de la ressource, les différentes phases de production, et le calendrier de ces phases ;
7) indiquer comment la ressource produite sera soumise aux critères de validation existants. Pour plus de renseignements, voir les manuels de validations d'ELRA sur
le site Internet: http://www.icp.grenet.fr/ELRA/validat.html

3. Plan budgétaire et planning (jusqu'à 2 pages)
1) estimation détaillée des coûts de production ou de mise au format de la ressource. Indiquer la rentabilité, le
coût du produit final, le rendement de l'investissement ;
2) les échéances et les lots à livrer doivent être précisés ;
3) la durée maximale du projet doit être de 12 mois (9 mois de préférence).

4. plan d'exploitation détaillé
(comment on utilisera la ressource, qui l'utilisera (jusqu'à 5 pages) -- Pour les thèmes qui ne figurent pas dans les
annexes 1, 2 et 3 de cet appel, les plans d'exploitation et l'aspect commercial devront être présentés en détail.

Il est indispensable de fournir les informations suivantes:
1. Description des besoins exprimés par la communauté scientifique et les industriels (acquéreurs potentiels) ;
2. les possibilités d'exploitation de la ressource ;
3. les possibilités de réutilisation de la ressource dans diverses applications/domaines (portabilité d'une application à une autre).

3.3. Calendrier

Annonce de l'appel à propositions: 15 Janvier 2000
Soumission des propositions avant le: 15 mars 2000
Notification de l'acceptation des propositions et début des négociations: à partir du 15 avril 2000.

3.4. Éléments supplémentaires

* On évaluera uniquement des propositions qui répondent à tous les points ci-dessus, au minimum. Pour plus de renseignements, prière de contacter Khalid CHOUKRI à ELRA/ELDA.

* Les informations fournies dans les propositions rendues seront traitées d'une manière confidentielle.

* Cet appel représente un pas vers la production et la distribution des ressources linguistiques. ELRA a le droit de sélectionner les projets qui seront soutenus financièrement par la suite.

4. Aucune obligation de conclure le marché

ELRA n'est en aucune manière obligée de conclure des contrats suite à cet appel à propositions.
ELRA ne peut être tenue responsable vis-à-vis des proposants si elle décide de ne pas conclure de contrat suite à cet appel à proposition.
ELRA ne sera pas tenue de compenser les candidats dont les propositions seront refusées.

5. ANNEXE 1: RESSOURCES LINGUISTIQUES - Liste préférentielle

5.1. Ressources écrites -- textes ou corpus parallèles

Le corpus de textes parallèles et alignés est une des ressources identifiées comme importante pour le traitement du français. Ce corpus devra, en plus du français, comporter une ou plusieurs langues. Une préférence sera accordée aux langues ne figurant pas dans le catalogue d'ELRA et qui ne sont pas en cours de production. L'alignement devra prendre en considération les besoins de la communauté de l'ingénierie de la langue quant à la profondeur et au détail de l'alignement proposé (au niveau des paragraphes, des phrases, des mots?).

Les formats ASCII et Unicode sont les formats de codage les plus couramment utilisés dans le secteur, avec une préférence pour les corpus qui contiennent un marquage de type SGML, HTML ou XML. Le corpus, ou au moins une partie substantielle de celui-ci, devra contenir des marqueurs/étiquettes morphologiques ou un autre type d'annotation syntaxique selon des standards reconnus (voir EAGLES - http://www.ilc.pi.cnr.it/EAGLES/home.html). Il estpossible de proposer un corpus avec différents niveaux d'annotation (en peut en particulier se référer au projet MULTEXT http://www.lpl.univ-aix.fr/projects/multext/index.html). On considérera des corpus traitant de domaines généraux et/ou spécifiques ainsi que des corpus qui reflètent un ou plusieurs genres de textes.

5.2. Ressources écrites "données publiques"

ELRA souhaite offrir des corpus de textes provenant des données publiques disponibles sur les sites internet du gouvernement français. Ces corpus comprennent, notamment, des textes législatifs, les textes gouvernementaux sur le PAGSI et le PAMSI, ainsi que le rapport Bloche. Ils sont disponibles sous des formats très variés (Word, HTML, etc.). Il s'agira d'évaluer avec ELRA (avant la remise de la proposition) la quantité de travail nécessaire à une mise au format PAROLE: celle-ci suppose un nettoyage des documents et un balisage conforme aux standards EAGLES tels qu'utilisés dans le projet PAROLE.

5.3. Ressources audiovisuelles et multimédia

Les ressources Multimédia et multimodales sont très demandées aussi bien pour des recherches en cours que pour des programmes qui commencent. Un corpus Multimédia peut contenir des données en provenance d'émissions audiovisuelles (aussi bien de la radio que de la télévision), similaire à ce qui a été collecté dans le cadre des programmes Human Language Technology de DARPA/NIST (voir http://www.itl.nist.gov/div894/894.01/). Les transcriptions peuvent être réalisées par l'outil de
transcription disponible gratuitement par l'intermédiaire de la DGA (France) sur le site (http://www.etca.fr/CTA/gip/Projets/Transcriber/). La voix, les enregistrements audio autres que la voix, les textes, les informations visuelles, lorsqu'elles existent, doivent être prises en considération. Le niveau de transcription devra être le plus détaillé possible et tenir compte des besoins exprimés par la communauté scientifiques (e.g. indications des locuteurs, annotation des thèmes, balisage des entités nommées, de la prosodie, etc.). La proposition d'un corpus textuel de transcription (sans la partie audio) sera considérée comme un plus.

{liste de messagesliste de messages-lista de mensajeslista de mensajes}


volver a la página principal