<ENV 725> APPEL A PROPOSITIONS ELRA/DGLF 1999-2000
|
4/02/2000 **************Resumen en castellano************** Convocatoria de la Asociación Europea de Recursos Lingüísticos (ELRA) y la Délégation générale à la langue française para la coproducción de recursos lingüísticos en francés. *********Texte en français********* ELRA sponsorise la production de ressources linguistiques Dans le cadre du projet de corpus du Français contemporain Rendu public le 15 janvier 2000 1. Présentation de l'appel à proposition 1.1. Introduction Cet appel à proposition est le troisième d'une série d'appels pour la co-production de ressources linguistiques et la mise au format de ressources linguistiques existantes. Cet appel s'inscrit dans la continuation de la collaboration entre l'Association Européenne pour les Ressources Linguistiques (ELRA), son agence de distribution (ELDA) et le ministère de la culture français, Délégation générale à la langue française (DGLF) dans le cadre du programme d'action gouvernemental pour la société de l'information (PAGSI) et suite à des appels d'offres qui ont été lancés en 1998. Cet appel concerne l'enrichissement de corpus du français contemporain. La mise au point d'une telle collection de corpus permettra de contribuer au bon traitement informatique du français. Cet appel est ouvert à toutes les sociétés et organisations académiques, conformément aux conditions d'éligibilité décrites ci-dessous. 1.2. L'objectif de l'appel Grâce au soutien du ministère de la culture, Délégation générale à la langue française, ELRA souhaite soutenir la production et/ou la mise au format de ressources linguistiques nécessaires au développement de l'Ingénierie Linguistique. Elle invite les candidats susceptibles de bénéficier de supports financiers de sa part à soumettre leurs propositions. L'objectif de cet appel est d'assurer que les ressources nécessaires sont développées dans un environnement acceptable aussi bien en termes de temps de réalisation que de conditions juridiques. L'appel cible essentiellement des projets avec un délai de réalisation court, à savoir une dizaine de mois, et dont les besoins en terme de financement sont relativement modestes (il est préférable que les propositions ne dépassent pas 75KF). Le financement d'ELRA doit être vu comme une stimulation pour la production de ressources stratégiques. Les ressources qui seront sélectionnées doivent répondre à un besoin clairement identifié, existant ou prévisible, des industriels et centres de recherche s'intéressant au français. Lors d'une récente analyse de la demande, ELRA a identifié quelques ressources clés dans les domaines de l'écrit et de l'oral, ce qui lui a permis de catégoriser et de hiérarchiser cette demande, comme indiqué en annexe. D'autres ressources peuvent bénéficier d'un support financier de la part d'ELRA mais il faut absolument justifier l'intérêt de leur développement et de leur exploitation par une large classe d'applications de l'Ingénierie Linguistique. Chaque proposition sera soumise à expertise. Au vu de ces expertises, le comité de pilotage du projet "Corpus du Français Contemporain" dressera la liste des projets sélectionnés. Le comité pourra suggérer une coopération entre les projets présentés indépendamment ou proposer d'associer de nouvelles compétences. 1.3. Rôle d'ELRA ELRA a pour mission de promouvoir la création, la validation et la distribution des ressources linguistiques en Europe. Son principal objectif est de devenir le centre européen de promotion des ressources linguistiques, regroupant à la fois la collecte, la distribution et les contrats de licences d'utilisation. Elle permet ainsi aux producteurs et aux utilisateurs de ressources linguistiques, d'exploiter leurs ressources et d'en acquérir d'autres pour une grande variété d'utilisation. Toutefois ELRA n'a pas pour objectif de dupliquer le travail de la Commission Européenne ni des organismes nationaux pour ce qui concerne la création/élaboration des ressources et infrastructures à long terme. Ceci n'est pas l'objectif d'ELRA et les fonds disponibles ne le permettraient pas. ELRA espère participer à la production et la mise au format des ressources clefs, de tailles raisonnables qui seraient essentielles et prêtes à être intégrées dans les applications. ELRA ne propose que des sommes modestes pour des projets qui nécessitent un soutien financier restreint et ponctuel. 2. Formalités de soumission 2.1. Les conditions d'éligibilité Pour être éligible, l'institution proposante doit être légalement enregistrée en France. 2.2. Aspects juridiques Le proposant devra s'engager à céder à ELRA une licence non exclusive de distribution des données. Les modalités de distribution, les rétributions du propriétaire et la propriété des données seront négociées dès l'acceptation du dossier, à partir des propositions qui doivent figurer dans le dossier de candidature. 2.3. Critères de sélection La liste suivante, non exhaustive et donnée à titre d'exemple, énumère quelques critères de sélection qui seront considérés lors de l'évaluation des propositions: l'adéquation des propositions avec les exigences et l'esprit de l'appel, en particulier en s'appuyant sur l'efficacité des méthodes et procédures de production proposées ainsi que le rapport qualité/prix, l'utilisation des recommandations de standardisation, l'adhésion aux protocoles d'évaluation et de validation, l'adoption d'une gestion d'assurance qualité, la nature de la documentation, le plan d'exploitation et la liste des applications potentielles qui peuvent bénéficier de ces ressources, l'aspect partenariat avec d'autres institutions, la direction du projet (en relation avec l'échéancier qui doit être proposé, les tâches, les dépendances entre tâches et les spécifications), la description et la bonne connaissance du marché. 2.4. Découpage en lots ELRA souhaite financer plusieurs propositions. Il est indispensable de présenter les propositions sous forme de lots (composants indépendants) avec des détails techniques suffisants. Chaque lot devra comporter ses propres délivrables. De cette façon, il sera possible au Comité de sélection de considérer un financement partiel de quelques lots pour les excellentes propositions retenues mais dont le coût dépasserait le budget prévu initialement. 2.5. Contact pour les renseignements et soumissions Pour tout renseignement et pour la soumission des propositions, veuillez contacter: Khalid
CHOUKRI c/o ELRA/ELDA 3. Format des propositions 3.1. Généralités Les candidats doivent soumettre une proposition, en français, qui consiste en une ou deux pages de résumé, une description détaillée de la proposition sur 5 pages maximum, un budget et un planning du projet sur 2 pages maximum, et sur 5 pages maximum, une proposition de l'exploitation commerciale des ressources et des applications qui en découleraient. 3.2. Description détaillée des sections de la proposition
1. Sommaire de la proposition (1 ou 2 pages),
2. Descriptif détaillé de la proposition (jusqu'à
5 pages)
3. Plan budgétaire et planning (jusqu'à 2 pages)
4. plan d'exploitation détaillé
Il est indispensable de fournir les informations suivantes: 3.3. Calendrier Annonce
de l'appel à propositions: 15 Janvier 2000 3.4. Éléments supplémentaires * On évaluera uniquement des propositions qui répondent à tous les points ci-dessus, au minimum. Pour plus de renseignements, prière de contacter Khalid CHOUKRI à ELRA/ELDA. * Les informations fournies dans les propositions rendues seront traitées d'une manière confidentielle. * Cet appel représente un pas vers la production et la distribution des ressources linguistiques. ELRA a le droit de sélectionner les projets qui seront soutenus financièrement par la suite. 4. Aucune obligation de conclure le marché ELRA
n'est en aucune manière obligée de conclure des contrats
suite à cet appel à propositions. 5. ANNEXE 1: RESSOURCES LINGUISTIQUES - Liste préférentielle 5.1. Ressources écrites -- textes ou corpus parallèles Le corpus de textes parallèles et alignés est une des ressources identifiées comme importante pour le traitement du français. Ce corpus devra, en plus du français, comporter une ou plusieurs langues. Une préférence sera accordée aux langues ne figurant pas dans le catalogue d'ELRA et qui ne sont pas en cours de production. L'alignement devra prendre en considération les besoins de la communauté de l'ingénierie de la langue quant à la profondeur et au détail de l'alignement proposé (au niveau des paragraphes, des phrases, des mots?). Les formats ASCII et Unicode sont les formats de codage les plus couramment utilisés dans le secteur, avec une préférence pour les corpus qui contiennent un marquage de type SGML, HTML ou XML. Le corpus, ou au moins une partie substantielle de celui-ci, devra contenir des marqueurs/étiquettes morphologiques ou un autre type d'annotation syntaxique selon des standards reconnus (voir EAGLES - http://www.ilc.pi.cnr.it/EAGLES/home.html). Il estpossible de proposer un corpus avec différents niveaux d'annotation (en peut en particulier se référer au projet MULTEXT http://www.lpl.univ-aix.fr/projects/multext/index.html). On considérera des corpus traitant de domaines généraux et/ou spécifiques ainsi que des corpus qui reflètent un ou plusieurs genres de textes. 5.2. Ressources écrites "données publiques" ELRA souhaite offrir des corpus de textes provenant des données publiques disponibles sur les sites internet du gouvernement français. Ces corpus comprennent, notamment, des textes législatifs, les textes gouvernementaux sur le PAGSI et le PAMSI, ainsi que le rapport Bloche. Ils sont disponibles sous des formats très variés (Word, HTML, etc.). Il s'agira d'évaluer avec ELRA (avant la remise de la proposition) la quantité de travail nécessaire à une mise au format PAROLE: celle-ci suppose un nettoyage des documents et un balisage conforme aux standards EAGLES tels qu'utilisés dans le projet PAROLE. 5.3. Ressources audiovisuelles et multimédia Les
ressources Multimédia et multimodales sont très demandées
aussi bien pour des recherches en cours que pour des programmes
qui commencent. Un corpus Multimédia peut contenir des données
en provenance d'émissions audiovisuelles (aussi bien de la
radio que de la télévision), similaire à ce
qui a été collecté dans le cadre des programmes
Human Language Technology de DARPA/NIST (voir http://www.itl.nist.gov/div894/894.01/).
Les transcriptions peuvent être réalisées par
l'outil de |