terminologie in bedrijfscontext
DESCRIPTION
TRANSCRIPT
Terminologie in bedrijfscontext: uitdagingen en praktische aanpak
Nathalie De Sutter11/05/2011
HoofdtitelSubtitel
Agenda
• Introductie• Doel van terminologie• Belang van terminologie• Strategie mbt terminologiebeheer
Introductie
What is?
• TerminologySpecialised vocabulary of a subject field, in a broader sense including the terminological work, teachings and research as well
• TermSingle- or multiple-word expression that denotes a specialised concept
• ConceptUnit of thought that summarises those characteristics that typify physical or abstract objects, and distinguish them from one another
(Bron: CEOV, aanbevelingen voor terminologie)
Doel
Doel van terminologie
• Kennisuitwisseling • Referentie en search• Vertaling• Automatische vertaling
Kennisuitwisseling: begrippenstelsels
PaardLipizzaner
Fries
Haflinger
Arabisch
etc
Referentie en search
Meertalige terminologie
Termherkenning tijdens vertaalproces
TM TBFuzzy match
(84%)
Machinevertaling - dictionary coding
Automatische codering
Deze codering determineert de woordsoort en voegt een betrouwbaarheidsscore toe
After review and correction of the dictionary, store your entries
by selecting File – Save.
De fouten worden gecorrigeerd en het
woordenboek is klaar om gebruikt te worden tijdens de
automatische vertaling
Belang
Facts & figures
• Slechts 7,8% van de bedrijven beheren terminologie proactief• Van de bedrijven die actief terminologie beheren…
– Rapporteert 88% een hogere productkwaliteit– Meldt 74% een stijging van de productiviteit– Bespaart 62% kosten– Geeft 56% aan dat dit het competitief voordeel van het
bedrijf versterkt • Niet-gestandaardiseerde terminologie veroorzaakt
aanzienlijke directe en indirecte kosten. Het gemelde tijdsverlies bij het opzoeken van een ambigue term loopt op tot 30 minuten.
Facts & figures
• In de automotive industrie worden bijna de helft van de vertaalfouten gecategoriseerd als “wrong term” (Woyde)
• 40 % van de tijd die nodig is om teksten te produceren gaat naar terminologiewerk (Stellbrink)
• Terminologiewerk is nodig voor 4% tot 6% van alle woorden in een tekst (Champagne)
• Uitbesteed vertaalwerk kan tot 50% duurder worden als de bronterminologie inconsistent is (Kjeldgaard)
• Het kost 10 keer meer om een term te corrigeren aan het einde van het productieproces dan aan het begin (Xerox, JDEdwards)
Belang van terminoogie
Het gebruik van ambigue terminologie leidt tot onnauwkeurige communicatie, die op haar beurt kan leiden tot:
– Ongepaste, onjuiste of inconsistente productinformatie– Mogelijk juridische consequenties– Wereldwijde merkerosie
Terminologiebeheer = noodzakelijk kwaad
Product manager
VertalerTerminoloog
Sales & marketing
Consistent Corporate Messaging
KLANTEN
HoofdtitelSubtitel
Strategie mbt terminologiebeheer
• Bepaal het doel• Implementeer een (multifunctioneel)
terminologiebeheersysteem en integreer met de nodige content management en vertaalomgevingen
• Respecteer data management principes en bepaal waaraan de termen moeten voldoen om opgenomen te worden (best practices)
• Bepaal processen om nieuwe termen toe te voegen (bv termextractie?), voorgestelde termen te valideren, de terminologie te onderhouden
• Ondersteun standaarden
Systeem
Terminologiebeheersysteem: must-haves
• Web-gebaseerd systeem• UNICODE: meertalig en multidirectioneel• Concept-georiënteerde databank• Velden door de gebruiker te definiëren en te benoemen• Ondersteuning van Open Standaarden, bv TBX, Xliff,… met het oog op
import en export• Integratie met (andere) terminologie- en vertaaltools (CAT)• Krachtige zoekfunctie, eventueel ook vervangfunctie• Bulk update functionaliteit• Schaalbare databankarchitectuur• Security management/user management• Advanced filtering• Volledig geschiedenisoverzicht en versioning
Terminologiebeheersysteem: nice-to-haves
• Gebruiksvriendelijke editfunctionaliteit• Geïntegreerde spellingscontrole• Identificatie en consolidatie van dubbele entries• Cross-referenties binnen de termendatabank• Hyperlinks naar externe bronnen of bestanden• Vertaalde versies van de interface• Proces om een workflow ter validatie van termen te ondersteunen:
projectbeheer, communicatie, administratie…• Opsporen van favoriete of populaire termen, niet gevonden woorden• Voor-vertaalfunctionaliteit om automatisch gevalideerde termen in het
vertaalproject te introduceren (bv. Variabelen, of entities)
Data management
Wat is een relevante term?
• Afhankelijk van:– Doel– Domein – Type tekst– Gebruik – Budget
• Goede kandidaten:– Productnamen– Klant/bedrijfsspecifieke termen– Homoniemen– Synoniemen– Nieuwe termen of 'neologismen‘– Niet-te-vertalen termen
Voorbeeld: pragmatische aanpak
Wel: consolidatie van uw IT infrastructuurNiet: implementatie van uw IT infrastructuur
Metadata
• Bij voorkeur wordt metadata toegevoegd aan de termen:– Part of Speech (woordsoort, geslacht,…)– Definitie– Context (voorbeeld)– Beeld– Gebruik– Onderwerp/classificatie
• Vaste procedure voor onderhoud van de terminologie
Metadata
• Voorbeeldzin• Context:
– bv. Web, Button label, login page (for website items)
• Oorsprong:– E.g. offerte, <title>
• Verwerkingsstatus: hoe ver staat het validatieproces van de term?– Nog niet verwerkt: nieuw toegevoegd, zonder gebruiksstatus– In verwerking– Klaar: processtatus is bevestigd
• Gebruiksstatus: hoe moet de term gebruikt worden?– Voorkeur: te gebruiken indien er meerdere synoniemen in de termenlijst zitten– Toegelaten: de term in kwestie mag gebruikt worden– Niet aanbevolen: deze term mag liever niet gebruikt worden– Overbodig: termen die vroeger toegelaten waren maar nu in onbruik geraakt zijn– Ongeldig: synoniemen die niet gebruikt mogen worden
Processen
Termextractie
• Automatisch relevante termen uit een corpus extraheren.• Door middel van linguïstische processors (part of speech
taggers, phrase chunking) worden terminologische kandidaten geïdentificeerd, i.e. syntactisch plausibele terminologische noun phrases
• De termen worden dan gefilterd door middel van statistische algoritmen, bv. op basis van frequentie in het corpus.
• Een uitzonderingslijst kan gebruikt worden om de fouten te reduceren.
• Eventueel wordt de stamvorm van de term gereconstrueerd.
Eentalige termextractie
Vertaalgeheugen (parallel corpus) inladen
Minimale frequentie specificeren
Zoek overeenkomstige term in de doeltaal
Translation Memory Xchange format (TMX)
Translation Memory Xchange format (TMX)
Validatie
• De geëxtraheerde terminologie dient gevalideerd te worden door interne medewerkers van het bedrijf:– Specialisten– Product managers– Content owners– Taalkundigen
• Eventueel controle door:– Juridische dienst– Marketing– Corporate communications
(Geautomatiseerde) termverificatie
Geautomatiseerde termverificatie
Automatische termverificatie
Automatische termverificatie
Samenvatting
• Een proactieve aanpak van terminologiebeheer ondersteunt de algemene globalisatiestrategie van bedrijven: de producten zullen inhoudelijk een hogere kwaliteit hebben in de verschillende talen, en het vertaalproces wordt erdoor vergemakkelijkt.
• Door vooraf termen te extraheren kunnen fouten opgespoord worden en kan de terminologie vooraf aan de vertalers bezorgd worden.
• Terminologie die bewaard wordt in een databank kan ook andere bedrijfsdoelen ondersteunen: gecontroleerd schrijven, vertalen, information mining, machinevertaling en kennisverspreiding.
• Het is belangrijk dat bedrijven de voordelen van terminologiebeheer zien, en dat terminologen de juiste tools en procedures toepassen.