a lean localization machine (xml holland 2009)
DESCRIPTION
Presentation for XML Holland 2009 (available in Dutch only).TRANSCRIPT
Lean Localization MachineMarc van Grootel (iCtrl)
XML User Group 12 November
“Publiceren in het tijdperk van Google, Apple en Amazon”
Lean Translation Machine
Het traditionele vertaalproces Welke uitdagingen zijn er beide de projecten van
vandaag en morgen? Is er een nieuwe visie nodig voor de vertaalprojecten
van morgen? Welke trends en vernieuwingen kunnen hierbij
uitkomst bieden? XML Internationalisatie en Localisatiestandaarden
Introductie 7+ jaren als localization engineer / engineering manager bij
Bowne Global Solutions / Lionbridge– Localisatieprojecten (oa. MS Office, MSN, Navision, MedTronic)– Integraties CMS met vertaalportaal (oa. Dupont, Robeco)– Kwaliteitsverbetering door automatisering van localisatieprocessen
3+ jaren als technisch consultant / ontwikkelaar / architect bij iCtrl
iCtrl is specialist in het creëren, vertalen, publiceren en beheren van productinformatie en procesbeschrijvingen
– Documentatiesystemen (oa. architectuur van NedTrain systeem)– Localisatieprojecten (oa. TomTom, Yamaha)– Documentatie migratie trajecten (oa. Vanderlande)– Implementatie Scrum (een Agile methodologie)
10+ jaren inzet van XML-technologieën Generaliserend specialist
Het traditionele vertaalproces1. XML bestandsanalyse (oa. validatie)
2. XML configuratie vertaaltool
3. Referentiemateriaal verzamelen en analyseren
4. Vertaling
5. Review (Editing, Proofing)
6. Review/approval door de klant
7. Linguistische en technische kwaliteitscontroles
8. Vertaalde XML bestanden leveren
De projecten van nu Veel meer XML, maar ook nog altijd veel MS Word en Framemaker.
– Slechte I18N vertaald zich in hogere kosten voor vertaling
Kleine volumes, veel kleine projecten, veel updates
– Hierdoor komen proces inefficiënties genadeloos aan het licht
Technische randvoorwaardende technische complexiteit van projecten is toegenomen.
– Grens tussen software / documentatie vervaagd
(bijvoorbeeld AJAX web-sites).
Verwachtingspatroon van de klant
– Klant wil meer inzicht in projecten
Hebben we een nieuwe visie nodig?
De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar.
Traditionele aanpak zit echter nog ingebakken in veel tools en systemen.
Nieuwe informatie en communicatie technologie kan misschien oplossingen bieden.
Een visie die recente ontwikkelingen uit verschillende gebieden combineert kan ons hiervan losweken.
Zo’n visie kan richting geven aan de experimenten van vandaag en de oplossingen van morgen.
laat ik een poging wagen...
Het nieuwe vertaalplatform (i)
“binnen vijf jaar bestaan er vertaalsystemen die bestaan uit
een samenwerkingsplatform waarin alle betrokkenen
samenwerken om producten te vertalen, nadruk ligt hierbij
op communicatie tussen de teamleden. De werkwijze zal niet
afgedwongen worden door een rigide workflow en elke
vertaling (zin/paragraaf) kan individueel door het proces
‘stromen’.”
Het nieuwe vertaalplatform (ii)
“Het platform maakt gebruik van open standaarden en is
service-georiënteerd. Via het platform kunnen verschillende
services van derden naar behoefte gecombineerd worden.
Routinewerk is zoveel mogelijk geautomatiseerd zodat men
zich kan concentreren op het echte werk en
kwaliteitscontroles zijn in de processen ingebakken – in
plaats van door inspecties achteraf.”
Traditioneel team en workflow
Sequentiële workflow met veel handoff’s
Samenwerkingsplatform
Minder rigide workflow. Team verbonden door
moderne communicatietechnologie.
Het team werkt samen aan een project.
Werk ‘stroomt’ soepel door het systeem.
Trends en nieuwe ontwikkelingen
De vertaal gorilla’sZetten zwaar in op technologie, elk op hun eigen wijze.
... de ontwikkelingen gaan snel,en er zijn heel wat nieuwkomers die het goed doen.
SDL– Vertaaldiensten– Vertaalsystemen– Content Management – van vertaling naar content creatie
Lionbridge– Vertaaldiensten– Freeway platform, en nu Translation Workspace (GeoWorkz)– “U krijgt de tools en wij uw vertaalwerk”– Integraties met Content Management Systemen– Recentelijk ook gebruik als ‘pay-as-you-go’ platform voor andere vertalers
(PaaS)
Technologische vernieuwingen
Machinevertalingen Social Media / Social Networks Open Data / Data sharing (TAUS) Crowdsourcing Google Wave
Crowdsourcing Facebook (1 – 100 talen in 2 jaar), Twitter Is niet gratis: er is nog altijd PM, en supervisie nodig en
misschien zelfs vergoeding voor vertalers Is niet makkelijk, kun je genoeg vertalers aantrekken Bottom up model versus top down Levert interessante lessen en ervaringen op (de tijd zal
het leren) Een systeem dat geschikt is voor crowdsourcing past
perfect in de geschetste visie.
Google Wave?
Zeer interessant maar beetje gehyped. Misschien niet de volgende email Maar misschien wel specifieke toepassingen:
bijvoorbeeld review en proofreading
Ultimately a technology like Google Wave is probably best for specialized
situations where smaller-time collaboration is key, just as smaller groups in
the physical world often can get more done, faster, simultaneously than
larger ones.
Google Wave (ii)
Google Wave (iii)
XML Localization
Enabling technologies
XSLT 2.0 – XSL Transformations
XQuery / XML database– Mark Logic, Exist, Qizx en vele anderen– RDBMS met XML features
XProc – een XML pijplijn taal
Localisatie standaarden
Waarom zijn XML standaarden van belang?
Makkelijkere uitwisseling van gegevens
Makkelijkere conversies (XML als lingua franca)
Minder vatbaar voor lock-in door leveranciers en hun
producten
De localisatiestandaarden
ITS - Internationalization Tag Set– XML bestanden voorbereiden voor vertaling– Wat moet er vertaald worden
XLIFF – XML Localization Interchange Format– Het ‘vervoermiddel’ voor vertaalbestanden– Beter geschikt voor vertaling dan willekeurige XML– Vb. ITS regels bepalen de omzetting naar XLIFF
TMX – Translation Memory Exchange Format– De vertaaldatabase geschikt als referentiemateriaal om nieuwe
bestanden mee te vertalen TBX – Termbase Exchange Format GMX – Globalization Metrics
XML Internationalization best practices
I18N bepaalt voor een groot deel de kosten van vertaling.Een selectie: Vermijd vertaalbare attributen Vermijd menging van code en tekst Geef aan welke elementen wel/niet vertaald moeten worden Vermijd multilingual documents Specificeer de taal van de content Vermijd CDATA secties
Meer over dit onderwerp op de W3C web site
ITS: Internationalization Tag Set
W3C Recommendation 3 april 2007 Nog geen brede ondersteuning
TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)
TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)
Wat is XLIFF?
OASIS – 1.1 October 2003, 1.2 February 2008
Inmiddels brede ondersteuning
Interoperabiliteit echter nog lastig
Een XLIFF document bevat:
– Vertaalsegmenten met bron tekst en doel tekst
– Alternatieve vertalingen (bijv. fuzzy matches of vertalingen uit
eerdere fases)
– Administratieve metadata
– Proces metadata
– Vertaal instructies, opmerkingen
Een gestandaardiseerde manier om vertaalbare informatie als XML op te slaan.
XML Localization Interchange File Format
XML Localization Interchange File Format
XML Localization Interchange File Format
XML Localization Interchange File Format
Van XML naar XLIFF en terug
Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF)
De vertaalde XLIFF wordt samengevoegd met het Skelet om de vertaalde XML te verkrijgen.
BronXMLBronXML
vertaaldexml
vertaaldexml
XLIFFXLIFFSkeletSkeletXLIFFXLIFF
XLIFFXLIFF
vertaaldexml
vertaaldexmlVertaalde
XMLVertaalde
XML
XLIFF als spil van het vertaalproces
Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF gegenereerd.
Vertalingen, correcties en andere informatie worden weer in de XLIFF opgeslagen.
XLIFFXLIFF
Vertaalgeheugens(TMX)
Vertaalgeheugens(TMX)
TagEditor(TTX)
TagEditor(TTX)
Excel(XLS)Excel(XLS)
een XML/XLIFF toepassingiCtrl
Project Managers,Language Engineering
Vertalers
Reviewers
Klant
Bron XMLBron XML
Vertaalde XMLVertaalde XMLVertaalde XMLVertaalde XML
Vertaalde XMLVertaalde XML
Vertalingen in XLS
Vertalingen in XLSVertalingen in
XLSVertalingen in
XLSVertalingen in XLS
Vertalingen in XLS
SkeletSkeletSkeletSkelet
XLIFFXLIFF
SkeletSkelet
SkeletSkeletSkeletSkeletVertaal-
geheugensVertaal-
geheugens
SkeletSkeletSkeletSkeletCorrectie
spreadsheetsCorrectie
spreadsheets
SkeletSkeletSkeletSkelet
Trados TTXTrados TTX
XML Database
Links
iCtrl Wiki over localization standards (in aanbouw) XML Internationalization best practices XML Localization Interchange format (XLIFF) Translation Memory eXchange (TMX) Internationalization Tag Set (ITS)