a lean localization machine (xml holland 2009)

37
Lean Localization Machine Marc van Grootel (iCtrl) XML User Group 12 November “Publiceren in het tijdperk van Google, Apple en Amazon”

Upload: xokomola

Post on 24-Jun-2015

665 views

Category:

Technology


0 download

DESCRIPTION

Presentation for XML Holland 2009 (available in Dutch only).

TRANSCRIPT

Page 1: A Lean Localization Machine (XML Holland 2009)

Lean Localization MachineMarc van Grootel (iCtrl)

XML User Group 12 November

“Publiceren in het tijdperk van Google, Apple en Amazon”

Page 2: A Lean Localization Machine (XML Holland 2009)

Lean Translation Machine

Het traditionele vertaalproces Welke uitdagingen zijn er beide de projecten van

vandaag en morgen? Is er een nieuwe visie nodig voor de vertaalprojecten

van morgen? Welke trends en vernieuwingen kunnen hierbij

uitkomst bieden? XML Internationalisatie en Localisatiestandaarden

Page 3: A Lean Localization Machine (XML Holland 2009)

Introductie 7+ jaren als localization engineer / engineering manager bij

Bowne Global Solutions / Lionbridge– Localisatieprojecten (oa. MS Office, MSN, Navision, MedTronic)– Integraties CMS met vertaalportaal (oa. Dupont, Robeco)– Kwaliteitsverbetering door automatisering van localisatieprocessen

3+ jaren als technisch consultant / ontwikkelaar / architect bij iCtrl

iCtrl is specialist in het creëren, vertalen, publiceren en beheren van productinformatie en procesbeschrijvingen

– Documentatiesystemen (oa. architectuur van NedTrain systeem)– Localisatieprojecten (oa. TomTom, Yamaha)– Documentatie migratie trajecten (oa. Vanderlande)– Implementatie Scrum (een Agile methodologie)

10+ jaren inzet van XML-technologieën Generaliserend specialist

Page 4: A Lean Localization Machine (XML Holland 2009)

Het traditionele vertaalproces1. XML bestandsanalyse (oa. validatie)

2. XML configuratie vertaaltool

3. Referentiemateriaal verzamelen en analyseren

4. Vertaling

5. Review (Editing, Proofing)

6. Review/approval door de klant

7. Linguistische en technische kwaliteitscontroles

8. Vertaalde XML bestanden leveren

Page 5: A Lean Localization Machine (XML Holland 2009)

De projecten van nu Veel meer XML, maar ook nog altijd veel MS Word en Framemaker.

– Slechte I18N vertaald zich in hogere kosten voor vertaling

Kleine volumes, veel kleine projecten, veel updates

– Hierdoor komen proces inefficiënties genadeloos aan het licht

Technische randvoorwaardende technische complexiteit van projecten is toegenomen.

– Grens tussen software / documentatie vervaagd

(bijvoorbeeld AJAX web-sites).

Verwachtingspatroon van de klant

– Klant wil meer inzicht in projecten

Page 6: A Lean Localization Machine (XML Holland 2009)

Hebben we een nieuwe visie nodig?

De traditionele aanpak van vertaalprojecten is niet langer meer houdbaar.

Traditionele aanpak zit echter nog ingebakken in veel tools en systemen.

Nieuwe informatie en communicatie technologie kan misschien oplossingen bieden.

Een visie die recente ontwikkelingen uit verschillende gebieden combineert kan ons hiervan losweken.

Zo’n visie kan richting geven aan de experimenten van vandaag en de oplossingen van morgen.

Page 7: A Lean Localization Machine (XML Holland 2009)

laat ik een poging wagen...

Page 8: A Lean Localization Machine (XML Holland 2009)

Het nieuwe vertaalplatform (i)

“binnen vijf jaar bestaan er vertaalsystemen die bestaan uit

een samenwerkingsplatform waarin alle betrokkenen

samenwerken om producten te vertalen, nadruk ligt hierbij

op communicatie tussen de teamleden. De werkwijze zal niet

afgedwongen worden door een rigide workflow en elke

vertaling (zin/paragraaf) kan individueel door het proces

‘stromen’.”

Page 9: A Lean Localization Machine (XML Holland 2009)

Het nieuwe vertaalplatform (ii)

“Het platform maakt gebruik van open standaarden en is

service-georiënteerd. Via het platform kunnen verschillende

services van derden naar behoefte gecombineerd worden.

Routinewerk is zoveel mogelijk geautomatiseerd zodat men

zich kan concentreren op het echte werk en

kwaliteitscontroles zijn in de processen ingebakken – in

plaats van door inspecties achteraf.”

Page 10: A Lean Localization Machine (XML Holland 2009)

Traditioneel team en workflow

Sequentiële workflow met veel handoff’s

Page 11: A Lean Localization Machine (XML Holland 2009)

Samenwerkingsplatform

Minder rigide workflow. Team verbonden door

moderne communicatietechnologie.

Het team werkt samen aan een project.

Werk ‘stroomt’ soepel door het systeem.

Page 12: A Lean Localization Machine (XML Holland 2009)

Trends en nieuwe ontwikkelingen

Page 13: A Lean Localization Machine (XML Holland 2009)

De vertaal gorilla’sZetten zwaar in op technologie, elk op hun eigen wijze.

... de ontwikkelingen gaan snel,en er zijn heel wat nieuwkomers die het goed doen.

SDL– Vertaaldiensten– Vertaalsystemen– Content Management – van vertaling naar content creatie

Lionbridge– Vertaaldiensten– Freeway platform, en nu Translation Workspace (GeoWorkz)– “U krijgt de tools en wij uw vertaalwerk”– Integraties met Content Management Systemen– Recentelijk ook gebruik als ‘pay-as-you-go’ platform voor andere vertalers

(PaaS)

Page 14: A Lean Localization Machine (XML Holland 2009)

Technologische vernieuwingen

Machinevertalingen Social Media / Social Networks Open Data / Data sharing (TAUS) Crowdsourcing Google Wave

Page 15: A Lean Localization Machine (XML Holland 2009)

Crowdsourcing Facebook (1 – 100 talen in 2 jaar), Twitter Is niet gratis: er is nog altijd PM, en supervisie nodig en

misschien zelfs vergoeding voor vertalers Is niet makkelijk, kun je genoeg vertalers aantrekken Bottom up model versus top down Levert interessante lessen en ervaringen op (de tijd zal

het leren) Een systeem dat geschikt is voor crowdsourcing past

perfect in de geschetste visie.

Page 16: A Lean Localization Machine (XML Holland 2009)

Google Wave?

Zeer interessant maar beetje gehyped. Misschien niet de volgende email Maar misschien wel specifieke toepassingen:

bijvoorbeeld review en proofreading

Ultimately a technology like Google Wave is probably best for specialized

situations where smaller-time collaboration is key, just as smaller groups in

the physical world often can get more done, faster, simultaneously than

larger ones.

Page 17: A Lean Localization Machine (XML Holland 2009)

Google Wave (ii)

Page 18: A Lean Localization Machine (XML Holland 2009)

Google Wave (iii)

Page 19: A Lean Localization Machine (XML Holland 2009)

XML Localization

Page 20: A Lean Localization Machine (XML Holland 2009)

Enabling technologies

XSLT 2.0 – XSL Transformations

XQuery / XML database– Mark Logic, Exist, Qizx en vele anderen– RDBMS met XML features

XProc – een XML pijplijn taal

Page 21: A Lean Localization Machine (XML Holland 2009)

Localisatie standaarden

Page 22: A Lean Localization Machine (XML Holland 2009)

Waarom zijn XML standaarden van belang?

Makkelijkere uitwisseling van gegevens

Makkelijkere conversies (XML als lingua franca)

Minder vatbaar voor lock-in door leveranciers en hun

producten

Page 23: A Lean Localization Machine (XML Holland 2009)

De localisatiestandaarden

ITS - Internationalization Tag Set– XML bestanden voorbereiden voor vertaling– Wat moet er vertaald worden

XLIFF – XML Localization Interchange Format– Het ‘vervoermiddel’ voor vertaalbestanden– Beter geschikt voor vertaling dan willekeurige XML– Vb. ITS regels bepalen de omzetting naar XLIFF

TMX – Translation Memory Exchange Format– De vertaaldatabase geschikt als referentiemateriaal om nieuwe

bestanden mee te vertalen TBX – Termbase Exchange Format GMX – Globalization Metrics

Page 24: A Lean Localization Machine (XML Holland 2009)

XML Internationalization best practices

I18N bepaalt voor een groot deel de kosten van vertaling.Een selectie: Vermijd vertaalbare attributen Vermijd menging van code en tekst Geef aan welke elementen wel/niet vertaald moeten worden Vermijd multilingual documents Specificeer de taal van de content Vermijd CDATA secties

Meer over dit onderwerp op de W3C web site

Page 25: A Lean Localization Machine (XML Holland 2009)

ITS: Internationalization Tag Set

W3C Recommendation 3 april 2007 Nog geen brede ondersteuning

Page 26: A Lean Localization Machine (XML Holland 2009)

TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)

Page 27: A Lean Localization Machine (XML Holland 2009)

TMX: Translation Memory eXchange Lisa – the Localization Industry Standards Assocation Eerste versie in 1998, huidige versie 2004 (2.0 in ontwikkeling)

Page 28: A Lean Localization Machine (XML Holland 2009)

Wat is XLIFF?

OASIS – 1.1 October 2003, 1.2 February 2008

Inmiddels brede ondersteuning

Interoperabiliteit echter nog lastig

Een XLIFF document bevat:

– Vertaalsegmenten met bron tekst en doel tekst

– Alternatieve vertalingen (bijv. fuzzy matches of vertalingen uit

eerdere fases)

– Administratieve metadata

– Proces metadata

– Vertaal instructies, opmerkingen

Een gestandaardiseerde manier om vertaalbare informatie als XML op te slaan.

Page 29: A Lean Localization Machine (XML Holland 2009)

XML Localization Interchange File Format

Page 30: A Lean Localization Machine (XML Holland 2009)

XML Localization Interchange File Format

Page 31: A Lean Localization Machine (XML Holland 2009)

XML Localization Interchange File Format

Page 32: A Lean Localization Machine (XML Holland 2009)

XML Localization Interchange File Format

Page 33: A Lean Localization Machine (XML Holland 2009)

Van XML naar XLIFF en terug

Bron XML wordt opgesplitst in onvertaalbare (Skelet) en vertaalbare informatie (XLIFF)

De vertaalde XLIFF wordt samengevoegd met het Skelet om de vertaalde XML te verkrijgen.

BronXMLBronXML

vertaaldexml

vertaaldexml

XLIFFXLIFFSkeletSkeletXLIFFXLIFF

XLIFFXLIFF

vertaaldexml

vertaaldexmlVertaalde

XMLVertaalde

XML

Page 34: A Lean Localization Machine (XML Holland 2009)

XLIFF als spil van het vertaalproces

Vertaalbestanden , Review spreadsheets, vertaalgeheugens worden uit XLIFF gegenereerd.

Vertalingen, correcties en andere informatie worden weer in de XLIFF opgeslagen.

XLIFFXLIFF

Vertaalgeheugens(TMX)

Vertaalgeheugens(TMX)

TagEditor(TTX)

TagEditor(TTX)

Excel(XLS)Excel(XLS)

Page 35: A Lean Localization Machine (XML Holland 2009)

een XML/XLIFF toepassingiCtrl

Project Managers,Language Engineering

Vertalers

Reviewers

Klant

Bron XMLBron XML

Vertaalde XMLVertaalde XMLVertaalde XMLVertaalde XML

Vertaalde XMLVertaalde XML

Vertalingen in XLS

Vertalingen in XLSVertalingen in

XLSVertalingen in

XLSVertalingen in XLS

Vertalingen in XLS

SkeletSkeletSkeletSkelet

XLIFFXLIFF

SkeletSkelet

SkeletSkeletSkeletSkeletVertaal-

geheugensVertaal-

geheugens

SkeletSkeletSkeletSkeletCorrectie

spreadsheetsCorrectie

spreadsheets

SkeletSkeletSkeletSkelet

Trados TTXTrados TTX

Page 36: A Lean Localization Machine (XML Holland 2009)

XML Database

Page 37: A Lean Localization Machine (XML Holland 2009)

Links

iCtrl Wiki over localization standards (in aanbouw) XML Internationalization best practices XML Localization Interchange format (XLIFF) Translation Memory eXchange (TMX) Internationalization Tag Set (ITS)