8 jaromir dzialo
TRANSCRIPT
Agenda
● Intro
● Problem
● Rozwiązanie
● Strategia – jak wesprzeć swój biznes?
● Dlaczego Dolina Krzemowa?
● Działaj globalnie
● Q&A
Jak rozwin swój produkt na rynku globalnym?ąćZ Krakowa do Silicon Valley na przyk adzie Topicmarks.ł
Dziennie powstaje:
60,000 nowych
website’ów 1,5 milionów
artykułów na blogach
10 milionów postów
na tumblr 140 miliony tweetów 1,5 miliarda różnego
rodzaju wpisów na
facebooku
Problem
Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub
efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co
robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do
przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania
wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie
zdanie, szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie
wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część
tekstu.
Mamy zbyt dużo do przeczytania ..
Problem
Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub
efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co
robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do
przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania
wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie,
szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać
nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu.
Mamy zbyt dużo do przeczytania ..
Topicmarks can semantically summarize, tag, find relations and organize large collections of documents automagically. It decomposes a document into semantic relations to create multiple, alternative personalized views of content. It allows extracted knowledge to be re-used, namely in the construction of concept maps, documents, presentations and so on
Product
Facts
3. Lego Tetrix is fully compatible with Lego Technic
4. Mindstorms is part of Lego’s broader educational efforts
5. Lego WeDo set is aimed at elementry school age children
Facts
3. Lego Tetrix is fully compatible with Lego Technic
4. Mindstorms is part of Lego’s broader educational efforts
5. Lego WeDo set is aimed at elementry school age children
Engine
Client
e.g. portal, browser
extension, rest API sentence splitter
tokenizer (sentence into words)
sentence parser
fact generation (building semantic relations from parsed sentences)
terms extraction
semantic document representation
Distributed on (1..n) servers
Knowledgebase storage
semantic data model
indexing
text searchengine
Cluster of DB servers
RDF model
Front-end servers
wrapperinduction
PDF Wrapper
HTML Wrapper
Custom Wrappere.g. WIKIPEDIA
Upload
DOC Wrapper
Text processing pipeline
there are over 30 processors implemented in the grammar analyzer pipeline, switched on/off when needed
cache
● Technology difficult to duplicate
● ~20,000 engineering hours invested
● Solves hard natural language processing problems
● Advanced string and graph-theoretic algorithms
● Requires large system architecture design
● Harnesses web intelligence via Web2.0/3.0 APIs
● Makes advanced human-machine collaboration
● Accessible to the casual user
Published USPO patent
● Title: "Method and System for Generating a Document Representation"
● Filed March 5, 2010; priority March 6, 2009
● Total number of claims: 42
Architektura
The many engineering hours invested, proprietary algorithms and a patent make duplication unrealistic
Zastosowania
● Analiza dokumentów WikiLeaks
● Procesowanie kanałów RSS
● Analiza Press Releasów giełdowych
Feedback użytkowników:
● student dziękował za "5-tkę", którą otrzymał za wygenerowane streszczenie
● blogger używał Topicmarks do procesowania swoich artykułów pod kątem zrozumiałości – "jeśli maszyna to zrozumie, to może większość ludzi też"
● ktoś generował meta tagi pod SEO
● ktoś przeprocesował list miłosny od swojej dziewczyny.. i dziękował, że tylko dzięki temu go zrozumiał (?!)
Strategia - przygotuj przedpole
● Jaką potrzebę zaspokaja Twój produkt?A jaką potrzebę zaspokajał Twitter ...?
● Czy znasz swoich Klientów?A kiedy ostatnio rozmawiałeś ze swoim użytkownikiem?
● Kto usłyszy o Twoim produkcie? Da się bez wykładania „dużych pieniędzy”?
● Dlaczego uważasz, że masz mocny zespół? Masz super pomysł. Ale dlaczego właśnie Tobie uda się go zrealizować?
● Gdzie są pieniądze?EU: show me the money..
US: .. or huge growth
Strategia – namierz cele
Jesteś sprytny.
Twoje cele też maja być SMART
● Specific
● Measurable
● Acceptable
● Real
● Timed
Strategia – poszukaj sojuszników
● Kto jest Twoim sojusznikiem?
● Czy jesteś gotowy na inwestora?
● W czym potrzebujesz wsparcia?
Strategia – sta do walkiń
“Topicmarks .. a real need for millions”
May 2010, a winner of
... i wygrywaj
Silicon Valley
● inwestorzy: nie tylko „Sand Hill Road”
● co-working spaces: Pier38, SOMACentral, PariSoma
● media w co drugim (ponieważ same też często są startupem)
● spotkania branżowe
● prawnicy pracujący „za darmo” (do momentu zdobycia finansowania)
Heaven & Hell
Wyjątkowy pomysł? Niekoniecznie.
Odpowiedni moment wejścia na rynek? Bardziej.
Znajomości? Przede wszystkim.
Grand Prize Winner by 66% audience vote and 88% jury points
“Potentially huge—Jeff Clavier”“Solving a very interesting problem”
“Nerdy winner of the night”
Thought through very well” “A ripe acquisition target”
Winning Efforts
Bilans – co zyskali myś
● 6 inwestorów oraz 5 advisorów, wśród nich:
• Aaron Patzer (Mint.com [$170m] => Intuit)
• Adeo Ressi (Founder Institute)
• Peter Berger II (Silicon Valley Semantic Technology Forum)
• Jeannie Kahwajy (Adviser to Hillary Clinton)
● koncepcja nowego produktu
● bezcenne kontakty
● współpraca przy procesowaniu repozytoriów Cloud (Evernote, Google Docs, Dropbox, BOX.net)
Bilans
Biuro Topicmarks w San Francisco
a „za ścianą” mamy:
● Mashable
● Wordpress
● Zite
● Socialize
oraz
● Stadion Baseballa
GO GIANTS!!
Bilans
Topicmarks obecnie:
● jest używany w 160+ krajach
● procesuje ok. 2 miliony dokumentów tygodniowo
● integracja z repozytoriami Cloud
● jest promowany na Evernote
● 50.000.000 rekordów w indeksie
● operuje na rynku zarzadzania informacjami w Chmurze, szacowanym na $1mld ($5.5b w 2015)
Bilans
O r g a n iz in g in f o r m a t io n o n t h e c lo u d is g r o w in g 7 4 % p e r y e a r in t o a $ 5 . 5 b m a r k e t
C lo u d s t o r a g e i s e x p l o d i n g in t o a$ 3 3 b m a r k e t i n 2 0 15
Sources: OECD, Accenture, IDC IT Cloud Services Forecast, team analysis.
S p e n d in g o n o r g a n i z in g a n d r e t r ie v in gr e s e a r c h i s w o r t h $ 13 9 b in 2 0 15
CAGR CAGR 11%11% CAGR CAGR
58%58%
Digitization of
paper sources
Multiple devices
Remote collaboration
Better backups
Mainstreamingof research
Informationexplosion
Independent
contracting
Knowledge-based
competitiveness
CAGR CAGR 74%74%
P e o p le o r g a n iz in g in f o r m a t io n t h r o u g h
c lo u d s t o r a g e w i l l b e a $ 5 . 5 b m a r k e t i n 2 0 15