word spelling

Upload: -

Post on 06-Apr-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/2/2019 Word Spelling

    1/2

    T e x t S t e g a n o g r a p h y by Changing Words SpellingMohammad S h i r a l i - S h a h r e z aC o m p u t e r S c i e n c e D e p a r t m e n tS h a r i f U n i v e r s i t y o f T e c h n o l o g y

    T e h r a n , IRAN

    A b s t r a c t-ne o f t h e i m p o r t a n t i s s u e s i n s e c u r i t y f i e l d s i sh i d d e n e x c h a n g e o f i n f o r m at i o n . T h e r e a r e d i f f e r e n t m e t h o d s f o rt h i s p u r p o s e s u c h a s c r y p t o g r a p h y a n d s t e g a n o g r a p h y .S t e g a n o g r a p h y i s a m e t h o d o f h i d i n g d a t a w i t h in a c o v e r m e d i as o t h a t o th er i nd i v id ua ls f a i l t o r e a l i z e t h e i r e x i s t e n c e . I n t h i sp a p e r a new m e t h o d f o r s t e g a n o g r a p h y i n E n g l i s h t e x t s i sp r o p o s e d . I n t h i s m e t h o d t h e US a n d UK s p e l l i n g s o f w o r d ss u b s t i t u t e d i n o r d e r t o h id e d at a i n a n E n g l i s h t e x t . F o r e x a m p l e" c ol or " h a s d i f f e r e n t s p e l l i n g i n UK ( c o l o u r ) a n d US ( c o l o r ) .T h e r e f o r e t h e d at a c a n b e h i d d e n i n t h e t e x t b y s u b s t i t u t i n g t h e s ew o r d s .

    K e y w o r d s -a t a H i d i n g , I n f o r m a t i o n S e c u r i t y , T e x tS t e g a n o g r a p h y , Word S p e l l i n g .1 . I n t r o d u c t i o n

    I n t e r n e t h a s g r o w t h r a p i d l y i n r e c e n t y e a r s . O n e o f t h e a r e a sw h i c h i s g a i n e d a t t r a c t e d b y many p e o p l e i s s e c u r i t y s u b j e c t so n t h e I n t e r n e t . Among t h e s e t o p i c s , n o w a d a y s e s t a b l i s h i n gh i d d e n c o m m u n i c a t i o n i s a h o t t o p i c t h a t r e c e i v e s m o r ea t t e n t i o n s .V a r i o u s m e t h o d s i n c l u d i n g c r y p t o g r a p h y , s t e g a n o g r a p h y ,c o d i n g , e t c . a r e u s e d f o r e s t a b l i s h i n g h i d d en c o m m un i c a t i on .S t e g a n o g r a p h y i s t h e p r o c e s s o f h i d i n g d a t a i n s i d e o t h e r d a t ai n s u c h a way t h a t n o o n e a p a r t f r o m t h e i n t e n d e d r e c i p i e n tk n o w s o f t h e e x i s t e n c e o f t h e m e s s a g e . T h i s i s t h e m a j o rd i s t i n c t i o n b e t w e e n s t e g a n o g r a p h y a n d o t h e r m e t h o d s o fh i d d e n e x c h a n g e o f i n f o r m a t i o n . F o r e x a m p l e , i nc r y p t o g r a p h y m e t h o d , p e o p l e b e c o m e a w a r e o f t h e e x i s t e n c eo f i n f o r m a t i o n b y o b s e r v i n g c o d e d i n f o r m a t i o n , a l t h o u g h t h e yw i l l b e u n a b l e t o c o m p r e h e n d t h e i n f o r m a t i o n .M o s t s t e g a n o g r a p h y j o b s h av e b e e n p e r f o r m e d o n i m a g e s ,v i d e o c l i p s , t e x t , m u s i c a n d s o u n d [ 1 ] . B u t t e x t s t e g a n o g r a p h yi s t h e m o s t d i f f i c u l t k i n d o f s t e g a n o g r a p h y ; t h i s i s d u e t o t h el a c k o f r e d u n d a n t i n f o r m a t i o n i n a t e x t f i l e , w h i l e t h e r e i s a l o to f r e d u n d a n c y i n a p i c t u r e o r a s o u n d f i l e , w h i c h c a n b e u s ed i ns t e g a n o g r a p h y [ 2 ] .A c c o r d i n g l y , a f e w w o r k s h a v e b e e n d o n e o n h i d i n gi n f o r m a t i o n i n t e x t s , s u c h a s Word S h i f t i n g , S y n t a c t i cM e t h o d s , S e m a n t i c M e t h o d s , O p e n S p a c e s , e t c . I n t h e n e x ts e c t i o n s o m e o f t h e s e m e t h o d s a r e r e v i e w e d .I n t h i s p a p e r a new m e t h o d f o r s t e g a n o g r a p h y i n E n g l i s h t e x ti s p r e s e n t e d . I n t h i s m e t h o d t h e US a n d UK s p e l l i n g s o f w o r d ss u b s t i t u t e d i n o r d e r t o h i d e d a t a i n a n E n g l i s h t e x t . F o re x a m p l e " a n a l y z e " h a s d i f f e r e n t s p e l l i n g i n UK ( a n a l y s e ) a n d

    US ( a n a l y z e ) . T h e d e t a i l s o f t h i s m e t h o d a r e d e s c r i b e d i n t h et h i r d s e c t i o n .T h i s m e t h o d i s i m p l e m e n t e d b y J a v a p r o g r a m m i n g l a n g u a g e .I n t h e t h i r d s e c t i o n we w i l l d i s c u s s e d how t o i m p l e m e n t t h ep r o j e c t .Among t h e r e p o r t e d t e x t s t e g a n o g r a p h y m e t h o d s , S e m a n t i cM e t h o d s [ 2 ] i s s i m i l a r t o o u r m e t h o d . I n t h e n e x t s e c t i o n t h i sm e t h o d i s e x p l a i n e d .I n t h e f i n a l s e c t i o n t h e c o n c l u s i o n w i l l b e m a d e a f t e rs t u d y i n g s o m e a d v a n t a g e s o f t h i s m e t h o d

    2 . R e l a t e d W o r k sA s we s a i d i n p r e v i o u s s e c t i o n , a f e w w o r k s h a v e b e en d o n eo n h i d i n g i n f o r m a t i o n i n t e x t s . H e r e , we m a k e a r e v i e w o fs o m e w o r k s d o n e o n t h e t e x t s t e g a n o g r a p h y m e t h o d s .2 . 1 . L i n e S h i f t i n g [ 4 ] : I n t h i s m e t h o d , t h e l i n e s o f t h e t e x t a r ev e r t i c a l l y s h i f t e d t o s o m e d e g r e e ( f o r e x a m p l e , e a c h l i n e s h i f t s1 / 3 0 0 i n c h u p o r d o w n ) a n d i n f o r m a t i o n a r e h i d d e n b y c r e a t i n ga u n i q u e s h a p e o f t h e t e x t . T h i s m e t h o d i s p r o p e r f o r p r i n t e d

    t e x t s . H o w e v e r , i n t h i s m e t h o d , t h e d i s t a n c e s c a n b e o b s e r v e db y u s i n g s p e c i a l i n s t r u m e n t s o f d i s t a n c e a s s e s s m e n t a n dn e c e s s a r y c h a n g e s c a n b e i n t r o d u c e d t o d e s t r o y t h e h i d d e ni n f o r m a t i o n . A l s o i f t h e t e x t i s r e t y p e d o r i f c h a r a c t e rr e c o g n i t i o n p r o g r a m s ( O C R ) a r e u s e d , t h e h i d d e n i n f o r m a t i o nw o u l d g e t d e s t r o y e d .2 . 2 . Word S h i f t i n g [ 5 ] : I n t h i s m e t h o d , b y s h i f t i n g w o r d sh o r i z o n t a l l y a n d b y c h a n g i n g d i s t a n c e b e t w e e n w o r d s ,i n f o r m a t i o n a r e h i d d e n i n t h e t e x t . T h i s m e t h o d i s a c c e p t a b l ef o r t e x t s w h e r e t h e d i s t a n c e b e t w e e n w o r d s i s v a r y i n g . T h i sm e t h o d c a n b e i d e n t i f i e d l e s s , b e c a u s e c h a n g e o f d i s t a n c eb e t w e en w o r d s t o f i l l a l i n e i s q u i t e c o m m o n . B u t i f s o m e b o d yw a s a w a r e o f t h e a l g o r i t h m o f d i s t a n c e s , h e c a n c o m p a r e t h ep r e s e n t t e x t w i t h t h e a l g o r i t h m a n d e x t r a c t t h e h i d d e ni n f o r m a t i o n b y u s i n g t h e d i f f e r e n c e . T h e t e x t i m a g e c a n b ea l s o c l o s e l y s t u d i e d t o i d e n t i f y t h e c h a n g e d d i s t a n c e s .A l t h o u g h t h i s m e t h o d i s v e r y t i m e c o n s u m i n g , t h e r e i s a h i g hp r o b a b i l i t y o f f i n d i n g i n f o r m a t i o n h i d d e n i n t h e t e x t . T h e s a m ea s i n t h e p r e v i o u s m e t h o d , r e t y p i n g o f t h e t e x t o r u s i n g O CRp r o g r a m s d e s t r o y s t h e h i d d e n i n f o r m a t i o n .2 . 3 . S y n t a c t i c M e t h o d s [ 6 ] : By p l a c i n g s o m e p u n c t u a t i o ns i g n s s u c h a s f u l l s t o p ( . ) a n d comma ( , ) i n p r o p e r p l a c e s , o n ec a n h i d e i n f o r m a t i o n i n a t e x t f i l e . T h i s m e t h o d r e q u i r e si d e n t i f y i n g p r o p e r p l a c e s f o r p u t t i n g p u n c t u a t i o n s i g n s . T h ea m o u n t o f i n f o r m a t i o n t o h i d e i n t h i s m e t h o d i s t r i v i a l .

    F e b . 1 7 - 2 0 , 2 0 0 8 I C A C T 2 0 0 8S B N 9 7 8 - 8 9 - 5 5 1 9 - 1 3 6 - 3 - 1 9 1 2 -

  • 8/2/2019 Word Spelling

    2/2

    2 . 4 . S e m a n t i c M e t h o d s [ 2 ] : T h i s m e t h o d i s s i m i l a r t o o u rm e t h o d . I n t h i s m e t h o d , t h e s y n o n y m o f w o r d s i s u s e d f o rc e r t a i n w o r d s t h e r e b y t h e i n f o r m a t i o n i s h i d d e n i n t h e t e x t . Am a j o r a d v a n t a g e o f t h i s m e t h o d i s t h e p r o t e c t i o n o fi n f o r m a t i o n i n c a s e o f r e t y p i n g o r u s i n g O CR p r o g r a m s( c o n t r a r y t o m e t h o d s l i s t e d u n d e r 2 - 1 a n d 2 - 2 ) . H o w e v e r , t h i sm e t h o d may a l t e r t h e m e a n i n g o f t h e t e x t .2 . 5 . A b b r e v i a t i o n [ 2 ] : A n o t h e r m e t h o d f o r h i d i n gi n f o r m a t i o n i s t h e u s e o f a b b r e v i a t i o n s . I n t h i s m e t h o d , v e r yl i t t l e i n f o r m a t i o n c a n b e h i dd en i n t h e t e x t . F o r e x am pl e , o n l ya f e w b i t s c a n b e h i d d e n i n a f i l e o f s e v e r a l k i l o b y t e s .A l s o t h e r e a r e o t h e r t e x t s t e g a n o g r a p h y m e t h o d s s u c h a sF e a t u r e C o d i n g a n d O p e n S p a c e s . T h e s u r v e y o n t h e s em e t h o d s i s a v a i l a b l e i n [ 7 ] .

    3 . T h e S u g g e s t e d M e t h o dT h i s p r o j e c t o f f e r s a new s t e g a n o g r a p h y m e t h o d f o r h i d i n gd a t a i n E n g l i s h t e x t s . I n E n g l i s h s o m e w o r d s h a v e d i f f e r e n ts p e l l i n g i n UK a n d U S . F o r e x a m p l e " d i a l o g " h a s d i f f e r e n t

    t e r m s i n UK ( d i a l o g u e ) a n d US ( d i a l o g ) . S o we c a n h i d e d a t ai n t h e t e x t b y s u b s t i t u t i n g t h e s e w o r ds . T ab l e I s h o w s a n u m b e ro f s u c h w o r d s w h i c h h a v e d i f f e r e n t s p e l l i n g i n UK a n d U S .T h e d e t a i l s o f t h i s m e t h o d a n d i t s i m p l e m e n t a t i o n a r e a sf o l l o w s :We h a v e u s e d J a v a p r o g r a m m i n g l a n g u a g e t o i m p l e m e n t t h i sm e t h o d . T h i s p r o j e c t i s c o m p o s e d o f t w o p r o g r a m s :1 - H i d i n g p r o g r a m w h i c h i s r e s p o n s i b l e f o r h i d i n g d a t a i nt e x t .2 - E x t r a c t o r p r o g r a m w h i c h e x t r a c t s d a t a f r o m t h e t e x tc o n t a i n i n g h i d d e n d a t a .A t f i r s t we p r e p a r e a l i s t c o n t a i n i n g t h e w o r d s w h i c h h a v ed i f f e r e n t UK a n d US s p e l l i n g .T h e h i d i n g p r o g r a m l o o k s f o r e x i s t i n g w o r d s i n t h e l i s t i n t h et e x t . F u r t h e r m o r e t h i s p r o g r a m c o n v e r t s t h e c o n c e r n e d d a t a t oa n a r r a n g e m e n t o f 0 a n d 1 b i t s . T h e p r o g r a m w i l l p l a c e USw o r d i n s e n t e n c e f o r h i d i n g o f t h e b i t 0 a n d w i l l p l a c e t h e UKw o r d i n t h e s e n t e n c e i n o r d e r t o h i d e t h e b i t 1 .T h i s wa y t h e d a t a w i l l b e h i d de n i n t h e c o n c e r n e d t e x t . Of

    c o u r s e t h e s i z e o f d a t a i s h i d d e n i n t h e t e x t i n o r d e r t h a t t h ee x t r a c t o r p r o g r a m c a n w o r k c o r r e c t l y .T h e e x t r a c t o r p r o g r a m w i l l e x t r a c t t h e d a t a f r o m t h e t e x t .T h i s p r o g r a m i d e n t i f i e s t h e t y p e o f w o r d s i n t e x t b y u s i n g t h el i s t o f w o r d s h a v i n g d i f f e r e n t UK a n d US s p e l l i n g a n d s a v e st h e q u a n t i t y o f 0 o r 1 i n a n a r r a n g e m e n t a c c o r d i n g t o t h e f a c tw h e t h e r i t i s a US w o r d o r UK w o r d . Now t h e h i d d e n d a t a w i l lb e e x t r a c t e d t h r o u g h c o n v e r s i o n o f t h i s a r r a n g e m e n t f r o m t h eb i t s 0 a n d 1 t o i t s o r i g i n a l f o r m a t . A t t h e e n d t h e e x t r a c t e d d a t aw i l l b e s a v e d o n t h e u s e r ' s c o m p u t e r .T h i s m e t h o d h a s l i t t l e c a p a c i t y t o h i d e d a t a i n t h e t e x t .H o w e v e r t h i s i s r e l a t e d t o t h e b o d y o f t e x t a n d i t s s i z e , b u t i no v e r a l l i t s c a p a c i t y i s v e r y l o w .A l t h o u g h i t s c a p a c i t y i s l o w , we m u s t b e n o t e t h e s i t u a t i o nt h a t t h i s m e t h o d i s u s e d ; b e c a u s e i n s o m e s i t u a t i o n s we n e e d t oh i d e l i t t l e d a t a , b u t o t h e r s t e g a n o g r a p h y m e t h o d s a r e n o ts u i t a b l e a n d c a n b e b r o k e n .A l s o o u r s u g g e s t e d m e t h o d i s a new o n e , t h e r e f o r e t h ep o s s i b i l i t y o f b r e a k i n g t h i s m e t h o d i s l o w .

    T a b l e 1 . L i s t o f some wordsw h i c h h a v e d i f f e r e n t s p e l l i n g i n UK a n d USA m e r i c a n S p e l l i n g B r i t i s h S p e l l i n gF a v o r i t e F a v o u r i t eC r i t i c i z e C r i t i c i s eF u l f i l l F u l f i lC e n t e r C e n t r eD i a l o g D i a l o g u eM e d i e v a l M e d i a e v a lC h e c k C h e q u eD e f e n s e D e f e n c eT i r e T y r eOn t h e o t h e r h a n d , i n c o u n t r i e s w h i c h t h e i r n a t i v e l a n g u a g e i sn o t E n g l i s h a n d t h e i r E n g l i s h l a n g u a g e k n o w l e d g e i s l o w ,s u b s t i t u t i n g US a n d UK s p e l l i n g s o f w o r d s a r e n o t a t t r a c ta t t e n t i o n m u c h , s o t h i s m e t h o d i s a p p l i c a b l e i n t h e s e c o u n t r i e s .

    4 . C o n c l u s i o nT h i s p ap er p r e s e n t s a new t e x t s t e g a n o g r a p h y m e t h o d f o rh i d i n g d a t a i n E n g l i s h t e x t s . T h i s m e t h o d i s b a s e d o ns u b s t i t u t i n g US a n d UK s p e l l i n g s o f w o r d s .I n E n g l i s h s o m e w o r d s h a v e d i f f e r e n t s p e l l i n g i n US a n d U K .F o r e x a m p l e " p r o g r a m " h a s d i f f e r e n t s p e l l i n g i n UK( pr og ra m m e ) a nd US ( p r o g r a m ) . By u s i n g t h i s f e a t u r e , wep r o p o s e o u r m e t h o d f o r h i d i n g d a t a i n a n E n g l i s h t e x t . I n t h i sm e t h o d we h i d e d a t a i n t h e t e x t b y s u b s t i t u t i n g s u c h w o r ds .T h i s m e t h o d i s n o t o n l y f o r e l e c t r o n i c d o c u m e nt s a n d c a n b eu s e d o n p r i n t i n g t e x t s . By p r i n t i n g t h e e l e c t r o n i c d o c u m e n t ,t h e h i d d e n d a t a i s n o t d e s t r o y e d a n d w i l l r e m a i n .O u r s u g g e s t e d m e t h o d i s n e w , s o t h e p o s s i b i l i t y o f b r e a k i n gt h i s m e t h o d i s l o w .T h i s m e t h o d c a n b e u s e d o n o t h e r d e v i c e s s u c h a s P o c k e t P C ,PDAs a n d m o b i l e p h o n e s . F o r e x a m p l e t h i s m e t h o d c a n b ea p p l i e d o n SMS ( S h o r t M e s s a g e S e r v i c e ) m e s s a g e s . T h e SMS

    i s a p o p u l a r s e r v i c e o n m ob i l e p h o n e s w h i c h i s t h e t r a n s f e r a n de x c h a n g e o f s h o r t t e x t m e s s a g e s b e t w e e n m o b i l e p h o n e s .REFERENCES

    [ 1 ] N . J . H o p p e r , T o w a r d a t h e o r y o f S t e g a n o g r a p h y , P h . D . D i s s e r t a t i o n ,S c h o o l o f C o m p u t e r S c i e n c e , C a r n e g i e M e l l o n U n i v e r s i t y , P i t t s b u r g h , P A ,U S A , J u l y 2 0 0 4 .[ 2 ] W. B e n d e r , D . G r u h l , N . M o r i m o t o , a n d A . L u , " T e c h n i q u e s f o r d a t ah i d i n g " , IB M S y s t e m s J o u r n a l , v o l . 3 5 , I s s u e s 3 & 4 , 1 9 9 6 , p p . 3 1 3 - 3 3 6 .[ 3 ] M . N i i m i , S . M i n e w a k i , H . N o d a , a n d E . K a w a g u c h i , " A F r a m e w o r k o fT e x t - b a s e d S t e g a n o g r a p h y U s i n g S D - F o r m S e m a n t i c s M o d e l " , P a c i f i cRi m W o r k s h o p o n D i g i t a l S t e g a n o g r a p h y 2 0 0 3 , K y u s h u I n s t i t u t e o fT e c h n o l o g y , K i t a k y u s h u , J a p a n , 3 - 4 J u l y 2 0 0 3 .[ 4 ] A . M . A l a t t a r a n d O . M . A l a t t a r , " W a t e r m a r k i n g e l e c t r o n i c t e x t d o c u m e n t sc o n t a i n i n g j u s t i f i e d p a r a g r a p h s a n d i r r e g u l a r l i n e s p a c i n g " , P r o c e e d i n g so f S P I E - - V o l u m e 5 3 0 6 , S e c u r i t y , S t e g a n o g r a p h y , a n d W a t e r m a r k i n g o fM u l t i m e d i a C o n t e n t s V I , J u n e 2 0 0 4 , p p . 6 8 5 - 6 9 5 .[ 5 ] Y . K i m , K . M o o n , a n d I . O h , " A T e x t W a t e r m a r k i n g A l g o r i t h m b a s e d o nWord C l a s s i f i c a t i o n a n d I n t e r - w o r d S p a c e S t a t i s t i c s " , P r o c e e d i n g s o f t h eS e v e n t h I n t e r n a t i o n a l C o n f e r e n c e o n D o c u m e n t A n a l y s i s a n dR e c o g n i t i o n ( I C D A R ' 0 3 ) , 2 0 0 3 , p p . 7 7 5 - 7 7 9 .[ 6 ] K . B e n n e t t , " L i n g u i s t i c S t e g a n o g r a p h y : S u r v e y , A n a l y s i s , a n dR o b u s t n e s s C o n c e r n s f o r H i d i n g I n f o r m a t i o n i n T e x t " , P u r d u e U n i v e r s i t y ,CERIAS T e c h . R e p o r t 2 0 0 4 - 1 3 .[ 7 ] M . H . S h i r a l i - S h a h r e z a a n d M . S h i r a l i - S h a h r e z a , " T e x t S t e g a n o g r a p h y i nC h a t " , P r o c e e d i n g s o f t h e T h i r d I E E E / I F I P I n t e r n a t i o n a l C o n f e r e n c e i nC e n t r a l A s i a o n I n t e r n e t t h e N e x t G e n e r a t i o n o f M o b i l e , W i r e l e s s a n dO p t i c a l C o m m u n i c a t i o n s N e t w o r k s ( I C I 2 0 0 7 ) , T a s h k e n t , U z b e k i s t a n ,S e p t e m b e r 2 6 - 2 8 , 2 0 0 7 .

    F e b . 1 7 - 2 0 , 2 0 0 8 I C A C T 2 0 0 8S B N 9 7 8 - 8 9 - 5 5 1 9 - 1 3 6 - 3 - 1 9 1 3 -