no me indexes que me cacheo

43
@chemaalonso

Upload: chema-alonso

Post on 11-Jun-2015

14.063 views

Category:

Technology


1 download

DESCRIPTION

Presentación impartida por Chema Alonso en las Navajas Negras 4 Edición (año 2014) sobre la indexación de contenido en los buscadores y cómo aprovecharlo para hacer auditorías de seguridad y hacking

TRANSCRIPT

Page 1: No me indexes que me cacheo

@chemaalonso

Page 2: No me indexes que me cacheo

Gracias por la invitación

Page 3: No me indexes que me cacheo

Index

Cache

Index

Cache

Other SearchEngines

Pub doc

Index & Cache

Page 4: No me indexes que me cacheo

Cache

http://www.elladodelmal.com/2013/08/una-anecdota-con-google-archive-y-la.html

Page 5: No me indexes que me cacheo

Primary Index & Secondary Index

http://www.elladodelmal.com/2014/07/cuantas-urls-se-pueden-extraer-con.html

Page 6: No me indexes que me cacheo

What is Robots.txt for?

• Evita la indexación de contenidos de las URLs protegidas

• Por tanto, no se realiza spidering• No evita que se indexen las URLS

Page 7: No me indexes que me cacheo

Robots.txt Security Issues

B14Ck S30 Pwn1nage!

Page 8: No me indexes que me cacheo

Robots.txt “leakeage”

Page 9: No me indexes que me cacheo

Robots.txt “leakeage” + Archive.org

Page 10: No me indexes que me cacheo

Robots.txt “leakeage” + Google

http://www.elladodelmal.com/2013/09/buscando-en-robotstxt-lo-que-esta.html

Page 11: No me indexes que me cacheo

Robots.txt “leakeage”+ Google+ Directory Listing

http://www.elladodelmal.com/2013/09/buscando-en-robotstxt-lo-que-esta.html

Page 12: No me indexes que me cacheo

Robots.txt “leakeage” + Google + IIS ShortName b

http://www.elladodelmal.com/2013/10/un-bug-de-iis-short-name-en-el-windows.html

Page 13: No me indexes que me cacheo

Robots.txt “leakeage” + Google + IIS ShortName + FOCA

http://www.elladodelmal.com/2012/07/listado-de-ficheros-en-iis-7-utilizando.html

Page 14: No me indexes que me cacheo

Indexing the Robots.txt

Page 15: No me indexes que me cacheo

Indexing the Robots.txt

Page 16: No me indexes que me cacheo

Indexing the Robots.txt

Page 17: No me indexes que me cacheo

Indexing the Robots.txt:Blogger preview + Cache

http://www.elladodelmal.com/2012/08/minority-report-pre-visualizando-el.html

Page 18: No me indexes que me cacheo

Indexing the Robots.txt:WordPress preview + Cache

http://www.elladodelmal.com/2014/07/wordpress-ten-cuidado-con-el-cacheo-de.html

Page 19: No me indexes que me cacheo

Indexing the Robots.txt:WordPress preview + Cache

http://www.elladodelmal.com/2014/07/wordpress-ten-cuidado-con-el-cacheo-de.html

Page 20: No me indexes que me cacheo

“GmailGate” with Robots.txt:Octubre de 2013

http://www.elladodelmal.com/2013/10/79400-urls-de-gmail-indexadas-en-google.html

Page 21: No me indexes que me cacheo

“GmailGate” with Robots.txt:Octubre de 2013

http://www.elladodelmal.com/2013/10/79400-urls-de-gmail-indexadas-en-google.html

Page 22: No me indexes que me cacheo

“GmailGate” with Robots.txt:Octubre de 2013

http://www.elladodelmal.com/2013/10/79400-urls-de-gmail-indexadas-en-google.html

Page 23: No me indexes que me cacheo

“GmailGate” with Robots.txt:Abril de 2014

http://www.elladodelmal.com/2014/05/gmail-borraste-en-google-pero-te-quedan.html

Page 24: No me indexes que me cacheo

“GmailGate” with Robots.txt:Julio de 2014

http://www.elladodelmal.com/2014/07/googe-si-usa-bing-para-borrar-las-urls.html

Page 25: No me indexes que me cacheo

“Facebookgate” with Robots.txt

http://www.elladodelmal.com/2013/09/facebook-tiene-problemas-con-la.html

Page 26: No me indexes que me cacheo

“Facebookgate” with Robots.txt

http://www.elladodelmal.com/2013/09/facebook-tiene-problemas-con-la.html

Page 27: No me indexes que me cacheo

“WhatsAppGate” with Robots.txt

http://www.elladodelmal.com/2013/09/problemas-de-privacidad-de-whatsapp-con.html

Page 28: No me indexes que me cacheo

Indexing the robots.txt + XSS = XSS Google-Persistentes

http://es.slideshare.net/chemai64/xss-google-persistentes

Page 29: No me indexes que me cacheo

Robots.txt

• Previene que se indexe a partir de las rutas puestas.

• Evita que se guarde contenido en el índice de Google/Bing/Otros

• No evita que la URL, el título, y las keywords del enlace se indexen.

• Puede ser un leak de información en ataques dirigidos y en ataques de dorking.

• No evita la indexación en el pasado.

Page 30: No me indexes que me cacheo

“Evernotegate” with Robots.txt

http://www.elladodelmal.com/2014/08/evernote-no-quiere-hacer-nada-cuida-tus.html

Page 31: No me indexes que me cacheo

Not cache, but it is in the index

http://www.elladodelmal.com/2014/08/evernote-no-quiere-hacer-nada-cuida-tus.html

Page 32: No me indexes que me cacheo

Evernote, Index & Cache

http://www.elladodelmal.com/2014/08/evernote-no-quiere-hacer-nada-cuida-tus.html

Page 33: No me indexes que me cacheo

“Evernotegate” with Robots.txt

http://www.elladodelmal.com/2014/08/evernote-no-quiere-hacer-nada-cuida-tus.html

Page 34: No me indexes que me cacheo

El “viagrate” del Albacete Balompié

Page 35: No me indexes que me cacheo

Demo: Brute Forcing the index

Page 36: No me indexes que me cacheo

How to manage the relationship?

http://www.slideshare.net/chemai64/black-seov3

Page 37: No me indexes que me cacheo

How to manage the relationship?

• Evitar rutas con contenido mixto (publico/privado)

• Evitar contenido no enlazado en rutas publicas

• Evitar rutas privadas conocidas (/etc/ /users/)• Evitar rutas privadas explícitas• Evitar configuraciones privadas automaticas • Evitar el uso de rutas privadas a fichero • Aplicar la misma configuración para todas las

aranas de todos los buscadores de Internet• Proteger las rutas privadas con listas de

control de acceso si es posible

http://www.slideshare.net/chemai64/black-seov3

Page 38: No me indexes que me cacheo

How to manage the relationship?(Google)

https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag

Page 39: No me indexes que me cacheo

HTML Meta Tags

https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag

Page 40: No me indexes que me cacheo

X-Robots-Tag HTTP header

https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag

Page 41: No me indexes que me cacheo

Google WebMaster Tools

https://www.google.com/webmasters/tools/home?hl=es

Page 42: No me indexes que me cacheo

Faast: Persistent Pentesting

• BlackSEO– Cheap Viagra– Cheap Software– Etc…

• Robots.txt fingerprinting– SW versions

• Robots.txt leakeage– Testing all forbiden URLs

• Robots.txt indexation– Searching forbidden

URLS in Google/Bing

https://www.elevenpaths.com/technology/faast/index.html