презентация day4

Post on 30-May-2015

519 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Технический аудит

SEARCHENGINEEDUCATION

День 4

seo.in.russia@gmail.comЛатыпов Артур

Технический аудит, основные пункты

- Добавить сайт в панель Яндекс.Вебмастер webmaster.yandex.ru

1. Главное зеркало2. Проверка индексирования, выявление мусора3. Отсутствие дублей4. Поиск битых ссылок5. Валидация кода 6. Проверка контента на уникальность7. Наличие правильно настроенного robots.txt8. Наличие sitemap.xml9. Уникальность внутри сайта title, h1-h6, мета-тэгов10.Структура url (ЧПУ)11.Ответы сервера в http заголовках, скорость загрузки, размер

seo.in.russia@gmail.comЛатыпов Артур

Главное зеркало

Пример настройки 301 редиректа в .htaccess (без www. редирект ведет на www.)

Options +FollowSymLinksRewriteEngine OnRewriteCond %{HTTP_HOST} ^domain\.ru$ [NC]RewriteRule ^(.*)$ http://www.domain.ru/$1 [R=301,L]

www и БЕЗ wwwВ панели Вебмастера смотрим страницы в индексе, ищем на первых трех листах страницы с www и БЕЗ www

Сторонние сайты зеркалаЕсли есть доступ до сайта, тогда на сайте зеркале делаем полный дубль основного сайта. В файле robots.txt прописываем строку: Host: www.основной-сайт.ru

Поиск мусораДубли главной страницы вида «http://www.name.ru/index.php» или «http://www.name.ru/main.php?p=index»;

Фильтры товара в интернет-магазинах, различные результаты сортировки;

Страницы с постоянной 404-й ошибкой, на которые есть ссылки. Ищутся также в панели вебмастера в разделе “Исключено роботом”;

Страницы с результатами поиска по сайту;

Страницы для печати;

Страницы с профилями пользователей, личный кабинет, формы регистрации \ авторизации;

Страницы создания новой темы, формы добавления комментария и им подобные;

Ввести адрес страницы «www.name.ru/abrakadabra» или «www.name.ru/razdel/abrakadabra» - если при этом загружается страница – это мусор;

Поиск мусораНечеткие дубли

Поиск мусораСтраницы должны быть закрыты от индексации в файле robots.txt.

На эти страницы не должны вести индексируемые ссылки.

Не существующие страницы должны отдавать http заголовок - 404 ошибка.

Страницы–листинги, нечеткие дубли иметь тэг rel=canonical первую (основную) страницу.

<link rel="canonical" href="http://www.site.ru/osnovnaya-stranica.html" >

Поиск битых ссылок

Валидация кода

• http://validator.w3.org – добавляем сайт

• Количество ошибок должно стремиться к нулю

• Для решения проблем привлекаем верстальщика или исправляем самостоятельно

Скрытие ссылокРаботающий метод скрытия ссылок от индексации – только через ajax NOINDEX и NOFOLLOW не работают

Структура кода

Большие технические блоки (скрипты, меню, грязный код) уменьшают значение основного контентного блока.

Чистота в верстке• Большое количество технических блоков, наличие спец. Информации “размывают”

объем полезного контента страницы по отношению ко всему коду. Т.е. страницы фактически могут являться дублями.

Примеры грязной верстки: <div id=blok1><ul class="menu2"><li class="menu2" id="s1" style="display: none;"><a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a></li><li class="menu2" id="s2" style="display: none;"><a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные линзы</a></li></ul></div>

Пример чистой верстки со скрытыми блоками контента:<div id=blok1><ul><li id=«ajax_ankor"></li><li id=“ankor_v_texte"><a href="/dvuhnedelnie-kontaktnye-linzy">Двухнедельные линзы</a></li></ul></div>

Подключаем jquery и нужный нам скрипт в <head></head><script src='/js/jquery.js' type='text/javascript'></script><script src="/js/jquery.history.js" type="text/javascript"></script><script src='/js/jqall.js' type='text/javascript'></script>

----------------------------------------------------------------------------------------------------------------

Содержимое файла jqall.js:/*подгрузка данных с помощью ajax 7.html*/$.get("txt/name.txt", function(data){

$("#ajax_ankor").html(data);}, "text");

----------------------------------------------------------------------------------------------------------------

Содержимое фала name.txt в папке /txt/ :<a href="/odnodnevnye-kontaktnye-linzy">Однодневные контактные линзы</a>

robots.txt & sitemapПравильное содержание robots.txt:

User-agent: YandexDisallow: /links.phpHost: www.site.ru

User-agent: * Disallow: /links.php

http://help.yandex.ru/webmaster/?id=996567 - использование robots.txt в Яндексе;

http://robotstxt.org.ru - подробно описан стандарт robots.txt;

http://www.htmlweb.ru/analiz/sitemap.php - создание sitemap.

Yazzle также отлично справляется с созданием sitemap

Пример robots.txt

User-agent: YandexDisallow: /cgi-binDisallow: /category/*/*Disallow: */trackbackDisallow: /*?*Disallow: /*?Disallow: /projects/category/news$Host: site.ru

Уникальность контента

• Программа eTXT антиплагиат• http://www.etxt.ru/antiplagiat/

• Проверяем весь сайт на уникальность контента. ОСНОВНОЙ КОНТЕНТ ДОЛЖЕН БЫТЬ УНИКАЛЬНЫЙ!

Уникальность\наличие

• Уникальность текстов внутри сайта• Уникальность title внутри сайта• Уникальность h1-h6• Уикальность\наличие мета-тэгов

seo.in.russia@gmail.comЛатыпов Артур

Ссылки на сервисы и софт

PageWeight http://www.page-weight.ru/Advego http://advego.ru/text/seo/CS Yazzle http://www.yazzle.ru/eTXT Антиплагиат http://www.etxt.ru/antiplagiat/Site Auditor http://www.site-auditor.ruЧек лист http://www.seochecklist.ru/Анализ сайтов http://a.megaindex.ruСкорость загрузки http://mainspy.ru/skorost_zagruzki_sajta

Пример аудита

Определение главного зеркала

Поиск мусорных страниц

Есть раздел, который нужно закрыть от индексации /wp-content/ В задании на аудит, задание программисту - исправить некоторые url на транслит.

Битые ссылки

Уникальность контента

Валидация

• Практически без ошибок• Задание верстальщику на исправление

Чистота кода

В html копии страницы (исходный код) встречаются:- Списки стилей<style type="text/css">

div#fancy_inner {border-color:#BBBBBB}

div#fancy_close {left:-15px;top:-12px}

div#fancy_bg {background-color:#000000}

div#fancy_title table {display:none}

</style>

- Java скрипты в коде в том числе в тэге <head><script type="text/javascript">$('textarea').autoResize({ onResize : function() { $(this).css({opacity:0.8}); }, animateCallback : function() { $(this).css({opacity:1}); }, animateDuration : 300, extraSpace : 15});</script>

- Так же в коде встречаются ссылки href=# , бесполезные тэги, технические блоки.

Чистота кода

Технический блок – отправка сообщения <div class="widgetcontact"> <div class="wpcf7" id="wpcf7-f5-t1-o1"><form action="/#wpcf7-f5-t1-o1" method="post" class="wpcf7-form"><div style="display: none;"><input type="hidden" name="_wpcf7" value="5" /><input type="hidden" name="_wpcf7_version" value="3.0.1" /><input type="hidden" name="_wpcf7_unit_tag" value="wpcf7-f5-t1-o1" /></div><h3>Контакт с нами</h3><p><span class="wpcf7-form-control-wrap text-86"><input type="text" name="text-86" value="" class="wpcf7-text wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваши ф.и.о." /></span></p><p><span class="wpcf7-form-control-wrap e-mail"><input type="text" name="e-mail" value="" class="wpcf7-text wpcf7-validates-as-email wpcf7-validates-as-required wpcf7-use-title-as-watermark" size="40" title="ваш e-mail" /></span></p><p><span class="wpcf7-form-control-wrap text-878"><input type="text" name="text-878" value="" class="wpcf7-text wpcf7-use-title-as-watermark" size="40" title="ваш телефон" /></span></p><p><span class="wpcf7-form-control-wrap textarea-818"><textarea name="textarea-818" id="resize" class="wpcf7-validates-as-required autoResize wpcf7-use-title-as-watermark" cols="40" rows="10" title="ваше сообщение"></textarea></span></p><p><input type="submit" value="отправить" class="wpcf7-submit" /><img class="ajax-loader" style="visibility: hidden;" alt="Отправка..." src="http://airmagistral.ru/wp-content/plugins/contact-form-7/images/ajax-loader.gif" /></p><div class="wpcf7-response-output wpcf7-display-none"></div></form></div> </div>

Ответы сервера

• Вбиваю различные варианты в строку браузераAirmagistral.ru/111 – 404 ошибкаAirmagistral.ru/111/ - 404 ошибка Airmagistral.ru/news/111 – 404 ошибкаAirmagistral.ru/product/111 – 200 ОКAirmagistral.ru/about/111 - 200 ОКAirmagistral.ru/contacts/123 – 200 ОКAirmagistral.ru/products/flazhki-2/123 – 200 ОКНужно подключать программиста.

Robots.txt

• На сайте стандартный WordPress файл robots.txt.

• Меняем его по шаблону, с учетом найденных мусорных страниц и битых ссылок

Sitemap.xml

• Для небольших сайтов, с редко изменяемым контентом можем сами сгенерировать при помощи Yazzle

• Для больших сайтов и сайтов с часто изменяемым контентом – нужно привлекать программиста

Проверяем созданный файл в ручную, удаляем ошибочные страницы

Webmaster.yandex.ru

• Добавление сайта в панель Вебмастера

a.megaindex.ru

Проверка title, h1-h6, мета

Проверка title, h1-h6, мета

• Отсутствуют заполненные мета-тэги keywords и description

Проверка title, h1-h6, мета

• С h1 в целом все ОК

Структура URL (чпу)

• ЧПУ сайта работает нормально• Часть URL нужно перевести в транслит

(необязательно)

Скорость загрузки, размер

• Домен - airmagistral.ru• Скорость (Кб/сек) - 25.36• Время (сек) - 0.64• Размер (Кб) - 16.33

Итог

• Итогом работ по техническому аудиту является файл – практически ТЗ.

• Подготовил файл с аудитом по всем вышесказанным пунктам.

• Файл будет доступен после выполнения ДЗ. Условия уже стандартные:

- выполняете задание; - отписываетесь в группе Вконтакте;- пишите mail Ярославу;- получаете файл

ВОПР СЫ

Вопросы – это тайный путь к …

Seo.in.russia@gmail.com

Латыпов Артур

top related