Фильтрация семантики для e-commerce

Post on 19-Jul-2015

2.041 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Фильтрация семантики для e-commerce

28 января 2015

«SEO 2015»

Игорь Бакалов

• В клиентском SEO с 2010 года

• Опыт продвижения: более 60 проектов

• Автор блога http://bakalov.info/

Семантическое ядро для e-commerce

Стандартный подбор СЯ: парсим подсказки исервисы статистики запросов поисковыхсистем, собственные счетчики, запросыконкурентов, базы ключевых слов…

Стандартная фильтрация СЯ: удаляем неявные дубли, прогоняем по спискам стоп-слов, удаляем «пустышки», удаляем ГНЗзапросы без топонима...

Фильтрация СЯ для e-commerceПолучили 100500 запросов, что дальше?

Можно фильтровать руками…

На глаз удаляются не подходящие магазину запросы, а также запросы с выраженным

информационным интентом.

Фильтрация СЯ для e-commerce

Альтернатива: перед ручной проверкой автоматически оценить на сколько каждый запрос

подходит сегменту e-commerce.

Как сделать? Проверить сколько интернет-магазинов находится в топ-10 по каждому запросу.

Если в топ-10 только интернет-магазины – запрос максимально целевой, если интернет магазинов нет совсем – запрос не целевой. В результате по

каждому запросу получаем значение в интервале [0;1]

Как автоматизировать?

Фильтрация СЯ для e-commerce

Для интернет-магазинов характерно:

1. Наличие корзины

2. Наличие кнопки «Купить» / «Добавить в корзину»

3. Наличие информации о доставке и оплате

4. Упоминание в тексте, что это «интернет-магазин»

5. Ряд других характеристик, но не в рамках данногодоклада

Забегая вперед: проверять будем при помощирегулярных выражений, но сперва…

Фильтрация СЯ для e-commerce

Как получить список URL на проверку?

Шаг 1: загружаем в KeyCollector список запросов иполучаем данные из Яндекса (KEI → Получитьданные для ПС Яндекс)

Шаг 2: выгружаем данные по топ-10 из KeyCollector вExcel (KEI → Экспортировать данные о поисковойвыдаче)

Шаг 3: средствами Excel выполняем чистку URL’ов,оставляя только уникальные…

Фильтрация СЯ для e-commerce

Пример №1: тематика «Сумки»

Кол-во запросов: 6011

Кол-во URL: 60110

Кол-во уникальных URL: 24957

Если брать не более 3 URL с домена, то: 9910

Пример №2: тематика «Смартфоны»

Кол-во запросов: 3124

Кол-во URL: 31240

Кол-во уникальных URL: 10879

Если брать не более 3 URL с домена, то: 2809

Фильтрация СЯ для e-commerce

Ищем на странице «Корзину»:

(?i:ваша корзина пуста|в корзине нет товаров|корзинапуста|корзина \(|товаров в корзине|/basket|/basket.php\?product|="basket|>ваша корзина<|>в корзине<|>корзина<|>моя корзина)

Ищем упоминание про «Доставку и оплату»:

(?i:>варианты оплаты<|>доставка и оплата товаров<|>доставка и оплата<|>доставка/оплата<|>доставка<|>оплата и доставка<|>оплата<|>условия доставки<|>способы оплаты<)

Фильтрация СЯ для e-commerce

Ищем на странице кнопку «Купить» / «Добавить в корзину»:

(?i:добавить в корзину|'в корзину'|/addcard\?dataid=|>вкорзину|>купить<|add-to-basket|add-to-cart|addcart|addtocart|add_basket|add_to_basket|add_to_cart|buy_now|shopping_cart|value="в корзину|value="купить)

Ищем упоминание, что это «интернет-магазин»:

(?i:интернет магазин|интернет-магазин|наш магазин)

Фильтрация СЯ для e-commerce

Чем собирать данные?

• ZennoPoster

• Human Emulator

• A-Parser

• Content Downloader

• Собственный скрипт/софт

Примечание: я делал не ZennoPoster…

Фильтрация СЯ для e-commerce

После проверки всех URL на выходе получаем таблицу вида:

Что с ней делать дальше?

URL Корзина Кнопка купить Упоминание Доставка

URL1 ="basket - интернет-магазин -

URL2 - - - -

URL3 - - интернет-магазин -

URL4 /Basket >Купить< Интернет-магазин

URL5 - - - -

URL6 - - интернет магазин>Оплата и доставка<

URL7 /basket - интернет-магазин >Доставка<

URL8 - - интернет-магазин -

URL9 - - интернет магазин -

URL10 /basket >Купить< интернет-магазин >Доставка<

Фильтрация СЯ для e-commerceНе все йогурты одинаково полезны (с)

Каждый из параметров дает определенный «вклад» в итоговуюоценку, на основании которой будет принято решение является лиданный URL интернет-магазином, или нет.

Фильтрация СЯ для e-commerceСколько вешать в граммах?• За наличие «Корзины» - 3 балла

• За наличие кнопки «Купить» / «Добавить в корзину» - 3 балла

• За наличие упоминания, что это ИМ – 2 балла

• За наличие информации о доставке – 2 балла

• Если данных нет – 0 баллов

Баллы «начисляем» в Excel: дублируем список URL на новомлисте, выполняем проверку листа с данными, если в ячейке«пусто», начисляем 0, если нет, начисляем заданноеколичество баллов:

=ЕСЛИ(ЕПУСТО('Лист 1'!B2)=ЛОЖЬ;3;0)

Фильтрация СЯ для e-commerceИнтерпретация результатов: если итоговое значение >= 5, тосчитаем, что данный URL является интернет-магазином, если<5, то не является интернет-магазином.

На всякий случай формула для Excel:

=ЕСЛИ(F2>=5;1;0)

URL Корзина Кнопка купить Упоминание ДоставкаИтоговое значение

Магазин?

URL1 3 0 2 0 5 1URL2 0 0 0 0 0 0URL3 0 0 2 0 2 0URL4 3 3 2 0 8 1

URL5 0 0 0 0 0 0URL6 0 0 2 2 4 0URL7 3 0 2 2 7 1URL8 0 0 2 0 2 0URL9 0 0 2 0 2 0

URL10 3 3 2 2 10 1

Фильтрация СЯ для e-commerceЧто имеем на данном этапе? Бинарную оценку (0,или 1) для каждого URL из топ-10 по всемусемантическому ядру.

Что необходимо получить? Итоговую оценку«магазинности» по каждому поисковому запросу,которая получается путем суммирования оценок покаждому URL из топ-10.

Как сделать на практике?

Фильтрация СЯ для e-commerceКак сделать на практике?

Задействовать магию EXCEL!

Фильтрация СЯ для e-commerceНа один лист размещаем следующую информацию:

1. Выгрузку по запросам и результатам в топ-10

2. Список всех URL и значения их «магазинности»

3. Отдельно список всех запросов

Фильтрация СЯ для e-commerceСекретные формулы:

Получаем данные для топ-10 из проверенного ранее списка:=ВПР(B2;$E$2:$F$1000000;2;0)

Получаем данные по каждому URL из топ-10 и суммируемполученные значения:

=СЧЁТЕСЛИ(ДВССЫЛ("C"&ПОИСКПОЗ(H2;A:A;0)&":C"&ПОИСКПОЗ(H2;A:A;)+ПОИСКПОЗ("*";ИНДЕКС(A:A;ПОИСКПОЗ(H2;A:A;)+1):A1000000;)-

1);1)/СЧЁТ(ДВССЫЛ("C"&ПОИСКПОЗ(H2;A:A;0)&":C"&ПОИСКПОЗ(H2;A:A;)+ПОИСКПОЗ("*";ИНДЕКС(A:A;ПОИСКПОЗ(H2;A:A;)+1):A1000000;)-1;1))

Фильтрация СЯ для e-commerceНа выходе получаем результат вида:

Запрос «Магазинность»

купить недорого сумку через плечо 1

сумки красные интернет магазин 1

модные сумки женские интернет магазин 0.9

кожаная сумка наложенным платежом 0.9

сумка наплечная мужская 0.9

купить мужскую сумку для документов 0.8

сумки женские из натуральной кожи 0.7

карабин для сумки купить 0.7

кожаные мужские сумки 0.6

сумки кожаные без подкладки 0.6

сайт магазина сумок 0.6

магазин сумок робинзон каталог 0.5

ecco сумки женские 0.4

сумки 2015 женские фото 0.3

сумка банан мужская 0.2

Фильтрация СЯ для e-commerceЧто это дает? Понимание!

(Тематика «смартфоны»)

Среди ГНЗ много запросов, где отлично ранжируются магазины:

Запрос Магазинность Геозависимость

смартфон 4g цена 1 0

смартфон lenovo a516 grey цена 1 0

смартфон lenovo a859 white цена 1 0

смартфон lenovo s850 white цена 1 0

смартфон lenovo s860 titanium цена 1 0

заказать смартфон 0.9 0

интернет магазин смартфонов и планшетов 0.9 0

купить в кредит смартфон самсунг 0.9 0

купить смартфон сони иксперия с2305 0.9 0

смартфоны онлайн магазин 0.9 0

смартфон нокия люмия 1020 цена 0.9 0

смартфон самсунг интернет магазин 0.9 0

смартфон самсунг таб 3 цена 0.9 0

смартфон 4g купить 0.9 0

смартфон lenovo a859 grey цена 0.9 0

Фильтрация СЯ для e-commerceЧто это дает? Понимание!

(Тематика «смартфоны»)

Среди ГЗ много запросов, где магазины не встречаются:

Запрос Магазинность Геозависимость

бюджетные смартфоны леново 0 1

бюджетные смартфоны fly 0 1

бюджетные смартфоны lenovo 0 1

новые смартфоны самсунг 2014 цены 0 1

продажа смартфонов в россии 0 1

самсунг сервис центр ремонт смартфонов 0 1

самые дешевые смартфоны леново 0 1

смартфоны новинки samsung 0 1

sony бюджетные смартфоны 0 1

билайн продажа смартфонов 0.1 1

дешевые смартфоны мегафон 0.1 1

дешевые смартфоны нокия 0.1 1

дешевые смартфоны 2014 0.1 1

леново смартфоны новинки 0.1 1

недорогие смартфоны htc 0.1 1

Фильтрация СЯ для e-commerceЧто это дает? Понимание!

(Тематика «сумки»)

Среди ГНЗ много запросов, где отлично ранжируются магазины:

Запрос Магазинность Геозависимость

где купить сумку монстр хай 1 0

сумка ив сен лоран купить 1 0

сумка из рыжей кожи 1 0

сумки кристиан диор купить 1 0

сумки tods интернет магазин 1 0

gucci интернет магазин сумки 1 0

детские сумочки для девочек 0.9 0

женские сумки розового цвета 0.9 0

интернет магазин кожаных сумок италия 0.9 0

интернет магазин сумок наложенным платежом 0.9 0

кожаная сумка наложенным платежом 0.9 0

мужские сумки louis vuitton 0.9 0

мужские сумки lv 0.9 0

сумка женская фиолетовая 0.9 0

сумка мешок мужская 0.9 0

Фильтрация СЯ для e-commerceЧто это дает? Понимание!

(Тематика «сумки»)

Среди ГЗ много запросов, где магазины не встречаются:

Запрос Магазинность Геозависимость

изготовление сумок из кожи 0 1

магазин сумок в галерее 0 1

магазин сумок топавеню 0 1

магазин сумок camerel 0 1

модные джинсовые сумки 0 1

модные сумки шанель 0 1

модные тренды сумок 0 1

мужская сумка пол avon 0 1

сеть магазинов сумок 0 1

сумка из кусочков кожи 0 1

белая сумка кожа 0.1 1

большие модные сумки 0.1 1

где купить сумку невервинтер 0.1 1

женская сумка амели эйвон 0.1 1

женская сумка хобо 0.1 1

Фильтрация СЯ для e-commerce

Вернемся к примерам:

Пример №1: тематика «Сумки»

Кол-во запросов: 6011

0

200

400

600

800

1000

1200

1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

Фильтрация СЯ для e-commerce

Вернемся к примерам:

Пример №2: тематика «Смартфоны»

Кол-во запросов: 3124

0

100

200

300

400

500

600

1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

Фильтрация СЯ для e-commerceКак использовать полученные данные?

Вариант №1 – отсев не целевых запросов:

• Включать в свою семантику только целевые запросы, сзаданным порогом «магазинности», например >0.3.

• Запросы с «магазинностью» <0.3 либо исключать изсемантического ядра, либо создавать под нихинформационные страницы.

• Не тратить деньги на ссылки для продвижения запросов, покоторым Яндекс не ранжирует магазины, а включать по

ним Яндекс.Директ.

Фильтрация СЯ для e-commerceКак использовать полученные данные?

Вариант №2 – подготовка текстов:

• Смотрим не весь топ, а только сайты интернет-магазинов;

• Определяемся, нужны ли вообще тексты для продвижениепо данному запросу;

• Если тексты нужны, то определяемся с объемом (среднеезначение, или медиана);

• Сеошные заморочки: количество вхождений, плотностьключевых слов и т.д.;

• Наличие «характерных» слов, которые есть в текстахконкурентов;

Фильтрация СЯ для e-commerceКакие могут быть проблемы?

• Полнота. Далеко не все параметры оценкипокрываются приведенными регулярками.Необходимо выполнять проверки результатов ипериодически улучать регулярные выражения.

• Точность. Вероятно возможны «ложныесрабатывания» регулярных выражений.

• Апдейты Яндекса. Никто не застрахован от того,что в очередной АП по «магазинному» запросувесь топ займут информационные документы.

Спасибо за внимание!

Игорь Бакалов

Подписывайтесь на мой блог:

http://bakalov.info/И добавляйтесь в соц сетях:

https://www.facebook.com/bakalov.igorhttps://twitter.com/Bakalov_Igor

top related