Сергей Лысенко, Текстовое ранжирование. Взгляд в...

39
Текстовое ранжирование. Ретроспектива. Сергей Лысенко, руководитель отдела аналитики Webcom Group

Upload: optimization-conference

Post on 25-Jan-2017

38 views

Category:

Marketing


2 download

TRANSCRIPT

Page 1: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Текстовое ранжирование. Ретроспектива.Сергей Лысенко, руководитель отдела аналитики Webcom Group

Page 2: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Текстовое ранжирование

Все сразу! Серебренной пули НЕТ!

Page 3: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Контент король!

Page 4: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

UserКороль умер! Да здравствует король!

Page 5: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Релевантный/полезный

Уникальный/Оригинальный

Вопрос первый

Page 6: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

….2. Оценка по шкале релевантностиШкала релевантности содержит семь оценок: "Витальны", "Полезный", "Релевантный+", "Релевантный-", "Нерелевантный", "Спам", "Не про то".…2.2. Полезный ресурс не только отвечает на запрос, но кроме этого дает пользователю дополнительную информацию по его запросу. Также оценку "Полезный" заслуживают тематические сайты, с большим количеством информации по интересующей теме, а еще поддомены витального сайта, сайты филиалов искомой фирмы или факультетов искомого вуза.2.3. Релевантный+ - документ отвечает на запрос пользователя.…

https://yandex.ru/blog/yasubbotnik/388

Инструкция асессора Яндекс

Page 7: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

….4.0 High Quality PagesHigh quality pages are satisfying and achieve their purpose well. ... A High quality page may have the following characteristics:• High level of Expertise, Authoritativeness, and Trustworthiness (E-A-T) • A satisfying amount of high quality MC.• Satisfying website information and/or information about who is responsible for the website or satisfying customer service information, if the page is primarily for shopping or includes financial transactions.• Positive website reputation for a website that is responsible for the MC on the page.…

https://static.googleusercontent.com/media/www.google.com/en//insidesearch/howsearchworks/assets/searchqualityevaluatorguidelines.pdf

Инструкция асессора Google

Page 8: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Полезность ?!?

http://www.slideshare.net/Webcom-media/2016-61461866

Page 9: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

{В настоящее время | Сегодня | Сейчас} { многие | практически все | подавляющее большинство} {понимают | осознают | чувствуют} {необходимость | неизбежность | неотвратимость} {изменения | корректировки | уточнения} {курса | направления | вектора} {развития | движения | роста}.

В настоящее время подавляющее большинство понимают неизбежность уточнения курса движения.

Сегодня многие чувствуют необходимость изменения направления развития.

Сейчас практически все осознают неотвратимость корректировки вектора роста.

Уникальность?!?

Page 10: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Уникализация по SEO-шному

Page 11: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

И в результате, получаем:

Page 12: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Выводы из проблемы первой:

Нет уникального, и нет неуникального!Нет естественного, и нет seo-шного!Есть только полезное, и бесполезное!

Page 13: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Пользователь

Вопрос второй

Page 14: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

CTR=0% 98,3%

Слова в ТОПе, а кликов нет

0%<CTR<1% 92,1%1%<CTR<2% 83,0%*На основании анализа 5762 запросовпо всем регионам России

Page 15: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Как это делается?

http://www.slideshare.net/yandex/ss-26776032https://events.yandex.ru/lib/talks/1144/

Анализ неявных предпочтений пользователейМихаил Агеев, Яндекс

Page 16: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Что может помочь

http://www.slideshare.net/yandex/ss-26776032https://events.yandex.ru/lib/talks/1144/

Анализ неявных предпочтений пользователейМихаил Агеев, Яндекс

Page 17: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Что может помочь

http://www.slideshare.net/yandex/ss-26776032https://events.yandex.ru/lib/talks/1144/

Анализ неявных предпочтений пользователейМихаил Агеев, Яндекс

Page 18: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Низкий CTR? Высокий % отказов?

Page 19: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Session-based Query Performance Predictionhttps://research.yandex.ru/lib/researches/50/

Through-the-Looking Glass: Utilizing Rich Post-Search Trail Statistics for Web Search 2013https://research.yandex.ru/lib/researches/75/

Click Model-Based Information Retrieval Metrics 2013https://research.yandex.ru/lib/researches/59/

Любознательным и пытливым

Page 20: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Информационные запросы для продвижения коммерческих

http://www.slideshare.net/yandex/ss-26755584https://events.yandex.ru/lib/talks/1145/

Анализ поведения пользователей и персонализация поисковой выдачи, Юрий Устиновский, Яндекс

Page 21: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Проверка гипотезы

Проблемы стоящие при проверке:- отложенная транзакция;-оценка персонализированной выдачи.

Но:- общий трафик на сайт рос;- трафик по коммерческим запросам рос;- конверсия на сайте росла – клиент был доволен.

Page 22: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Текст

Вопрос третий, четвертый и т.д.

Page 23: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

https://events.yandex.ru/lib/talks/52/

Копирайтер: достаточно лишь употребить

Информационный поиск изнутри Д. Расковалов осень 2011

http://romip.ru/romip2004/07_yandex.pdf

Page 24: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Какие еще есть факторы?

http://www.slideshare.net/yandex/ss-26776032https://events.yandex.ru/lib/talks/1144/

Анализ неявных предпочтений пользователейМихаил Агеев, Яндекс

Page 25: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Встречаемость слов в документе Учитывается наличие слова в первом предложении, во втором предложении, внутри выделяющих html тегов Пара учитывается, когда слова запроса встречаются в тексте подряд (+1), через слово (+0.5) или в обратном порядке (+0.5). Плюс еще специальный случай, когда слова, идущие в запросе через одно, в тексте встречаются подряд (+0.1).

р1 и р2 здесь – р для первого и второго слова пары из слагаемого . TF – количество вхождений пары в текст с учетом весов вхождений. За наличие всех слов запроса дополнительный «бонус»

Если в документе присутствуют не все слова, то за каждое отсутствующее слово домножается на коэффициэнт 0.03 где Nmiss – количество отсутствующих в документе слов запроса.

Слишком много

http://romip.ru/romip2006/03_yandex.pdf

Page 26: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

1. Классификация строится по каждой теме независимо друг от друга.2. Тему документа можно определить по списку встреченных слов (bag of words).3. Для каждой темы есть слова, характерные для темы, и слова, которые в теме не встречаются.4. Множество характерных для темы слов можно разбить на 2 части:

a. Характеристические слова – множество слов, без которых невозможно раскрыть тему. Если в документе нет ни одного слова из этого множества, то документ к теме не относится.b. Остальные слова, характерные для темы. Нельзя определить только по наличию или отсутствию этих слов в документе, в теме документ или нет.

Для каждой темы собирается статистика:сколько раз слово встретилось в теме w N и не в теме w N , а также сколько всего слов во всех документах в теме tot и не в теме .

- вероятность встретить данное слово.- вероятность того, что в тесте длиной L есть данное слово для документов, которые относятся к заданной теме.

– вес слова, логарифм вероятности того, что документ относится к заданной теме, при условии, что в документе длиной L встретилось данное слово

Точно так же считается w PL – вероятность того, что в тесте длиной L есть данное слово для документов, которые не относятся к заданной теме.

Не о том

http://rcdl.ru/doc/2008/230_235_paper27.pdf

Page 27: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

GA: Канал Yandex/Organic

Page 28: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

О чем предложение

http://cl.iitp.ru/ru/etap3

Русский - это язык с базовым порядком SVO (субъект-действие-объект)

Page 29: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

http://textexture.com/index.php?text_id=88898

О чем текстРусский - это язык с базовым порядком SVO (субъект-действие-объект)

Page 30: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

О чем текст

http://textexture.com/index.php?text_id=88898

Page 31: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

О чем текст

http://www.analyst.ru/

Page 32: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

О чем текст

Page 33: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Немного изменим текст

Page 34: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Немного изменим текст

Page 35: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Реферирование текста

Page 36: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Важный момент

Русский язык не изменился!!!

Page 37: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Капитан Очевидность

1. Ключевой фразы должно быть столько, сколько нужно.

2. Использование терминов повышает качество текста и позиции

3. Расширенное семядро улучшает ПФ и позиции естественным способом

4. Монотематичный текст лучше политематичного.

5. Текст должен быть про ключевую фразу

✔✔

✔✔

Page 38: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

Пожелание

Page 39: Сергей Лысенко, Текстовое ранжирование. Взгляд в прошлое через призму настоящего, Optimization 2016

СПАСИБО ЗА ВНИМАНИЕ!

Сергей ЛысенкоРуководитель отдела аналитики Webcom Group

ДЕНЬ ОТКРЫТЫХ ДВЕРЕЙ

КОНТАКТНЫЕ ДАННЫЕ+ 7 (495) [email protected] www.webcom-media.rufacebook.com/WebcomMedia

ФОТО