/webmasters/community?hl=ru
/webmasters/community?hl=ru
10.07.2014
Автор первой записи
Андрей Липатцев (Google)

Видеовстреча: приёмный час сотрудников команды качества поиска - 10 июля, 19:00 по московскому времени

Привет!

10-го июля в 19:00 по московскому времени мы проведём видеовстречу, посвящённую ответам на Ваши вопросы о взаимодействии поисковой системы Google с вашими сайтами. Вопросы можно задавать по этому адресу (где идёт и голосование по вопросам), прямо в этой ветке или на Google+.

Чтобы принять участие в видеовстрече, примите приглашение на мероприятие, опубликованное на странице Google Россия в Google+. За несколько минут до 19:00 видеовстреча начнётся и вы сможете присоединиться к ней или смотреть (и задавать вопросы!) в прямом эфире. Непосредственно во встрече смогут принять участие 9 человек, но для остальных она будет доступна в прямом эфире и в записи.

С нетерпением ждём вас!
Мария, Андрей и команда форума для веб-мастеров
Контент в сообществе может быть не проверен или не актуален. Подробнее…
Все ответы (10)
Игорь Бакалов
10.07.2014
Игорь Бакалов
Добрый вечер. Спасибо за возможность задать вопросы, вот только зачем так сильно урезать размер поля для вопроса? Чтобы уложиться в 250 знаков приходится сильно сокращать, в результате заметно возрастает вероятность быть не верно понятым. Сделайте хотя бы 350-500 знаков. Спасибо
Игорь Бакалов
12.07.2014
Игорь Бакалов

10 июля прошла встреча с вебмастерами. Я задал 2 вопроса, но из-за ограничения на длину вопроса в 250 знаков – пришлось сильно сокращать вопросы и как следовало ожидать ответы вышли «не совсем про то». С вашего позволения продублирую, немного уточнив.

Вопрос №1: как получить список всех страниц, которые находятся в индексе Google? В GWT в разделе «Статус индексирования» пишет, что в индексе 331 стр.

В выдаче по «site:mydomain.ru» на первой странице результатов поиска пишет, что «Результатов: примерно 268», если перейти на последнюю страницу, то пишет, что «Результатов: 117». Если нажать на «Показать скрытые результаты» (тот самый GET параметр &filter=0, которого по вашим словам нет) получаем, что «Результатов: 118».

Если собрать все страницы на сайт и проверить их через запросы вида info:mydomain.ru/page1.html, то получаем, что в индексе 290 страниц.

Как получить список всех остальных страниц в индексе Google? По поводу вашего ответа на встрече – мне не суть, почему та, или иная страница не ищется по запросу «info:mydomain.ru/page1.html», я просто хочу узнать, какие именно страницы находятся в индексе. Как это можно сделать?

Вопрос №2: Официально Google заявлял, что Supplemental index был отменен в 2007 г. Однако определенный хинт, который якобы показывает страницы в основном и дополнительном индексе Google. В качестве примера запрос «site:бакалова.рф», Google сообщает, что найдено 28 результатов. По запросу «site:бакалова.рф/&» мы получаем только 18 результатов. По второму запросу в выдаче например нет страниц: http://xn--80aaabh0ciy.xn--p1ai/cvadebnyj-makiyazh-dlya-mariny/ и http://xn--80aaabh0ciy.xn--p1ai/sotrudnichestvo-so-studiej-vualya/ ну и ряда других страниц. Что показывает «оператор &»? Почему разнятся результаты? 

14.07.2014
Автор первой записи
Андрей Липатцев (Google)
Спасибо за дополнительные вопросы, Игорь!

Как получить список всех остальных страниц в индексе Google? По поводу вашего ответа на встрече – мне не суть, почему та, или иная страница не ищется по запросу «info:mydomain.ru/page1.html», я просто хочу узнать, какие именно страницы находятся в индексе. Как это можно сделать?

На данный момент такого инструмента мы не предоставляем. Однако, задам встречный вопрос, если Вам не интересно, почему та или иная страница не в индексе, то зачем Вам эта информация?

 Что показывает «оператор &»? Почему разнятся результаты? 

Ничего не показывает. Это просто "артефакт" оператора site:. В данный момент он не несёт абсолютно никакой полезной информации, на основе которой можно было бы что-то анализировать или делать какие-то выводы.
pyramida
14.07.2014
pyramida


понедельник, 14 июля 2014 г., 20:01:09 UTC+6 пользователь Андрей Липатцев (Google) написал:
Однако, задам встречный вопрос, если Вам не интересно, почему та или иная страница не в индексе, то зачем Вам эта информация?
Что-бы узнать, сколько какашек, навыдавала CMS сайта в индекс :)

Игорь Бакалов
15.07.2014
Игорь Бакалов
Андрей, спасибо за ответ. Когда я писал, что "мне не суть, почему та, или иная страница не ищется по запросу" имелось ввиду в рамках данного вопроса. Не индексировать тот, или иной документ Google может по разным причинам, но мне гораздо интереснее понять что за скрытые документы вами были проиндексированы. Если я собрав все страницы своего сайта обнаружил через оператор info, что в индексе 290 страниц, а GWT мне сообщает, что страниц в индексе 331, то лично у меня возникает резонный вопрос, что это за 40 страниц, о которых я не знаю, но знает Google. Сразу замечу, что ситуация не связана с запросами на удаление контента, т.к. тип сайта этого не подразумевает, а сама ситуация длится уже длительно время. И возникают вопросы - может это дорвей, или что еще хуже - служебная информация, которая не должна быть доступна в поиске. Казусы могут быть разные, сами понимаете. Планируете ли вы дать возможность вебмастерам получать список всех проиндесированных страниц, а не просто число, как сейчас?


Игорь Бакалов
21.07.2014
Игорь Бакалов
Up. Хотелось бы всё же получить ответ...
30.07.2014
Автор первой записи
Андрей Липатцев (Google)
И возникают вопросы - может это дорвей, или что еще хуже - служебная информация, которая не должна быть доступна в поиске.
...
Планируете ли вы дать возможность вебмастерам получать список всех проиндесированных страниц, а не просто число, как сейчас?

Нет, Игорь, таких планов пока нет. Без конкретного сайта судить сложно, но могу предположить, что речь идёт не о служебной информации, а о дубликатах страниц, которые оказались проиндексированы. Это происходит чаще, чем можно было бы предполагать.
Игорь Бакалов
05.08.2014
Игорь Бакалов

Андрей, Вы уж простите за настойчивость, но можно по пунктам подвести итог беседы по общим вопросам? В частности:

1) Был ли действительно отменен Supplemental index был отменен в 2007?

2) Если Supplemental index действительно сейчас нет, то что из себя представляют «скрытые результаты»? Поясню. Когда ищешь что-то в Google часто появляется сообщение: «Мы скрыли некоторые результаты, которые очень похожи на уже представленные выше (ХХХ). Показать скрытые результаты.». Многие вебмастера считают, что эти самые скрытые результаты и есть тот самый «дополнительные индекс».

3) Чем грозит, когда страница находится в этих скрытых результатах? Плохо ли если у сайта много таких страниц? Может ли страница быть в скрытых результатах по одному запросу и в обычных по другому?

 

Частный вопрос про индексацию.

Вы несколько раз просили добавить конкретики, извольте. Специально взял небольшой сайт: бакалова.рф, чтобы было проще выполнить проверку.

Итак

1) На сайте уже несколько месяцев не добавлялся новый контент, так что задержки с индексацией очевидно нет.

2) Согласно GWT всего проиндексировано 46 страниц, это число не менялось с 04.05.2014.

3) При помощи нескольких парсеров я собрал все страницы сайта и удалил дубли. Был учтен момент, что в поиске Google могут отображаться страницы закрытые в robots.txt, поэтому при сборе страниц запреты игнорировались. В результате было получено 77 страниц с кодом ответа сервера 200ОК. Проверив их при помощи запроса info я получил, что в индексе находится 43 страницы, хотя GWT сообщает о 46 + заодно пробил через оператор «site:». Вот тут выгрузка: yadi.sk/i/ja1b5do6Z8iky

Андрей, можете мне показать оставшиеся 3 страницы?

В заключении пожелание, чтобы вы всё же добавили отображение страниц в индексе, т.к. от простого числа толку нет. Если проблема с мощностями, можно отображать допустим первые 10 000 страниц, или если совсем беда, то первые 1000. Польза я думаю очевидна.

pyramida
06.08.2014
pyramida
суплементал выдача с блога. На первые три вопроса, отвечает?

Насчет пожелания. Вообщето писали, что в поиске учавствуют максимум 1000 результатов.(смотреть интервью можно на серче в статьях).

26.08.2014
Автор первой записи
Андрей Липатцев (Google)
Спасибо за вопросы, Игорь, и не надо извиняться. Я рад разумному диалогу :)

1) У меня нет информации о 2007-м году, но я могу вам подтвердить, что сейчас такого понятия как "Supplemental index" нет

2) Скрытые результаты это ровно то, что написано в сообщении: "результаты, которые очень похожи на уже представленные выше". Если Вы перейдёте по ссылке в этом сообщении и откроете несколько таких "похожих", сразу становится понятно, о чём речь. Это страницы, отличия в контенте которых от представленных ранее по данному запросу не представляют для среднего пользователя значительного интереса. По другому запросу, для другого пользователя они могут представлять интерес.

3) Ничем не "грозит". Слово "плохо" я вообще не очень люблю в контексте общения с веб-мастерами. Да, я думаю, что "плохо", потому что это лишняя нагрузка на сервер, нарушение элегантной структуры сайта и вообще неопрятно, но это не фактор, из-за которого сайт попадёт в какой-то "чёрный список". Такого списка в этом контексте нет. 
Да, страница может быть скрыта по одному запросу и показана по другому в теории. Хотя, на практике это, наверное, будет какой-то очень неестественный запрос. Впрочем, вдаваться в эту гипотетику непродуктивно.

3 страницы я тоже не нашёл :) Нашёл одну, которой нет в Вашем списке: http://xn--80aaabh0ciy.xn--p1ai/wp-includes/js/jquery/jquery.js?ver=1.10.2 Дальше копал бы в этом направлении. Но, откровенно говоря, дальше я вообще бы не копал, потому что это очень непродуктивная трата Вашего времени.

Ваше заключительное пожелание я полностью разделяю, и вы не первый, кто его высказывает. Со своей стороны могу сказать, что наши инженерные команды знают об этом запросе и ищут возможность адекватно приоритизировать его в свете текущих задач.

Спасибо за внимание к нашей работе и надеюсь видеть Вас на наших встречах и в будущем. Ближайшая - в этот четверг.
Эти ответы были полезны?
Помогите нам улучшить их.
 
Вопрос заблокирован. Ответить на него невозможно. Остались вопросы? Обратитесь на справочный форум.

Значки

Некоторые участники могут получать значки, которые отражают, в каком качестве и насколько активно они вносят вклад в работу сообщества.

 
Сотрудник Google – наш специалист по какому-либо продукту или Менеджер сообщества.
 
Эксперт сообщества – сторонний специалист, который следит за качеством контента в сообществе.
 
Платиновый эксперт по продуктам – участник сообщества, который обладает глубоким знанием продукта Google и помогает другим пользователям и экспертам.
 
Золотой эксперт по продуктам – участник сообщества, который отлично разбирается в особенностях продукта Google и отвечает на вопросы пользователей.
 
Серебряный эксперт по продуктам – участник сообщества, который достаточно хорошо знаком с продуктом Google и отвечает на вопросы пользователей.
 
Почетный эксперт по продуктам – знаток наших сервисов, который больше не принимает участия в жизни сообщества.
Контент в сообществе может быть не проверен или не актуален. Подробнее…

Уровни

Уровень участника отражает его активность на форумах: чем активнее пользователь, тем выше его уровень. Каждый участник изначально находится на уровне 1 и может подняться до уровня 10. Вот какие достижения помогают увеличивать уровень:

  • вы ответили на вопрос;
  • ваш ответ признан лучшим;
  • пользователь отметил, что ему помогло ваше сообщение;
  • вы оценили сообщение другого участника как полезное или бесполезное;
  • вы обоснованно пожаловались на тему или сообщение.

Если ваше сообщение было удалено в связи с жалобами других пользователей, ваш уровень будет повышаться медленнее.

Вы хотите просмотреть профиль участника?

Это страница справки. Просматривать профили участников форума на ней нельзя.

Вы хотите пожаловаться на комментарий?

Этот комментарий размещен на форуме по продукту Google. А это страница справки, здесь нельзя подать жалобу.

Вы хотите ответить на комментарий?

Этот комментарий размещен на форуме по продукту Google. А это страница справки, здесь нельзя переписываться с пользователями.

false
Поиск
Удалить поисковый запрос
Закрыть поиск
Приложения Google
Главное меню
Поиск по Справочному центру
true
83844
false