Тема: Ошибки URL
В Search Console Google обнаружил ошибки на страницы которые я не создавал.
Это страницы демо данных при знакомстве с CMS-кой?
Ещё новые неизвестные мне данные
Сайт на самом деле на автомобильную тематику
Форум ReadyScript Вопросы по работе с системой Ошибки URL
Страницы 1
Чтобы отправить ответ, вы должны войти или зарегистрироваться
В Search Console Google обнаружил ошибки на страницы которые я не создавал.
Это страницы демо данных при знакомстве с CMS-кой?
Ещё новые неизвестные мне данные
Сайт на самом деле на автомобильную тематику
А что происходит при переходе на эти адреса? Там если не ошибаюсь можно посмотреть на какой странице Google нашел эти ссылки. Может быть они у Вас где-то в тексте есть, на одной из страниц сайта? Может у Вас вирус на аккаунте хостинга, который подписывает эти ссылки. Попытайтесь через сторонние сервисы найти все внешние ссылки.
У нас таких URL'ов в системе нет.
Демо данные не добавляют таких URL'ов.
А что происходит при переходе на эти адреса?
Может у Вас вирус на аккаунте хостинга, который подписывает эти ссылки.
Не первый сайт от этого хостера, ранее такое не наблюдалось.
Я до выбора вашей CMS тестил другу CMS-ку.
Возможно это кэш страниц и данных прошлой cms-ки.
P.S.: Странно cms-ка другая уже а количество ошибок в поиске растёт. Уже 23 страницы не найдено.
Вам надо наверное в инструментах веб-мастеров для гугла и яндекса добавить данные страницы для удаления. Там есть соответствующий раздел у обоих.
У меня в индексе появились вот такие страницы
/catalog/termoregulyatory/?pf%5B375%5D%5B%5D=115
Их надо удалять? это же в принципе дубль /catalog/termoregulyatory/?pf[375][]=115
Раньше с раскодированными URL не сталкивался просто.
также появились непонятные страницы
/?action=buy_now&BUYproducts_id=2028
/catalog/termoregulyatory/?filter_id=30&p=3
/catalog/infrakrasnyy-teplyy-pol/?sort=title&nsort=asc
и т.п.
RS такие не формирует
написал хостеру, жду ответа
только эти страницы еще почему-то 404 ошибку не отдают, а главную показывают.
И Яндекс.Вебмастер не хочет их удалять, т.к. :
Нет оснований для удаления. Сервер не возвращает код 404, индексирование не запрещено ни в robots.txt, ни метатегом noindex
Хостер ответил:
При обращении к URL /?action=buy_now&BUYproducts_id=2028 сайт возвращает страницу с кодом ответа 200, поэтому робот может считать ее корректно и оставить в индексе.
Вы можете либо настроить сайт так, чтобы при поступлении таких запросов возвращался другой код ответа, либо запретить роботам индексацию таких URL с помощью robots.txt:
А как почему тогда RS не возвращает ответ 404, а 200, раз такой адрес не существует? Как настроить?
А Вы сами проверяли ответ сервера когда переходите по ссылке. Просто мы всегда отвечаем 404 ответом на неизвестные страницы. У меня на сайте в веб-мастере тоже были всегда страницы которые сканировались их яндекс сам отсылал, но благо у него появилась функция в настройках - не отсылать страницы которые пользователь посетил. Вам надо наверное, чтобы на 404 странице, чтобы у Вас не отрабатывал счётчик ни гугла ни яндекса. И robots.txt внести запрет тоже.
У меня в индексе появились вот такие страницы
/catalog/termoregulyatory/?pf%5B375%5D%5B%5D=115
Их надо удалять? это же в принципе дубль /catalog/termoregulyatory/?pf[375][]=115
Это одно и тоже. Точнее в первом варианте он так и должен выглядеть. У Вас точно это дубль?
также появились непонятные страницы
/?action=buy_now&BUYproducts_id=2028
/catalog/termoregulyatory/?filter_id=30&p=3
Это Ваши страницы пробивают сторонние роботы и сканеры, а я яндекс и гугл счетчики это кушают.
Я до выбора вашей CMS тестил другу CMS-ку.
Возможно это кэш страниц и данных прошлой cms-ки.
P.S.: Странно cms-ка другая уже а количество ошибок в поиске растёт. Уже 23 страницы не найдено.
Ничего здесь странного нет. Гугл хранит все Ваши адреса, которые попали в индекс. Потом просто очухивается, что их нет постепенно проверяет по базе изменения на них. Вам надо внести их robots.txt в запрет. Т.к. мы не генерируем страницы .html никогда
В robots.txt эти страницы сейчас закрыл.
Хотя почему эти страницы, когда на них захожу не отдают 404, мне не понятно.
Попробовал и оказалось, что если после /catalog/termoregulyatory/? писать любую арракадабру, 404 ошибка не вылезает.
То ли у меня что-то не так настроено у сервера, или в админке RS.
Если набрать /catalog/termoregulyatory/?55626рисмаимпи262 то показывает страницу /catalog/termoregulyatory/
А если без знака вопроса /catalog/termoregulyatory/55626рисмаимпи262 то 404-ошибку (как и должно быть).
В скрипт нельзя запретить передачу параметров, это перебор, параметры используются для различных целей. Кто-то UTM метки ставит, кто-то кастомный модуль пишет и ожидает определенные параметры, некоторые параметры используются для технических целей и т.д.
Не обращайте на это внимание, это ни на что не влияет. Если на вашем домене до этого был другой сайт, поисковик со временем то, что нужно выкинет автоматически, здесь ничего делать не надо, нужно просто ждать.
Страницы 1
Чтобы отправить ответ, вы должны войти или зарегистрироваться
Форум ReadyScript Вопросы по работе с системой Ошибки URL