1 Отредактировано Иван (03.05.2015 22:07:29)

Тема: Дублирование с ЧПУ

Здравствуйте. Прошу помочь разобраться - генерируется масса дублей.

- У блога, адрес вида text-blog. А есть еще /text-4/ 0,1,2,3 и т.д. - это одна и та же страница!

- На каждый товар дублируется покупка в один клик, резервация и добавление в корзину, например:
/oneclick/4015/?offer_id=0
/reservation/?product_id=4015
/cart/?add=10

- И сам товар: /product/16/ и например /product/pozdravlyayu-1/
Посмотрел сайты, страницы товаров с чпу выдаю 404 ошибку  номером товара - возможно у нас что-то в настройках. К тому же при редактировании товара, чпу появляется автоматически хотя его не ставили (скриншот http://joxi.ru/LmGVnVXsLjJ7rl).

И страницы контактов, имеют такой вид /text-0/kontakty - как сделать страницы как у вас, например http://readyscript.ru/about/?

Еще вопрос по валидности. У движка есть невалидный CSS от движка?

Повысить оценку Понизить оценку

2

Re: Дублирование с ЧПУ

- Уточните, пожалуйста, чем вам мешает техническая возможность открытия страницы по двум урлам.
Дубляжей в поисковиках это не создает, так как в публичной части все урлы одного вида.
Например: только /text-blog/, если задан алиас. А алиас должен быть задан.

У нас для примера все страницы форума доступны по урлам:

http://forum.readyscript.ru/forum/1/voprosy-po-rabote-s-sistemoi/
а также forum.readyscript.ru/forum/1/

При этом в поисковиках нет ни одного проидексированного урла forum.readyscript.ru/forum/1/,
просто потому, что на этот урл нет ссылок.


- Если вы хотите исключить какие-то адреса из индексации, то добавьте в robots.txt
(можно прямо из админ. панели из раздела Управление->Сайты):

User-agent: *
Disallow: /oneclick/
Disallow: /reservation/
Disallow: /cart/

Google и Яндекс официально поддерживают robots.txt.

- У вас случайно ЧПУ имя не цифрами задано? (ЧПУ должен содержать хотя бы одну букву)

- Подавляющему большинству ЧПУ нужно у всех товаров. У нас есть инструменты для удобного автоматического проставления ЧПУ сразу всем товарам. В разделе Веб-сайт->Настройка модулей->Каталог товаров. Справа ссылка "Добавить ЧПУ имена товарам и категориям". Дополнительно, автогенерация ЧПУ есть в форме редактирования товара при потере фокуса у поля название. Вы можете стереть сгенерированное ЧПУ, если оно вам не нужно.

- Чтобы добавить страницу с адресом /kontakty/, нужно воспользоваться разделом Веб-сайт->Меню.

- По валидности, нужны более детальные сведения.
В каком CSS файле? Какие конкретно ошибки или предупреждения? Если там какой-нибудь warning на CSS-хак, то это не требует внимания. Если что-то посерьезнее, то нужно разобраться. Валидность - это хорошо, но кроссбраузерность и качество отображения страницы в большем числе браузеров - важнее, а как вы понимаете не всегда эти вещи совместимы.

Повысить оценку Понизить оценку

3 Отредактировано Иван (16.04.2015 17:57:03)

Re: Дублирование с ЧПУ

admin пишет:

- Уточните, пожалуйста, чем вам мешает техническая возможность открытия страницы по двум урлам.
Дубляжей в поисковиках это не создает, так как в публичной части все урлы одного вида.
Например: только /text-blog/, если задан алиас. А алиас должен быть задан.

У нас для примера все страницы форума доступны по урлам:

http://forum.readyscript.ru/forum/1/voprosy-po-rabote-s-sistemoi/
а также forum.readyscript.ru/forum/1/

При этом в поисковиках нет ни одного проидексированного урла forum.readyscript.ru/forum/1/,
просто потому, что на этот урл нет ссылок.


- Если вы хотите исключить какие-то адреса из индексации, то добавьте в robots.txt
(можно прямо из админ. панели из раздела Управление->Сайты):

User-agent: *
Disallow: /oneclick/
Disallow: /reservation/
Disallow: /cart/

Google и Яндекс официально поддерживают robots.txt.

- У вас случайно ЧПУ имя не цифрами задано? (ЧПУ должен содержать хотя бы одну букву)

- Подавляющему большинству ЧПУ нужно у всех товаров. У нас есть инструменты для удобного автоматического проставления ЧПУ сразу всем товарам. В разделе Веб-сайт->Настройка модулей->Каталог товаров. Справа ссылка "Добавить ЧПУ имена товарам и категориям". Дополнительно, автогенерация ЧПУ есть в форме редактирования товара при потере фокуса у поля название. Вы можете стереть сгенерированное ЧПУ, если оно вам не нужно.

- Чтобы добавить страницу с адресом /kontakty/, нужно воспользоваться разделом Веб-сайт->Меню.

- По валидности, нужны более детальные сведения.
В каком CSS файле? Какие конкретно ошибки или предупреждения? Если там какой-нибудь warning на CSS-хак, то это не требует внимания. Если что-то посерьезнее, то нужно разобраться. Валидность - это хорошо, но кроссбраузерность и качество отображения страницы в большем числе браузеров - важнее, а как вы понимаете не всегда эти вещи совместимы.

1. Дубль - это когда контент дублируется по разным адреса. Я знаю что программистам они не мешает и их могут быть миллионы - лишь бы было визуально нормально, но у Гугл и Яндекс другое мнение. Вот страницы в индексе одного из сайтов указанный у вас в портфолио https://www.google.ru/webhp?sourceid=ch … id%3D4015.
Тоже самое с капчей и покупкой в один клик.
2. robots.txt - не исключите вы страницы таким образом, это только для Яндекса. То что указано в инструкции поисковиков, половину не работает. Вот вам пример - страница также участвует в поиске - http://joxi.ru/L21LGLnfgzvgmX... Вообще роботы ходят по таким ненужным страницам - масса экспериментов.
3. "Добавить ЧПУ имена товарам и категориям" - сделали и получилось что карточка товара с чпу и с цифрами (как сейчас на сайте). Поэтому ЧПУ пришлось убрать. Может проблема в том что мы изначально переносили товар с другого движка?
4. Ок, спасибо.
5. CSS - не знаю что там было, уже убрали.

Повысить оценку Понизить оценку

4

Re: Дублирование с ЧПУ

По вопросу о дубляжах. Ну какой же это дубль, если о нем никто не знает? Дубль - это скорее проиндексированный одинаковый контент по разным урлам. Все-таки не ясно как в поисковик может попадать url, на который нигде ссылок и на который никто не заходит (т.е. метрика тоже о нем не знает).

Авторы сайта beatsound (наши партнеры) не задавали правила в robots.txt, поэтому у них и проиндексированы ссылки на резервацию, купить в 1 клик, капчу.

Вы можете использовать в шаблонах в ссылках, которые открываются в диалоге вместо href, data-href, в случае Формы заказать и купить в 1 клик. Наш JS подхватит такие ссылки, а для поисковиков они будут незаметны.

<a data-href="ссылка" class="inDialog">Заказать</a>

По вопросу 404 ошибки. напишите, пожалуйста, в поддержку ссылку на этот товар, и доступ в админ. панель, мы посмотрим более детально и напишем, в чем проблема.

Повысить оценку Понизить оценку

5

Re: Дублирование с ЧПУ

admin пишет:

По вопросу о дубляжах. Ну какой же это дубль, если о нем никто не знает? Дубль - это скорее проиндексированный одинаковый контент по разным урлам. Все-таки не ясно как в поисковик может попадать url, на который нигде ссылок и на который никто не заходит (т.е. метрика тоже о нем не знает).

Авторы сайта beatsound (наши партнеры) не задавали правила в robots.txt, поэтому у них и проиндексированы ссылки на резервацию, купить в 1 клик, капчу.

Вы можете использовать в шаблонах в ссылках, которые открываются в диалоге вместо href, data-href, в случае Формы заказать и купить в 1 клик. Наш JS подхватит такие ссылки, а для поисковиков они будут незаметны.

<a data-href="ссылка" class="inDialog">Заказать</a>

По вопросу 404 ошибки. напишите, пожалуйста, в поддержку ссылку на этот товар, и доступ в админ. панель, мы посмотрим более детально и напишем, в чем проблема.

Смотрите как, если урлу дописать что-то и страница при этом будет открываться. то поисковики не видят таких страниц. Но в идеале должно отдавать 404 (правильней 410). А еще лучше как у DLE - id + чпу и при не правильном обращении 301 редирект на правильный адрес. Вот пример http://ow5.ru/90-vybor-naushnikov-дописал-слово.html - средиректит на http://ow5.ru/90-vybor-naushnikov.html.
В нашем случае, совсем другое - это существующие страниц и поисковик их видит, я дал пример с beatsound.

<a data-href="ссылка" class="inDialog">Заказать</a>

- дал программисту на рассмотрение.

В поддержу напишу, спасибо.

Повысить оценку Понизить оценку

6

Re: Дублирование с ЧПУ

на beatsound - все понятно. Там пример про /reservation/, /oneclick/ - это понятно это обычные ссылки, которые попали естественным образом в поисковый индекс. Здесь нет никакого таинства или бага.

Все-таки на мобильных устройствах это отдельные страницы, да и PC их можно всегда открыть в новом окне, поэтому и присутствуют в поиске.

Не ясно как в поисковик может попасть url /text-4/ если все ссылки на сайте всегда были /text-blog/
(не берем ситуацию, когда у категории намеренно полгода был не задан alias, а потом он появился, т.е. оба урла долгое время светились)

Повысить оценку Понизить оценку

7 Отредактировано Иван (16.04.2015 21:09:43)

Re: Дублирование с ЧПУ

Что странно, теперь страница блога открывается только по адресу _extrabuket.ru/text-4/, пробую другие цифры - открывается не понятная страница, а раньше также открывался блог.

В индекс попадет - ксену их видит http://joxi.ru/DmBXZXWhQpVaAP

Не попадут /cart/?add=номер товара - редиректит в корзину.

Повысить оценку Понизить оценку

8 Отредактировано Иван (17.04.2015 01:59:21)

Re: Дублирование с ЧПУ

Разобрался с чпу блога.

Если не прописывать псевдоним (Ан.яз) в настройках, то блог будет доступен по адресу /text-4/, соответственно у меня указан псевдоним blog и поэтому он доступен по адресу /text-blog/

Что мне не понятно, на вашем сайте - /blog/, да еще и с метатегами...

Повысить оценку Понизить оценку

9

Re: Дублирование с ЧПУ

У нас все маршруты могут быть подкорректированы из сторонних модулей.
На нашем сайте мы используем эту возможность и перегружаем стандартный маршрут просмотра списка статей.

        $routes[] = new \RS\Router\Route('article-front-previewlist', array(
            '/blog/'
        ), array('category' => 'blog'), t('Список новостей/статей'));   

материал о перегрузке маршрутов есть здесь: http://readyscript.ru/text-blog/Kak-pra … adyScript/

Повысить оценку Понизить оценку

10 Отредактировано Иван (20.04.2015 15:10:46)

Re: Дублирование с ЧПУ

Спасибо, рассмотрим этот вариант. Оказывается, еще и категории дублируются. И кстати, не смотря на то что сайт  закрыт в роботс.тхт - уже в гугл индексе 170 страниц.

Повысить оценку Понизить оценку