Место для ваших идей

Оставляйте пожелания по работе Вебмастера

Обход ЯВМ реагирует 404-ссобщением в зависимости от регистра в URL

Avatar
  • обновлен

Разберитесь с регулированием ошибочных 404-сообщений в разделе "История обхода". Суть: если в названии папок и файлов структуры сайта присутствуют прописные (заглавные, в верхнем регистре) буквы, то в списках "Истории обхода" на главной странице ЯВМ они выглядят как строчные (маленькие, в нижнем регистре) и в результате выдают сообщение 404. Это давняя ошибка в самой CMS 1С-Битрикс. Тамошние горе-специалисты много лет не могут её осознать. Если в строке браузера совершать прямое обращение к некоему  файлу сайта (например, PDF), то выявляется проблема при несоблюдении точного регистра всех символов УРЛа - сообщение 404. Если регистр символов правильный, как и в адресации/навигации на самом сайте, то файл открывается и загружается в браузер нормально. Но и на стороне ЯВМ также совершается ошибка - вторая ошибка: в базы ЯВМ почему-то УРЛ сайта поступает без сохранения регистра - все символы УРЛа в ЯВМ строчные. В результате и в диагностике ЯВМ тоже выдаётся сообщение 404. Хотя на самом деле файл (страница) присутствует. К слову, в данной CMS есть многолетняя проблема и с наличинем/отсутствием закрывающего слэша в навигации страниц.

Вопрос: почему в базы ЯВМ УРЛы сайта поступают с "обрезанными" регистрами без сохранения того, как это сделано в точной адресации/навигации на самом сайте? В результате данная ошибка множится уже в самой ЯВМ-диагностике и может влиять на ранжирование сайта.

Ведь использование регистра при именовании страниц/файлов - это удобно, эффективно и наглядно как для владельцев/редакторов сайта, так и для его пользователей. Вы же придумали когда-то ещё давно написание и сохранение в поисковой выдаче доменного имени сайта с использованием символов обоих регистров по заявке его собственников? Ну так почему здесь много лет этот момент у вас тут до сих пор недоработан?

Сравните (только не кликом, а копированием - первый загружается, второй 404):
https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf

Avatar
Алексей Жуков
Цитата от ООО Ульяновское

Да, чудес не бывает. Бывает чья-то безалаберность или криворукость. Или то и другое вместе. Какой ещё обработчик? Вновь повторю - проблема в ЯВМ: УРЛы в индексе почему-то со строчными символами там, где должны быть прописные. В самом ЯВМ. Вследствие чего в ЯВМ эти УРЛы объявляются как 404. Но на самом деле страницы/файлы по этим УРЛам существуют. А их "отсутствие" может влиять на ранжирование. Проблемы самого Битрикса я знаю. В Битриксе так же десятилетиями не исправляются баги и ошибки. Но сейчас разговор исключительно о Яндекс.Вебмастере.

На сайте в ссылках все УРЛы такие, какие есть. И на самом сайте тоже всё открывается. Если кто-то извне ссылит на эти наши файлы некорректными УРЛами - их проблема. Пользователям на САМОМ нашем сайте пользователям предлагаются ДЕЙСТВУЮЩИЕ правильные ссылки со правильными УРЛами. И всё открывается. Это понятно? Или ещё раз специально для вас объяснить?

Чужие сайты мне совать не надо - мне до них никакого дела, их ЯВМ я НЕ ВИЖУ. И я сам знаю, что такое накрутка. И знаю про продажу ссылок. И про PR Гугла тоже. Знал ещё тогда, когда вы, молчелаэк, вероятно, ходили ещё в первый класс. Я не понимаю, какое отношение имеет регистр символа к такой накрутке. И в какой связи это. Я вообще спрашивал исключительно про ОТОБРАЖЕНИЕ УРЛов в Яндекс.Вебмастере. И про персонаж "Платон Щукин" знаю с года 2006-го. Впрочем, уже все привыкли, что в последние годы техподдержка служб Яндекса вменяемо отвечает только не менее чем с третьего раза. Сколько же времени приходится тратить на вас.

Вот вам скриншот https://disk.yandex.ru/i/qG-SQxnhIfd6jg. Отдельно отмечу феерический ужас того, что здесь нельзя даже иллюстрацию прикрепить. Для чего вообще данный технический форум? Феерический ужас. На скриншоте комментарии. И в третий раз вопрос: почему указанные символы в нижнем регистре строчными буквами и их 404?

ещё раз, страницы 

https://www.senokosilka.ru/Law/GOST_12_2_111-2020.pdf
https://www.senokosilka.ru/law/gost_12_2_111-2020.pdf

это абсолютно разные URL и то что одна из них отдаёт 404 это правильно - её нет

я вам предложил простой способ решить эту проблему самому и защитить себя от подобного в будущем, если вы не хотите это лично ваше дело


url могут в таком виде могут браться откуда угодно, но вы видимо не желаете разбираться, а желаете что бы за вас вашу работу выполнил яндекс - не выполнит

то что вы привели на скриншоте правильная работа, если указанный  url отдаёт 404, то именно это я.вебмастер вам и показывает


то что вы чего-то не понимаете это нормально, не стоит поэтому поводу злиться 

всё очень просто - внутренние системы гугла и яндекса регистронезависимые так исторически сложилось, дальше можете сами попробовать сделать выводы ;)


Avatar
ООО Ульяновское
Цитата от Платон Щукин

Здравствуйте! Спасибо, что обратили внимание на ситуацию — передал информацию техническим специалистам. Будем разбираться.

Очень надеюсь, что это не автоботная отписка.

Avatar
ООО Ульяновское
Цитата от Алексей Жуков

чудес не бывает, если у вас возникают подобные проблемы, то напишите обработчик, который проверит наличие документа с правильным регистром и выдаст 301 редирект на правильную страницу

вот сайт на битриксе и подобных проблем нет https://www.ceramtrade.ru/upload/uf/98a/2020-CATALOGO_MAYOR.pdf 

P.S. накрутка PR использовалась исключительно для продажи ссылок, сейчас это не актуально в связи с отсутствием видимого значения PR

Да, чудес не бывает. Бывает чья-то безалаберность или криворукость. Или то и другое вместе. Какой ещё обработчик? Вновь повторю - проблема в ЯВМ: УРЛы в индексе почему-то со строчными символами там, где должны быть прописные. В самом ЯВМ. Вследствие чего в ЯВМ эти УРЛы объявляются как 404. Но на самом деле страницы/файлы по этим УРЛам существуют. А их "отсутствие" может влиять на ранжирование. Проблемы самого Битрикса я знаю. В Битриксе так же десятилетиями не исправляются баги и ошибки. Но сейчас разговор исключительно о Яндекс.Вебмастере.

На сайте в ссылках все УРЛы такие, какие есть. И на самом сайте тоже всё открывается. Если кто-то извне ссылит на эти наши файлы некорректными УРЛами - их проблема. Пользователям на САМОМ нашем сайте пользователям предлагаются ДЕЙСТВУЮЩИЕ правильные ссылки со правильными УРЛами. И всё открывается. Это понятно? Или ещё раз специально для вас объяснить?

Чужие сайты мне совать не надо - мне до них никакого дела, их ЯВМ я НЕ ВИЖУ. И я сам знаю, что такое накрутка. И знаю про продажу ссылок. И про PR Гугла тоже. Знал ещё тогда, когда вы, молчелаэк, вероятно, ходили ещё в первый класс. Я не понимаю, какое отношение имеет регистр символа к такой накрутке. И в какой связи это. Я вообще спрашивал исключительно про ОТОБРАЖЕНИЕ УРЛов в Яндекс.Вебмастере. И про персонаж "Платон Щукин" знаю с года 2006-го. Впрочем, уже все привыкли, что в последние годы техподдержка служб Яндекса вменяемо отвечает только не менее чем с третьего раза. Сколько же времени приходится тратить на вас.

Вот вам скриншот https://disk.yandex.ru/i/qG-SQxnhIfd6jg. Отдельно отмечу феерический ужас того, что здесь нельзя даже иллюстрацию прикрепить. Для чего вообще данный технический форум? Феерический ужас. На скриншоте комментарии. И в третий раз вопрос: почему указанные символы в нижнем регистре строчными буквами и их 404?

Avatar
Платон Щукин

Здравствуйте! Спасибо, что обратили внимание на ситуацию — передал информацию техническим специалистам. Будем разбираться.

Avatar
Алексей Жуков
Цитата от ООО Ульяновское

Вы сам вопрос прочитали? Почему в базе ЯВМ фигурируют УРЛы сайта со строчными буквами, в то время как те же самые УРЛы сайта имеют те же самые, но уже прописные соответствующие буквы? Вопрос понятен? Или в третий раз написать?

И ежели вы считаете себя квалифицированным специалистом, то потрудитесь, пожалуйста, по поводу Гугла не умничать, - а сообщить подробности. Первый раз раз слышу про какие-то накрутки в этой связи. На сайте мы всего лишь пытаемся для наглядности и соответствующего удобства использовать заглавные буквы при написании имён папок и имён файлов - только и всего. Например, для отличия созданных для специальных задач папок сайта от папок, создаваемых самой CMS в процессе её работы. Только и всего. Это понятно? Или тоже повторить?

чудес не бывает, если у вас возникают подобные проблемы, то напишите обработчик, который проверит наличие документа с правильным регистром и выдаст 301 редирект на правильную страницу

вот сайт на битриксе и подобных проблем нет https://www.ceramtrade.ru/upload/uf/98a/2020-CATALOGO_MAYOR.pdf 

P.S. накрутка PR использовалась исключительно для продажи ссылок, сейчас это не актуально в связи с отсутствием видимого значения PR

Avatar
ООО Ульяновское
Цитата от Алексей Жуков

это ошибки на стороне вашего сервера, яндекс правильно обрабатывает разные регистры

для примера, в индекс вполне возможно добавить url с разными регистрами 

P.S. в своё время это позволяло накрутить PR в гугле

Вы сам вопрос прочитали? Почему в базе ЯВМ фигурируют УРЛы сайта со строчными буквами, в то время как те же самые УРЛы сайта имеют те же самые, но уже прописные соответствующие буквы? Вопрос понятен? Или в третий раз написать?

И ежели вы считаете себя квалифицированным специалистом, то потрудитесь, пожалуйста, по поводу Гугла не умничать, - а сообщить подробности. Первый раз раз слышу про какие-то накрутки в этой связи. На сайте мы всего лишь пытаемся для наглядности и соответствующего удобства использовать заглавные буквы при написании имён папок и имён файлов - только и всего. Например, для отличия созданных для специальных задач папок сайта от папок, создаваемых самой CMS в процессе её работы. Только и всего. Это понятно? Или тоже повторить?

Avatar
Алексей Жуков

это ошибки на стороне вашего сервера, яндекс правильно обрабатывает разные регистры

для примера, в индекс вполне возможно добавить url с разными регистрами 

P.S. в своё время это позволяло накрутить PR в гугле