Технический и поисковый аудит сайта(конспект по лекции Нетологии)

Технический и поисковый аудит сайта

Дополнительные материалы по теме «Технический и поисковый аудит сайта»

Инструменты

Статьи

 

Технический и поисковый аудит сайта

Термины по теме «Технический и поисковый аудит сайта»

robots.txt — это текстовый файл (формат .txt), который находится в корне (корневой директории) вашего сайта. В файле записаны инструкции для поискового робота, что ему делать с информацией на сайте, что можно индексировать, а что запрещено к индексации, какое главное зеркало, есть ли ссылка на карту сайта.

Редирект — с англ. переадресация, перенаправление с одного документа на другой.

Карта сайта (sitemap.xml) — это специальный файл в формате xml, в котором отражены ссылки на страницы сайта, необходимые индексировать. xml-карта нужна поисковым роботам, чтобы проиндексировать все необходимые страницы сайта. xml-карта обычно находится в корне сайта. Пример: https://site.ru/sitemap.xml

ЧПУ (сокр. от человекопонятный урл, калька с англ. Friendly URL) — легко узнаваемый адрес. Пользователь приблизительно понимает, что на сайте, так как строение адреса максимально приближено к расположению строк в файловой системе. Можно привести пример: www.searchengines.ru/articles/ - статья с сайта searchengines.ru, http://lenta.ru/news/2012/01/19/metrowifi/ - статья с сайта за 19 января 2012 года.
Для создания ЧПУ можно использовать кириллический алфавит, но тогда символы URL, которые не похожи на знаки из ASCII, изменятся. ЧПУ намного удобней обычных URL, так как естественно воспринимаются и легко воспроизводятся. Основным минусом таких адресов является то, что ЧПУ задействует дополнительные ресурсы сервисов.

Ошибка 404 или Not Found («не найдено») — стандартный код ответа сервера о том, что по данному URL-адресу такое страницы на сайте больше нет.

Битая ссылка — ссылка на несуществующую страницу, документ или изображение. Переходя по битой ссылке, пользователь в лучшем случае видит сообщение о том что страница не найдена. В худшем случае он видит служебную страницу сервера.

Зеркало сайта — это его полная или частичная копия в плане содержимого контента. Зеркалами считаются сайты, являющиеся полными или частичными копиями. Копии определяются по совпадению контента на страницах с одинаковыми адресами (site1.ru/page.html и site2.ru/page.html). Например, в большинстве случаев хосты site.ru и www.site.ru являются зеркалами, так как контент страниц, доступных по одинаковым адресам, не отличается. Также сайты считаются зеркалами, если со страниц одного сайта настроен серверный редирект на соответствующие им страницы другого сайта (site1.ru перенаправляет на site2.ru, site1.ru/page.html перенаправляет на site2.ru/page.html и т.д.)

Склейка зеркал — объединение нескольких сайтов в один в индексе поисковой системы, обычно являющихся зеркалами, называется склейкой.

Кроссбраузерность — свойство веб-сайта отображаться и функционировать во всех часто используемых браузерах идентично. Под идентичностью функционирования подразумевается: отсутствие некорректной работы, ошибок в вёрстке и способность отображать материал с одинаковой степенью читабельности. Вследствие постоянного развития веб-технологий, приемлемую кросс-браузерность возможно обеспечить только для последних версий браузеров.

Дубли страниц — это идентичные друг другу страницы, находящиеся на разных URL-адресах. Копии страниц затрудняют индексацию сайтов в поисковых системах.

Краулер (Crawler) — программное обеспечение поисковой системы, которое обходит веб-страницы и заносит их в индекс. Также программа, позволяющая спарсить все внутренние и внешние ссылки сайта, метатеги, заголовки, канонические url и множество других данных, необходимых для SEO-специалиста.

Краулинговый бюджет — это краулинговый спрос + скорость сканирования, то есть URL для сканирования, которые может охватить робот в единицу времени. Если робот при прохождении сайта не может обойти все страницы, то они не попадут в индексацию. Поэтому задумываться о нем стоит лишь крупным ресурсам.

Хлебные крошки (англ. Breadcrumbs) – один из элементов навигации по сайту. Обычно находятся сразу над полем с основными материалами, чуть ниже главного горизонтального меню, если такое есть. Основная задача – помочь пользователю сориентироваться, в каком из разделов сайта он находится и, если необходимо, подняться на один или несколько разделов выше. Также они помогают быстро вернуться назад, если пользователь кликнул по какой-нибудь ссылке на сайте ошибочно и перешел на страницу, на которую не планировал переходить. Чем удобнее и понятнее для пользователя будут организованы элементы навигации на сайте – тем больше шансов, что, попав на него однажды, он будет пользоваться им и в дальнейшем.

Каноническая страница — это оригинальная страница или первоисточник. Каноническая ссылка (с атрибутом rel=canonical тега link) — не является строгой директивой. Это значит, что указание страницы как канонической может как учитываться так и игнорироваться поисковыми роботами.

RDS Bar, панель инструментов RDS — это дополнение для браузеров, которое встраивается в ваш браузер в виде дополнительной панели инструментов.

Букмарклет — небольшая JavaScript-программа, оформленная как javascript: URL и сохраняемая как браузерная закладка. Альтернативное название букмарклетов — «favelets». В русском языке иногда используется вариант «закладурки».

Punycode — стандартизированный метод преобразования последовательностей Unicode-символов в так называемые ACE-последовательности, которые состоят только из алфавитно-цифровых символов, как это разрешено в доменных именах.

Протоколы HTTP и HTTPS

HTTP (от англ. HyperText Transfer Protocol — протокол передачи гипертекста) — это прикладной протокол передачи данных в сети, на текущий момент используется для получения информации с веб-сайтов. Протокол HTTP основан на использовании технологии «клиент-сервер»: клиент, отправляющий запрос, является инициатором соединения; сервер, получивщий запрос, выполняет его и отправляет клиенту результат.

HTTPS (от англ. HyperText Transfer Protocol Secure — безопасный протокол передачи гипертекста) — это расширение протокола HTTP, поддерживающее шифрование посредством криптографических протоколов SSL и TLS.

Код ответа сервера, код состояния HTTP (англ. HTTP status code) — часть первой строки ответа сервера при запросах по протоколу HTTP. Он представляет собой целое число из трёх десятичных цифр.

Last-Modified —  HTTP-заголовок Last-Modified содержит информацию о том, когда в последний раз обновлялась страница. В большинстве случаев для обновления этого заголовка используются скрипты, которые обновляют содержимое автоматически. Если их еще нет, желательно их настроить, так как содержимое заголовка Last-Modified анализируется поисковыми роботами при индексировании сайта и, если они видят что срок Last-Modified больше, чем дата их последнего посещения, они могут не зайти на страницу, даже несмотря на то, что там появилась новая информация. Для разных страниц сайта необходимо выставлять разные значения в заголовке Last-Modified. Для главной страницы это должно быть не более чем три-пять дней до текущей даты, для страниц разделов не более одной-двух недель, для страниц, посвященных товарам, статьям и другим подобным материалам, – не более одного месяца.

Склейка домена — часто для распределения нагрузки на сайт, создаётся зеркало сайта на другом сервере. Существует такое понятие, как Алиас, позволяющий назначить доменное имя, которое будет ссылаться на Ваш сайт. Склейка доменов имеет достаточно частое употребление, однако использоваться она может не только в белых, но и в чёрных методах поисковой оптимизации. Так, если происходят какие-либо изменения, и необходимо переименовать сайт, можно воспользоваться склейкой доменов, вместо того, чтобы создавать и раскручивать новый сайт. Склейка доменов позволяет переносить сайты на домен без потери ссылочной массы.

Директива — это команда для ботов поисковых систем которая вносится в системный файле сайта — robots.txt и призвана упростить взаимодействие бота с сайтом за счет предоставленной информации о страницах которые нет необходимости сканировать.

Тэги:

Тэг в списке: