Сегодня хочу рассмотреть вопрос, о технической составляющей наших сайтов, и предлагаю каждому заглянуть под "капот" своего сайта или блога. Действительно ли с вашим сайтом все в порядке, как это кажется на первый взгляд? Поговорим о программе Xenu, которая поможет найти битые, исходящие и другие непригодные ссылки на вашем ресурсе.

Программа Xenu - проводим технический аудит на сайте

Приветствую, совсем я пропал и перестал заниматься своим блогом. Все больше ухожу в работу с коммерческими сайтами. Воспользуюсь небольшим перерывом и поделюсь полезной программой Xenu для Веб-мастеров, которая уже ни раз меня выручала. Работаю с ней уже довольно давно и постоянно применяю на практике.

Используя программу Xenu вы можете найти все исходящие и битые ссылки на своем сайте.

Коротко расскажу один интересный случай, который случился несколько месяцев назад. На одном из сайтов, над которым я работаю, в частности интернет-магазин произошел взлом. Моя коллега, большое ей спасибо, заметила в нескольких карточках с товаром, подозрительные ссылки на другие сайты. Данные ссылки никак не могут присутствовать на нашем ресурсе, так как мы его используем для клиентов. Сразу же запустили Xenu, на этом сайте довольно много страниц, поэтому проверка занимает примерно 1-2 часа.

В конце проверки мы обнаружили порядка 20 исходящих ссылок, в том числе, на сайты 18+ и интернет-казино. Так же удалось вычислить злоумышленника, так как он оставил исходящую ссылку и на себя. Да, существует такая биржа в интернете, которая продает ссылки со взломанных сайтов, возможно кое-кто о ней слышал.

В результате мы все почистили, так же нашли пару интересных скриптов и заменили пароли. Последствия были не сильно ощутимы, но потеряли немного трафик в Google, так как отреагировали примерно спустя неделю... Перейдем к практике.

Проверка исходящих и внешних ссылок

Основываясь на истории, которую я вам рассказал, если вы заподозрили, что с вашим ресурсом что-то не так (к примеру потеря позиций или трафика), советую периодически прогонять свой сайт или блог с помощью данной программы. Вы даже можете это сделать сейчас, в целях профилактики, вместе со мной.

Первое, что мы с вами посмотрим, это как обнаружить внешние ссылки. Xenu вы можете скачать по ссылке программа для проверки внешних ссылок .

1. Запускаем программу, вводим адрес нашего сайта и нажимаем ОК.

Ждём пока робот, пробежит по всем нашим страничкам. В зависимости от того, на сколько много у вас страниц, сканирование длится от нескольких минут до нескольких часов.

2. Как только робот обошел все страницы, мы видим список различных ссылок, которые присутствуют на нашем ресурсе. Для того, что бы было проще увидеть и найти исходящие ссылки с вашего сайта, сортируем ссылки по полю "Address". Смотрим на начало списка и конец, и вот наши внешние ссылки.

3. Для того, что бы быстро найти страницы откуда проставлена внешняя ссылка, необходимо при нажатии, правой кнопкой мыши по "плохой" ссылке выбрать "URL properties".

Ищем битые ссылки на сайте с Xenu

Теперь давайте проверим, есть ли на сайте битые ссылки, которые отдают 404 код и как их найти. Основная причина появления таких ссылок, это то, что адрес (URL) страницы, на которую ведет ссылка поменялся или страница удалена, а ссылка осталась. Так же есть и другие причины.

При такой сортировке, вы так же сможете найти и ссылки по которым происходит редирект, что тоже очень полезно.

Я рассказал вам основные два моменты по поиску внешних и битых ссылок на сайте с помощью Xenu. Программа является бесплатной и на сколько я знаю, уже довольно старая и не обновляется, но для нас главное, что работает.

Так же я использую данную программу, при "первом знакомстве" с сайтом, которым начинаю заниматься.

На этом все, если у вас есть другой интересный софт на данную тему, делитесь в комментариях!

Xenu’s Link Sleuth - старый надежный crawler, который быстро просканирует сайт и найдет буквально все: битые ссылки, редиректы, ошибки и многое другое.

При проверке сайта важно найти и исправить все ошибки, битые ссылки и неправильные редиректы, так как их отсутствие является положительным факторов в ранжировании сайта.

Хочу посоветовать отличный софт: — старый надежный crawler, который быстро просканирует сайт и найдет буквально все : битые ссылки, редиректы, ошибки, зашированные url, размер документа, дату и многое другое. Последняя версия от 2010 года, но это не мешает Xenu находит больше ошибок за меньшее количество времени, чем многие современные аналоги.

Но это не все, у программы есть множество дополнительных настроек, например:

  • Мы можем регулировать скорость анализа и количество потоков
  • Выводить более детальную статистику о каждой странице сайта. Например, чтобы показывать все редиректы, нужно зайти в «Options» — «Preferences» и поставить галочку «Treat redirections as errors» — тогда все редиректы будут отображаться как ошибка и отдавать ответы 301 или 302:


  • В Xenu мы можем создавать статичную html и xml карту сайта
  • Конвертировать отчет в формат Excel и сортировать полученные данные

На последнем пункте остановимся поподробнее. Чтобы открыть отчет в Excel нужно экспортировать отчет «File» — «Export to TAB Separated File»:


Получим отчет в обычном.txt файле — его нужно открыть Notepad++ (или аналогом) и сменить кодировку на ANSI:


После этого можно спокойно открывать файл в Excel:


Где мы уже можем сортировать данные как нужно: по дате появления документа, по количеству внешних ссылок, по уровню вложенности страницы и т.д.

Xenu – это сокращенное название программы Xenu’s Link Sleuth, предназначенной для внутреннего аудита сайта и поиска битых ссылок.

При изменении структуры сайта или URL-адресов на других страницах могут оставаться неактуальные ссылки, ведущие на старые несуществующие адреса. Именно поиск таких ссылок и является основной задачей Xenu. Программа является бесплатной, потому она очень популярна во всем мире. Это простой софт, позволяющий в короткие сроки проанализировать сайт на наличие битых ссылок и не только.

Возможности Xenu

Помимо поиска неработающих и битых ссылок, программа умеет:

  • искать изображения, фреймы, скрипты, плагины, стили и др.;
  • искать страницы с большим временем отклика;
  • искать страницы с большим весом;
  • искать страницы с большим уровнем вложенности;
  • проводить анализ внутренней перелинковки;
  • искать одинаковые заголовки Title;
  • искать изображения без атрибута alt;
  • составлять карту сайта;
  • проверять защищенные сайты по протоколу SSL (https://).

Xenu способна анализировать как весь сайт, так и его отдельные страницы. Также есть возможность проанализировать локальные документы на ПК.

В процессе анализа в основном окне будут отображаться результаты. В дальнейшем их можно будет экспортировать, допустим, в Excel.

Как работает программа

Чтобы начать анализ сайта в Xenu, необходимо запустить софт и нажать на вкладку File. Далее выбрать первый пункт Check URL.

Указываем адрес сайта, отдельных страниц или путь к документу на ПК.

После запуска в основном окне программы будут отображаться результаты анализа. Анализироваться будут как URL-адреса страниц, так и ссылки на различные файлы.

С помощью различных табуляторов вы сможете отсортировать ссылки по разным параметрам: Status (битая или нет), Type (формат файла), Size (размер страницы), Title (заголовок) и Level (уровень вложенности).

Xenu Link Sleuth это один из наиболее полезных инструментов в поисковой оптимизации. Хотя эта программа изначально предназначалась для поиска битых ссылок на сайте, с помощью неё можно решать ряд других задач, проводя аудит внутренней структуры сайта и находя в нем слабые места:

- Искать битые (неработающие) ссылки на заданном ресурсе.
Вы написали сотню статей, во многих были ссылки на другие ресурсы или какие-нибудь документы, изображения, но уследить за работоспособностью всех этих ссылок вручную невозможно. В данном случае очень удобно использовать Xenu Link Sleuth , как свободный софт, простой в настройке и использовании.

- Составлять карту сайта.
Для динамических сайтов составить карту не составляет проблемы, однако, для статических HTML ресурсов создавать карту сайта вручную весьма долго и трудоемко. Xenu решает эту задачу за несколько минут в зависимости от размера сайта и скорости Интернет-соединения.

- Искать страницы с большим временем отдачи.
Зная, какие страницы на вашем сайте отдаются с большой задержкой, можно проанализировать причину подобного поведения и оптимизировать время отдачи, что положительно скажется как на посетителях, так и на поисковых системах.

- Найти неуникальные тайтлы.
Каждый тайтл на странице должен быть уникален, тогда ни одна из них не будет находиться в дополнительных результатах поиска и фильтроваться, как дублированный контент. Поэтому важно знать, на каких страницах сайта тайтлы повторяются.

- Найти страницы с большим уровнем вложенности.
Все страницы на сайте по возможности должны находиться не далее, чем в двух-трех кликах от главной. Чем дальше находится страница, тем сложнее до неё добраться как пользователям, так и поисковым системам. Если у вас нашлись подобные страницы, являющиеся важными, но находящиеся далее, чем в 3-х кликах от главной, стоить принять какие-либо меры для улучшения навигации. Возможно, некоторые из дальних страниц вам уже не нужны, xenu легко позволяет их найти.

- Искать страницы с максимальным количеством исходящих ссылок.
Как упоминалось раннее, все исходящие ссылки на сайте должны тщательно модерироваться, так как от них зависит заслуженное доверие от поисковых систем (по принципу: “Скажи мне кто твой друг и я скажу кто ты!”) а также присвоение сайту различного рода фильтров. Если вы заметили резкое падение позиций в поисковике, тогда первым делом необходимо проверить все исходящие ссылки, так как возможно, если виноваты не вы, то хакеры, разместившие на вашем ресурсе свои спам-ссылки.

- Посмотреть какие из страниц имеют наибольшее и наименьшее количество внутренних ссылок на себя.
Проверьте вашу внутреннюю перелинковку в численном виде. Какие из страниц заслужили больше внимания, а какие меньше (исходя из внутренних ссылок)?

- Найти картинки с отсутствующим атрибутом alt.
Атрибут alt является важным при оптимизации сайта или отдельных страниц под определенные запросы. Проверьте, возможно, вы упустили описание для важных на вашем сайте изображений, добавив которое, вы улучшите позиции в поиске, либо вас будут находить по поиску по изображениям .

Результаты решения этих задач, как видно, могут быть использованы для оптимизации, поэтому, сделаем небольшой обзор программы Xenu Link Sleuth , чтобы её пользователей не пугал английский интерфейс.

Ксену является свободным продуктом и эту программу можно скачать по этой ссылке . При запуске перед вами откроется очень простое окно, важная часть которого изображена на скриншоте.

Чтобы начать аудит какого-либо сайта, выберите пункт меню “File » Check URL ”. В появившемся окне необходимо ввести адрес сайта и выделить чекбокс “Check external links” (проверять внешние ссылки).

В программе предусмотрено множество настроек, доступных в пункте меню “Options » Preferences”.

Parallel threads устанавливает количество синхронных (параллельных) запросов.
Apply to all jobs позволяет сохранять настройки для всех проектов.

Далее, отчет позволяет включать в себя:
Broken links, ordered by link — Битые ссылки, отсортированные по адресу;
Broken links, ordered by page — Список битых ссылок, отсортированных по страницам;
Broken local links — Битые внутренние ссылки;
Redirected URL s — Адреса с 301/302 редиректом;
Ftp and gopher URL s — ФТП и другие не HTTP адреса;
Valid text URL s — Список рабочих текстовых ссылок;
Site Map — Карта сайта;
Statistics — Статистика;

Файл отчета работы Xenu очень большой и содержит в себе всю необходимую информацию. К примеру, статистика мониторинга моего блога показала следующие результаты:

В результате аудита, на сайте найдены ряд моментов, на которые стоит обратить внимание для оптимизации. Единственный недостаток программы — отображение русских заголовков страниц в неправильной кодировке.

Сразу же после окончания проверки ссылок сайта, в главном окне появится детальная таблица, где данные можно отсортировать по каждому из столбцов: адрес ссылки, возвращаемый статус, mime-тип, размер, заголовок, уровень вложенности, кол-во внешних и внутренних ссылок, время отдачи страницы. Вот эту таблицу вам и надо использовать. Если что-то будет не понятно по работе или использованию программы, можете спрашивать в комментариях, постараюсь ответить.

  • Поиск неработающих (битых ссылок) на заданном ресурсе. Это основная задача программы. Проверяются html, php ссылки, а также изображения, фреймы, скрипты, стили. Реализована возможность проверки адресов https. Найденные битые ссылки должны быть исправлены или удалены.
  • Составление карты сайта. Эта функция позволяет автоматизировать создание карты сайта (в формате XML) для статистических html ресурсов.
  • Поиск страниц с большим временем отдачи. Уменьшение времени отклика страницы улучшает сайта и положительно влияет на его ранжирование поисковыми системами.
  • Поиск неуникальных тайтлов. Страницы с неуникальными тайтлами могут фильтроваться как дублированный контент и отображаться в дополнительных результатах поиска.
  • Поиск страниц с большим уровнем вложенности. Результаты отображаются в столбце отчета «Level».
  • Поиск страниц с большим количеством исходящих ссылок, а также аудит внутренней перелинковки сайта.
  • Нахождение изображений с незаполненным тегом alt и другие.

Работа программы

С помощью Xenu можно проанализировать весь сайт, его отдельные разделы или локальные документы на компьютере. Для начала аудита предназначен пункт меню File Check URL или соответствующая кнопка на панели инструментов.

В рабочем окне программы отчет формируется в процессе анализа, битые ссылки выделяются красным цветом. Результаты могут быть обработаны до завершения проверки.