Как производится отбор CMS (Content Management System)?

У нас собственное программное обеспечение, содержащее базу набора правил под каждую из CMS. Например, чтобы найти сайты на WordPress, нужно получить исходный код сайта и найти один из признаков, вот например самые распространенные из них:

  • meta name=”generator” content=”WordPress…
  • <a href=”/wp-content/themes/…
  • <a href=”/wp-content/plugins/…

Но далеко не у всех движков есть видимые признаки в исходном коде главной страницы. Для определения таких движков, используются подстановочные URL и уже там ищется определенный признак.

Для достижения максимально больших и качественных объемов, проверка одного сайта происходит из нескольких точек планеты, во избежание «недоступности» сайта.

Это лишь краткое описание принципов работы. В отборе и фильтрации очень много нюансов. Стабильность и качество работы нашего ПО повышалось на протяжении нескольких лет.