Поисковые системы
Поисковые машины представляют из себя специальные технологии, предназначенные для поиска информации в сети. Сегодня в Интернет более сотни действующих поисковых машин и их число постоянно растёт.
В настоящее время основной международной поисковой системой является Google. Yahoo и MSN Search также широко популярны и имеют свои собственные алгоритмы поиска.
В России наиболее популярная поисковая система -это Яндекс. За ним следуют Google.ru, Rambler , Aport, Mail.ru , KM.ru.
Поисковая система, как правило, содержит следующие программы:
Spider или crawler (паук) — программа, которая скачивает веб-страницы на подобии браузера.. Паук работает непосредственно с html кодом страницы. Паук ищет все ссылки на странице, чтобы определить, куда идти дальше и таким образом осуществляет поиск новых документов в Интернет. Поэтому, даже если Вы не зарегистрированы в поисковой системе, но на Ваш сайт есть ссылки, сайт будет проиндексирован.
Indexer (индексатор) — это программа, которая индекирует (анализирует) страницы, обнаруженные пауками. У каждой поисковой системы свой алгоритм идексации. Цель анализа — определить ключевые слова. Для этого анализируется заголовки, текст, html-теги и пр.
Все данные, которые поисковая система скачивает и анализирует хранятся в базе данных — индексе поисковой системы.
Система выдачи результатов — это программа , которая занимается ранжированием страниц, т.е. сортирует страницы, которые лучшим образом удовлетворяют запросам пользователей. Зная алгоритм ранжирования поисковой системы, можно значительно улучшить.позиции сайта в выдаче.
Положение сайта в выдаче поисковой системы зависит как от внешних так и от внутренних факторов. Внутренние факторы ранжирования — это те, которые зависят от создателя веб-сайта: контент, набор ключевых слов, используемые мета тэги.
Одним из ключевых внешних факторов при ранжировании страниц является так называемый индекс цитирования — анализ внешних ссылок на каждую оцениваемую страницу. Этот фактор мало подконтролен автору.