Как работают поисковые машины интернета (продолжение)

ПоисковикиНачало статьи

Поисковые машины интернет ограничены в том, каким образом они интерпретируют просмотренные веб-страницы и выдают результаты пользователю. Их восприятие веб-страницы отличается от человека. Многие элементы сайта робот просто не видит и соответственно не может проиндексировать содержание этих веб-страниц, т.к. это зависит от того как работают поисковые машины интернета.

Для того чтобы любой сайт был виден поисковыми системами он, прежде всего, должен иметь HTML формат. Изображения, Flash файлы, Java-апплеты, и другие нетекстовые объекты, графические элементы и документы Web практически невидимы для их  роботов. Таким образом, самый простой способ показать поисковой системе (и соответственно пользователю) – это представить информацию в текстовом формате HTML

Однако есть некоторые приемы,  которые позволяют  сделать видимыми для  роботов нетекстовые объекты.

Изображения в формате GIF, JPG, PNG и т.д. могут быть  описаны в теге ALT в HTML, предоставляя Яндексу, Гуглу и т.д текстовое описание визуального контента.

Флэш, Java-апплеты могут иметь поясняющий текст.

Видео и аудио-контент должен  иметь сопровождающий текст, поскольку ни содержание видео, ни аудио не будет проиндексировано поисковиками.

Яндекс, Гугл  должны видеть веб-страницы, для того чтобы их сохранить и проиндексировать. Также они должны иметь доступ к структуре гиперссылок сайта, для того чтобы поисковый робот  смог получить доступ ко всем документам сайта. Так как поисковый робот «ползает» по веб страницам именно по гиперссылкам, то если имеется какая-либо страница, на которую не ведёт ни одна ссылка, то поисковый робот её никогда не увидит. Отсюда

простое правило: На любую страницу должна идти, как минимум, одна ссылка.

Добавить комментарий

Ваш e-mail не будет опубликован.