Начало работы | AJAX Crawling (устарел)

Обзор решения
Пошаговое руководство
2. Настройте сервер для обработки запросов на URL-адреса, содержащие _escaped_fragment_
3. Обрабатывать страницы без хеш-фрагментов.
4. Подумайте об обновлении файла Sitemap, чтобы получить список новых URL-адресов AJAX.
5. При желании, но важно, проверьте работоспособность вашего приложения: посмотрите, что видит сканер...

В этом документе описываются шаги, необходимые для того, чтобы ваше приложение AJAX можно было сканировать. После того, как вы полностью освоите каждый из этих шагов, вам не понадобится много времени, чтобы реально сделать ваше приложение доступным для сканирования! Тем не менее, вам необходимо понимать каждый из этих этапов, поэтому мы рекомендуем прочитать это руководство полностью.

Обзор решения

Вкратце, решение работает следующим образом: сканер находит симпатичный URL AJAX (то есть URL, содержащий фрагмент хеша #!). Затем он запрашивает контент для этого URL с вашего сервера в слегка измененной форме. Ваш веб-сервер возвращает контент в виде HTML-снимка, который затем обрабатывается сканером. Результаты поиска покажут исходный URL.

Результаты поиска покажут исходный URL

Пошаговое руководство

1. Укажите сканеру, что ваш сайт поддерживает схему сканирования AJAX

Первый шаг к индексации вашего сайта AJAX - указать сканеру, что ваш сайт поддерживает схему сканирования AJAX. Способ сделать это - использовать специальный токен в ваших хеш-фрагментах (то есть все после знака # в URL): хеш-фрагменты должны начинаться с восклицательного знака. Например, если ваше приложение AJAX содержит URL-адрес, подобный следующему:

www.example.com/ajax.html # key = value

теперь должно стать так:

www.example.com/ajax.html #! key = value

Когда ваш сайт примет эту схему, он будет считаться "CJAX для сканирования AJAX". Это означает, что сканер увидит содержимое вашего приложения, если ваш сайт предоставит снимки HTML.

2. Настройте сервер для обработки запросов на URL-адреса, содержащие _escaped_fragment_

Предположим, вы хотите проиндексировать www.example.com/index.html#!key=value. Ваша часть соглашения заключается в том, чтобы предоставить сканеру моментальный снимок HTML этого URL, чтобы сканер мог видеть его содержимое. Как ваш сервер узнает, когда следует возвращать снимок HTML вместо обычной страницы? Ответ - это URL, который запрашивает сканер: сканер будет изменять каждый URL AJAX, например

www.example.com/ajax.html #! key = value

временно стать

www.example.com/ajax.html ? _escaped_fragment_ = key = value

Вы можете удивиться, почему это необходимо. Есть две очень важные причины:

Хеш-фрагменты никогда (по спецификации) не отправляются на сервер как часть HTTP-запроса. Другими словами, сканеру нужен какой-то способ, чтобы ваш сервер знал, что ему нужно содержимое для URL www.example.com/ajax.html#!key=value (в отличие от простого www.example.com/ajax.html). ).
С другой стороны, ваш сервер должен знать, что он должен возвращать снимок HTML, а не обычную страницу, отправляемую в браузер. Помните: снимок HTML - это все содержимое, которое появляется на странице после выполнения JavaScript. Соглашение вашего сервера заключается в том, чтобы вернуть сканеру HTML-снимок для www.example.com/index.html#!key=value (то есть исходного URL-адреса!).

Примечание . Искатель экранирует определенные символы во фрагменте во время преобразования. Чтобы получить исходный фрагмент, не забудьте удалить все символы% XX во фрагменте. Точнее говоря,% 26 должен стать &,% 20 должен стать пробелом,% 23 должен стать #, а% 25 должен стать%, и так далее.

Теперь, когда у вас есть исходный URL-адрес и вы знаете, какой контент запрашивает сканер, вам нужно создать Снимок HTML , Как ты это делаешь? Есть разные способы; вот некоторые из них:

Если большая часть вашего контента создается с помощью JavaScript, вы можете использовать браузер без монитора, такой как HtmlUnit получить снимок HTML. Кроме того, вы можете использовать другой инструмент, такой как crawljax или же watij.com ,
Если большая часть вашего контента создается с использованием серверной технологии, такой как PHP или ASP.NET, вы можете использовать существующий код и заменять только части JavaScript веб-страницы на статические или созданные на стороне HTML.
Вы можете создать статическую версию своих страниц в автономном режиме, как это принято в настоящее время. Например, многие приложения извлекают контент из базы данных, который затем отображается браузером. Вместо этого вы можете создать отдельную страницу HTML для каждого URL AJAX.

Настоятельно рекомендуется попробовать механизм моментального снимка HTML. Важно убедиться, что браузер без монитора действительно правильно отображает содержимое состояния вашего приложения. Наверняка вы захотите узнать, что увидит сканер, верно? Для этого вы можете написать небольшое тестовое приложение и просмотреть вывод, или вы можете использовать инструмент, такой как Инструмент проверки URL ,

Подводя итог, убедитесь, что на вашем сервере происходит следующее:

URL-адрес запроса в форме www.example.com/ajax.html?_escaped_fragment_=key=value возвращается в исходную форму: www.example.com/ajax.html#!key=value.
Токен является URL-адресом без экранирования. Самый простой способ сделать это - использовать стандартное декодирование URL. Например, в Java вы должны сделать следующее: mydecodedfragment = URLDecoder.decode (myencodedfragment, "UTF-8");
Возвращается снимок HTML, в идеале вместе с заметной ссылкой вверху страницы, что позволяет конечным пользователям узнать, что они достигли URL-адреса _escaped_fragment_ по ошибке. (Помните, что URL-адреса _escaped_fragment_ предназначены для использования только сканерами.) Для всех запросов, у которых нет _escaped_fragment_, сервер будет возвращать контент, как и раньше.

3. Обрабатывать страницы без хеш-фрагментов.

Некоторые из ваших страниц могут не иметь хеш-фрагментов. Например, вы можете захотеть, чтобы домашней страницей была www.example.com, а не www.example.com #! Home. По этой причине у нас есть специальное положение для страниц без хеш-фрагментов.

Примечание. Убедитесь, что вы используете эту опцию только для страниц, которые содержат динамический контент, созданный Ajax. Для страниц, которые имеют только статическое содержимое, он не предоставит сканеру дополнительную информацию, но увеличит нагрузку на серверы Google и вас.

Для того, чтобы страницы без хеш-фрагментов могли сканироваться, вы добавляете специальный метатег в заголовок HTML вашей страницы. Метатег принимает следующую форму: <meta name = "фрагмент" content = "!">

Это указывает сканеру, что он должен сканировать некрасивую версию этого URL. Согласно приведенному выше соглашению, сканер временно сопоставит симпатичный URL-адрес с соответствующим уродливым URL-адресом. Другими словами, если вы поместите <meta name = "фрагмент" content = "!"> На страницу www.example.com, сканер временно сопоставит этот URL-адрес с www.example.com?_escaped_fragment_= и запросит его у ваш сервер. Ваш сервер должен затем вернуть снимок HTML, соответствующий www.example.com. Обратите внимание, что к этому метатегу применяется одно важное ограничение: единственным допустимым содержимым является «!». Другими словами, метатег всегда будет иметь точную форму: <meta name = "фрагмент" content = "!">, Который указывает пустой фрагмент хеша, но страницу с содержимым AJAX.

4. Подумайте об обновлении файла Sitemap, чтобы получить список новых URL-адресов AJAX.

Сканеры используют файлы Sitemap для дополнения своего сканирования при обнаружении. Ваш файл Sitemap должен содержать версию ваших URL-адресов, которые вы бы предпочли отображать в результатах поиска, поэтому в большинстве случаев это будет http://example.com/ajax.html#!key=value. Не включайте ссылки, такие как http://example.com/ajax.html?_escaped_fragment_=key=value, в файл Sitemap. Робот Google не переходит по ссылкам, содержащим _escaped_fragment_! Если у вас есть страница входа на ваш сайт, такая как домашняя страница, которую вы хотели бы отображать в результатах поиска без # !, то добавьте этот URL в файл Sitemap как есть. Например, если вы хотите, чтобы эта версия отображалась в результатах поиска:

http://example.com/

затем включите:

http://example.com/

в вашем файле Sitemap и убедитесь, что <meta name = "фрагмент" content = "!"> включен в заголовок документа HTML. Для получения дополнительной информации, ознакомьтесь с нашими дополнительными статьями на Sitemaps ,

5. При желании, но важно, проверьте работоспособность вашего приложения: посмотрите, что видит сканер с помощью «Проверять URL».

Google предоставляет инструмент, который позволит вам понять, что видит сканер, Проверить URL , Вы должны использовать этот инструмент, чтобы увидеть, является ли ваша реализация правильной и может ли бот теперь видеть весь контент, который вы хотите, чтобы пользователь увидел. Также важно использовать этот инструмент, чтобы гарантировать, что ваш сайт не маскируется.

Похожие

Креативные решения eDigitEyes

Обзор SEO BigCommerce
При выборе платформы корзины покупок, SEO должно быть одним из ваших главных соображений, если не ваше мнение № 1. Если ваш сайт электронной коммерции не имеет первоклассного SEO, ваш рейтинг в поисковых системах - и ваша прибыль - пострадают. Как генеральный директор и основатель одной из крупнейших в Лос-Анджелесе компаний, занимающихся веб-дизайном и SEO, я снова и снова являюсь свидетелем того, как SEO может создать или сломать успех бизнеса.

Что такое система показателей?
Индикаторы и системы индикаторов являются жизненно важными инструментами, которые позволяют вам измерять, контролировать и управлять вашими SEO-методами. Индикаторные системы существуют в деловом мире уже более 90 лет. Система индикаторов DuPont, также называемая анализом ROI, является центральной отправной точкой. Он был разработан американской химической компанией Du Pont de Memours & Co и представлен в 1919 году. Индикаторные системы DuPont хорошо подходят

На странице SEO Контрольный список
На странице SEO является фундаментом, на котором ваш сайт должен быть построен для лучшего рейтинга в поисковых системах. На странице и вне страницы SEO взаимозависимы. Если у вас нет ни одного из них, шансы вашего сайта на высокий рейтинг в поисковых системах невелики. Офф-страница SEO состоит из стратегии построения ссылок результаты которого не всегда в ваших руках. Хорошая

Ваш рейтинг упал - 10 вещей, которые нужно сделать сейчас
... URL-адресов и количеством URL-адресов, проиндексированных Google. Если цифры не складываются, возможно, важные страницы блокируются поисковыми роботами. Просканируйте свой сайт с помощью программного обеспечения для сканирования, такого как Screaming Frog, которое поможет вам решить проблему. В настройках консоли поиска обязательно установите флажок «Включить уведомления

Что такое SEO-аналитик?
... новых внешних ссылок на сайт. Чем больше внешних ссылок (других сайтов) хорошего качества на ваших страницах, тем лучше оценка поисковых систем. Это означает, что многие люди «говорят» о вашем контенте, что является отличным показателем его хорошего качества. - Командная тренировка Тимбилдинг - это возможность сделать процесс евангелизации SEO. Термин, широко используемый в SEO-сообществе для описания процесса, в котором SEO-аналитик учит других участников, участвующих

Как улучшить SEO вашего блога
Вы отключаетесь при простом упоминании о SEO или поисковой оптимизации? SEO, возможно, является одним из наиболее неправильно понятых элементов ведения блога. Люди думают, что SEO должно

Список сайтов более 70+ статей
Привет читатели !! Сегодня я делюсь лучшими сайтами для публикации статей для продвижения вашего контента и получения качественных обратных ссылок для вашего блога и сайта. Обратные ссылки играют большую роль в SEO, но тип обратных ссылок более важен для SEO. SEO сильно изменился после обновлений Google Panda и Google Pguin. Вы должны уделять больше внимания качеству backiink и контент-маркетингу. Многие блоггеры считают, что отправка статьи - старая

Любая компания, имеющая веб-сайт, уже должна рассматривать этот домен в качестве представителя по продажам ...
Любая компания, имеющая веб-сайт, уже должна рассматривать этот домен в качестве представителя по продажам в Интернете - если она хорошо работает с кампанией контент-маркетинга, она может привлекать трафик и потенциальных клиентов. Следующим шагом на этом сайте должно быть обеспечение того, чтобы Google

Majestic SEO Обзор
Обновлено февраля 2019 Маленькая история В марте 2016 года наше цифровое агентство, расположенное в Сиднее, Австралия, начало использовать Majestic для создания конкурентного преимущества на австралийском рынке веб-дизайна. Используя Majestic для исследования не только наших конкурентов в Австралии, но и наших коллег в США, Великобритании и Новой Зеландии, мы смогли увидеть, где нам нужно (в зависимости от обстоятельств) в индустрии цифрового

Руководство музыканта по поисковой оптимизации (SEO)
... новых посещений по ключевым словам. Используйте эту информацию, чтобы подчеркнуть ключевые слова, которые получают высокие оценки в каждой из этих областей. Это были главные ключевые слова, которые привели к трафику в Бизнес-словаре музыканта за последнюю

Но знаете ли вы, что вы также можете использовать поисковую оптимизацию или SEO для ускорения загрузки вашего мобильного приложения?
Но знаете ли вы, что вы также можете использовать поисковую оптимизацию или SEO для ускорения загрузки вашего мобильного приложения? Страницы профиля мобильного приложения не отображаются в списках поисковых систем, как веб-страницы. Итак, что вы можете сделать, чтобы ваше мобильное приложение отображалось в списках поисковых систем? Создайте целевую страницу или микросайт для начала. Наличие присутствия в Интернете является отправной точкой в использовании трафика,

Вы, вероятно, легко выполняете не менее 5 поисковых запросов в день, но когда вы в последний раз переходили на вторую страницу результатов поиска?
Вы, вероятно, легко выполняете не менее 5 поисковых запросов в день, но когда вы в последний раз переходили на вторую страницу результатов поиска? Google гордится тем, что предоставляет не только веб-сайты, которые могут содержать слова, которые вы искали, но и наиболее релевантные результаты, и существует множество факторов (называемых «факторами ранжирования»), которые Google использует для определения того, кто является наиболее релевантным. Как правило, веб-сайты с большим количеством просмотров,

Что вы пытаетесь найти, и что более важно, люди на самом деле ищут это?
Что вы пытаетесь найти, и что более важно, люди на самом деле ищут это? Вы можете получить наибольший целевой результат, наиболее хорошо оптимизированный результат для фразы, но если ее никто не ищет, вы не получите никакого трафика. Например, короткий поиск «бирмингемского адвоката» гораздо менее целенаправленный, чем «бирмингемский адвокат по корпоративным налогам». Если вы являетесь бирмингемским адвокатом, специализирующимся на корпоративном налоговом праве, это было бы пустой тратой

Но вопрос в том, содержит ли ваш контент релевантную информацию таким образом, чтобы сделать ее доступной для поиска?
Но вопрос в том, содержит ли ваш контент релевантную информацию таким образом, чтобы сделать ее доступной для поиска? Многие стратегии SEO ориентированы на популярные ключевые слова (это означает, что люди вводят их в поисковые системы). Некоторые даже заходят так далеко, что включают слова с ошибками, потому что это то, что многие пишут. Но особые ключевые слова - это не конец, а вся успешная стратегия в области SEO контента. Ключевые слова с длинным хвостом (несколько ключевых

Но что, если вы не хотите кричать миру, что используете платформу Wix?
Но что, если вы не хотите кричать миру, что используете платформу Wix? Другие создатели веб-сайтов без кода не наносят серьезного ущерба вашему представленному контенту, как это делает Wix, но они по-прежнему сохраняют за собой право перемещать или удалять ваш материал, особенно если он защищен авторским правом, непристойен или является спамом. Эти платформы

Итак, как вы используете SEO, чтобы получить максимальную отдачу от контента вашего бизнеса?
Итак, как вы используете SEO, чтобы получить максимальную отдачу от контента вашего бизнеса? Как вы используете свои ключевые слова, чтобы сделать свой бизнес видимым? Главное, чтобы ваши ключевые слова были правильно размещены как на вашей веб-странице, так и за ее пределами. 1. Название Самая важная часть вашего контента - это первая часть, которую каталоги поисковых систем ищут при поиске на вашем сайте. Ваш заголовок - это краткое, интересное описание того, что обсуждается

Что если мы скажем вам, что есть способ не только привлечь целевых клиентов бесплатно, но и сделать это последовательно, добавив немного дополнительной работы на свой веб-сайт?
Что если мы скажем вам, что есть способ не только привлечь целевых клиентов бесплатно, но и сделать это последовательно, добавив немного дополнительной работы на свой веб-сайт? Будучи предпринимателем в области электронной коммерции, вы, вероятно, подумали над SEO или двумя, и, возможно, уже реализовали пару тактик SEO. Это руководство расскажет вам о наиболее важных аспектах SEO, которые вы должны включить на своем веб-сайте электронной торговли, от исследования контента и ключевых

У вас есть насыщенный контентом сайт, и вы хотите, чтобы посетители могли быстро и легко получить доступ к этому контенту, но разве подход к мегаменю тайно саботирует ваш SEO?
У вас есть насыщенный контентом сайт, и вы хотите, чтобы посетители могли быстро и легко получить доступ к этому контенту, но разве подход к мегаменю тайно саботирует ваш SEO? Это может быть. В последние годы тенденции дизайна и UX склоняются к упрощению структуры навигации, чтобы облегчить навигацию по веб-сайтам на всех устройствах, особенно мобильных. Лично я не являюсь поклонником решения мегаменю (это сообщение в блоге на другой день), но использовать подход не обязательно неправильно.

Итак, мы знаем, что они оба, но что мы должны делать для нашего сайта?
Итак, мы знаем, что они оба, но что мы должны делать для нашего сайта? Как я уже говорил в начале этой статьи, SCM - это следующий шаг в SEO. Под этим я подразумеваю, что для того, чтобы сделать правильный SEO, вам нужно усилить его, чтобы охватить SCM. Поисковая оптимизация включает в себя добавление правильных, исследованных и релевантных тегов заголовка, альтернативного текста, подписей, метаописаний, тегов H, ключевых слов (включая хвосты ключевых слов), ссылок в социальных

Что вы можете сделать, чтобы получить беспроигрышную ситуацию?
Что вы можете сделать, чтобы получить беспроигрышную ситуацию? Играй честно и следуй правилам поисковой системы Чтобы избежать перегрузки своих центров обработки данных и пропускной способности, поисковые системы разработали умные системы для защиты от автоматических запросов. Это помогает им предоставлять непрерывные услуги высокого стандарта всем поисковикам, что, в конце концов, является их основной областью применения. Давайте подробно рассмотрим, как это

Вы должны убедиться, что делаете это прилично, но что делает приличный?
Вы должны убедиться, что делаете это прилично, но что делает приличный? Мы написали целый пост о построении ссылок, где вы можете найти гораздо больше информации по этой теме. Это очень важная тема, в которую нужно углубиться, если вы хотите самим создавать ссылки. Одна вещь, которую вы можете сделать самостоятельно, это проверить свой профиль ссылок на www.ahrefs.com, чтобы увидеть, сколько у вас входящих ссылок, а затем выяснить, есть ли у вас поставщики, которые не ссылаются

Как ваш сервер узнает, когда следует возвращать снимок HTML вместо обычной страницы?
Теперь, когда у вас есть исходный URL-адрес и вы знаете, какой контент запрашивает сканер, вам нужно создать Снимок HTML , Как ты это делаешь?
Наверняка вы захотите узнать, что увидит сканер, верно?
Html?
Com?
Html?
Что такое система показателей?
Но знаете ли вы, что вы также можете использовать поисковую оптимизацию или SEO для ускорения загрузки вашего мобильного приложения?
Итак, что вы можете сделать, чтобы ваше мобильное приложение отображалось в списках поисковых систем?
Вы, вероятно, легко выполняете не менее 5 поисковых запросов в день, но когда вы в последний раз переходили на вторую страницу результатов поиска?

Начиная