0

Из чего состоит адрес сайта

URL (Uniform Resource Locator) – это индикатор положения ресурса в Интернете. Это адрес страницы сайта, который состоит из домена, пути к странице и наименования ее файла. В 1990 г. Тим Бернерс-Ли, участвовавший в Европейском совете по ядерным исследованиям в Женеве, придумал URL, на тот момент представлявший собой адрес расположения файлов.

Вместе с явными достоинствами URL имеет существенный недостаток. В нем могут использоваться только латинские буквы и некоторые символы в адресе. В противном случае под влиянием особого алгоритма адрес кодируется в шестнадцатеричном представлении, что значительно ущемляет другие языки. Для этого используется международный индикатор сайтов IRI, позволяющий прописывать любые символы Юникода. Длину URL ограничивают только браузеры. Не рекомендуется использовать больше 2048 символов.

Структура URL сайта

Изначально для URL-адреса была заложена понятная, удобная и легко расширяемая структура. Традиционная форма представлена следующим образом:

Каждый идентификатор имеет свое назначение.

  • Схема – протокол, который будет использоваться для передачи данных. Например, стандартный http, защищенное соединение https, ftp – передача файлов по TCP-сетям и другие.
  • Логин и пароль – конфиденциальные данные, которые определяют права доступа пользователя к конкретному ресурсу. Не указываются в протоколе http. Например, используются в ftp для авторизации на сервере.
  • Хост – доменное имя или IP-адрес, на котором расположен сервер, сайт.
  • Порт – используется в основном для подключения к ftp, а в http не указывается и проставляется автоматически как 80, 8080.
  • URL-путь – точный адрес к конкретному файлу (странице).
  • Параметры – отдельные запросы, посылаемые методом GET на сервер с передаваемыми значениями параметров.
  • Якорь – это уникальная строка на странице, которой заранее присваивается URL-идентификатор со знаком #. При нажатии на ссылку с якорем пользователь попадает сразу в нужный фрагмент текста. Активно используется на форумах, в комментариях, в заголовках для быстрой навигации.

Схемы (протоколы) URL

На 2017 год разработано и введено огромное количество протоколов как для передачи файлов в разных сетях, так и для быстрого взаимодействия с определенными сервисами, программным обеспечением в сети. Схемы делятся на 3 категории.

Общепринятые:

  • ftp – передача данных через FTP-клиент;
  • https – протокол с шифрованием;
  • mailto – запуск почтовой службы и отправка писем;
  • xmpp – протокол XMPP в Jabber и других клиентах.

Экзотические:

  • skype – взаимодействие с программой Skype;
  • ednk – протокол файлообменника eDonkey;
  • bitcoin – биткоин;
  • steam – сервис цифровых покупок Steam, быстрое подключение к серверам игр;
  • tg – мессенджер Telegram.

Протоколы в браузерах:

  • opera – служебные настройки и страницы браузера Опера;
  • browser – служебные настройки и страницы браузера от Яндекса;
  • chrome – служебные настройки и страницы Google Chrome.

Мы перечислили лишь основные примеры протоколов URL для каждой категории, но на самом деле их значительно больше.

Кодирование URL

Для кодирования адресов используется набор символов US-ASCII, но его ограничение имеет существенные недостатки. Он предусматривает взаимодействие только с буквами латиницы и некоторыми символами. Для поддержки кириллицы используется перекодировка.

Реализация. Если системе необходимо перекодировать кириллицу в латиницу, преобразование осуществляется в 2 этапа.

  • Все символы кодируются в формате UTF-8 в определенной последовательности из 2 байтов.
  • Вся последовательность кодированных байтов записывается в шестнадцатеричной системе исчисления с использованием знака процента (%).

Стандарт IRI. Так как использование символов в URL ограничено только латиницей, это ущемляет права других стран и народов, поэтому данную проблему можно решить с помощью стандарта IRI, который расшифровывается как «международный идентификатор ресурсов». Он был закреплен в 2005 году как альтернатива URL, в котором могут использоваться любые символы и буквы Юникода.

Инициатива PURL

Одна из существенных проблем, которая наблюдается в использовании URL сайта, – это отсутствие какой-либо гибкости. Например, вы выложили информацию в Интернете по определенному адресу, разослали письма друзьям, разместили ссылки на других сайтах, но в какой-то момент поменяли его. В итоге пользователи, которым вы ранее сообщали о рабочем URL, смогут перейти на нужную страницу только в том случае, если корректно настроен редирект.

Технология PURL предназначена для того, чтобы создать общий каталог, где будут храниться все URL. Пользователь обращается к PURL, сервер автоматически находит нужный URL, и система переадресовывает человека по адресу, который ему был нужен. Если же адрес поменяется, то достаточно изменить запись в базе данных PURL.

Виды URL

URL с идентификатором сессий. У адреса может быть отдельный идентификатор SID, который автоматически добавляется при каждом посещении страницы разными пользователями. В основном такие URL используются для массового сбора статистики о посетителях и их поведении для дальнейшего анализа.

Статические URL. Информация на странице постоянна и не меняется. Используются для формирования качественного контента на сайте.

Динамические URL. Генерируют информацию автоматически в зависимости от запросов пользователей. В основном используются в скриптах для фильтрации контента, вывода различных форм поиска и прочих удобств навигации. Поисковые роботы обычно игнорируют динамические URL и не индексируют их.

Формирование ЧПУ

ЧПУ – это тоже пример URL, который переводится как «человекопонятный URL». Используется во многих CMS благодаря встроенным инструментам или дополнительным модулям и плагинам. Приводит вид URL к понятной и логической структуре, например site.ru/content/car.

С помощью ЧПУ легче создавать и отслеживать структуру сайта, изменять URL, вести аналитику в панели веб-мастера. В адресе могут использоваться только латинские буквы и некоторые символы.

Интернет был бы бессмысленным, если бы не было сайтов. Именно по сайтам мы ходим во время «прогулки» по всемирной сети. Что же такое сайт? Сайт – это электронная страница или несколько таких страниц с определенной информацией. Каждый сайт имеет свой уникальный ip-адрес. Он тоже представлен в цифровом выражении – 158.14.136.367. Такие адреса нужны машинам, браузерам. Однако, такие адреса весьма неудобны для нас, людей. Представляете сколько было бы нужно запоминать цифр, чтобы открыть необходимый сайт? А если нужно запомнить 10-100 сайтов? Так можно и с ума сойти. Поэтому были придуманы DNS-сервера. Этот сервер присваивает конкретному ip-адресу доменное имя. Как это происходит на деле? Мы в браузере набираем адрес сайта, например адрес этого сайта, браузер отправляет запрос DNS-серверу. Он ищет ip-адрес, присвоенный этому домену, затем ищет хостинг где лежат файлы данного сайта. Хостинг же отправляет файлы в браузер, браузер их обрабатывает и мы видим сайт на экране монитора. Основные понятия для новичков, которые встречаются в этой статье:

Читайте также:  Выключение компьютера по таймеру командная строка

Доменное имя – это адрес сайта в символьном выражении.

Хостинг – ограниченный объем места на сервере для хранения и обработки файлов сайта.

Хостинг-провайдер (хостер) – компания, которая предоставляет вам хостинг. В зависимости от тарифного плана, объем хостинга может быть разным.

Браузер – (по-английски «browser» – обозреватель) программа, которая позволяет просматривать сайты.

Уровни домена

Давайте рассмотрим доменное имя этого сайта www.mail.ru Из чего оно состоит? Думаю, это будет интересно для новичков.

ru – зона домена. Часто выступает как идентификатор страны, к которой принадлежит сайт. Называется доменом первого уровня.

mail.ru – непосредственное имя сайта. Домен второго уровня.

www – префикс от всемирной паутины (англ. World Wide Web). Его можно не вводить в адресную строку браузера.

Есть еще домен третьего уровня. Предположим, у вас есть форум и располагается на поддомене основного домена – www.forum.mail.ru В этом случае forum.mail.ru будет являться доменом третьего уровня.

Также домены третьего уровня можно встретить на сайтах, созданных на специальных сайтах-конструкторах таких как www.ucoz.ru, google.com и других. В таком случае, домен сайта, предположим auto.ucoz.ru, тоже будет доменом третьего уровня.

Подписыватесь на наш Telegram-канал, чтобы не пропустить свежие статьи с нашего сайта

Если вам понравилась наша статья, поделитесь с вашими друзьями.

Здравствуйте, уважаемые читатели блога Goldbusinessnet.com. Продолжаем изучение важнейших составляющих интернета, и на очереди у нас понятие «URL адрес» (урл по-простому), который юзеры вводят в адресную строку браузера (какой веб-обозреватель лучше?) в чистом виде.

И именно URL является базовым параметром атрибута href, с помощью которого создаются гиперссылки, входящие в состав гипертекста как основы Мировой Паутины. Благодаря урлу пользователи получают возможность посетить нужный сайт и получить искомую информацию.

По большому счету, «URL» связан с терминами «URI» и «URN», краткое объяснение сути которых я, безусловно, дам в ходе этой публикации. Кроме этого, мы разберем, из чего состоят урлы на наглядных примерах, какого вида они бывают и как находить адреса изображений, страниц сайта, видео и копировать их для своих нужд.

Что такое URL адрес и из чего он состоит?

Итак, начнем с самого начала, то есть с URI (Uniform Resource Identifier), аббревиатура которого в переводе с английского означает «Унифицированный идентификатор ресурса». Это уникальный набор символов, позволяющий идентифицировать любой ресурс в интернете: страницу сайта, файл, электронный почтовый ящик и т.д.

Составляющими URI являются URN (Uniform Resource Name — Унифицированное Наименование Ресурса) и URL (Uniform Resource Locator — Унифицированный Указатель Ресурса). Первый идентифицирует конкретный веб-ресурс по его названию в пространстве имен, а второй указывает на его местоположение в сети и обеспечивает доступ к нему посредством конкретного метода. Схематически это можно изобразить так:

URI является более общей системой идентификации. Она может включать в себя либо URN, либо URL, либо оба идентификатора вместе. То есть, URN и URL являются частными случаями URI. Попробую объяснить, что значит каждый термин, на наглядном примере из реальной жизни.

Допустим, имеется адрес (г. Нижний, ул. Верхняя, д.4, кв.15), до которого можно добраться разными способами в зависимости от степени удаления пункта отправления. Имя владельца квартиры Василий Васильевич Пупкин.

Возьмем за основу все население города Нижний, где каждый имеет свое имя (причем полные тезки также могут быть идентифицированы, поскольку имеют паспорт с уникальным номером). Тогда именное пространство можно назвать «Жители Нижнего», а В.В.Пупкин — уникальное имя в нем. Тогда «В.В.Пупкин» + «паспортные данные» и составит URN.

Скажем, сосед Пупкина доберется к нему пешком (это будет в данном случае методом доступа к объекту). А родственнику, живущему за несколько тысяч километров, придется задействовать комплексный вариант (прилететь на самолете, приехать по нужному адресу на такси и дойти оставшееся расстояние пешком). Способ доступа в этом случае будет другим (самолет – такси – пешком). В контексте выше сказанного это и есть URL (адрес + метод доступа к объекту).

Ну а полная информация, включающая адрес и имя находящегося по этому месту жительства человека — URI. Конечно, это в известной степени упрощенние, но зато оно помогает постичь суть без излишнего напряжения мысленных ресурсов.

Нас интересует в первую очередь унифицированный указатель, поскольку именно он является основной идентификационной системой, используемой широко на практике в глобальной сети. Поэтому далее мы и уделим основное время описанию структурных особенностей URL.

Структура УРЛ и его важные особенности для сведения вебмастеров

Итак, мы с вами определили в общих чертах, что же такое URL адрес. Это путь до любого файла (вебстраницы сайта, картинки, видео и др.). Начнем с простого примера. Вот как может выглядеть локатор в общем виде для одного из файлов, находящегося в определенной директории (папке):

В качестве реального примера привожу урл адрес файла, который содержит логотип этого блога:

Помните, чуть выше я упомянул, что URL содержит не только указание на конкретное местонахождение объекта в сети, но и то, каким способом можно получить к нему доступ? Так вот, протокол HTTP, стоящий в самом начале унифицированного указателя, как раз и является инструментом, помогающим открыть файл по указанному адресу в браузере.

Читайте также:  Блок питания aerocool strike x 800

У протокола передачи данных HTTP есть вариант HTTPS, обеспечивающий защищенное соединение и к переходу на который в последнее время склоняют вебмастеров поисковики, особенно Гугл (что, впрочем, будет благом для всех, особенно для коммерческих ресурсов и проектов, где используется передача персональных данных пользователей).

Но вернемся к нашему примеру. После обозначения типа протокола «http://» (а в общем случае способа доступа, поскольку в урлах не всегда применяется протокол, но об этом ниже) идет уникальное название домена (читайте о доменных именах и о том, как их зарегистрировать). Кстати, доменное имя может быть указано и с WWW:

Тогда наблюдается присутствие в интернете двух разных ресурсов (с WWW и без) с одинаковым содержанием. С точки зрения поисковиков это зеркала, являющиеся по своей сути дублями, которые жутко мешают продвижению.

К тому же, обратные ссылки, проставленные на ваш сайт, могут быть распределены в неизвестных пропорциях между зеркалами. Поэтому необходимо предпринять действия по определению главного домена и склейке зеркал, в том числе посредством 301-ого редиректа.

С доменным именем мы разобрались. Кстати, при создании сайта домен вашего проекта будет считаться корневой папкой с точки зрения файловой структуры сервера. Вследствие этого цепочку после двойного слэша можно воспринимать как последовательность вложенных друг в друга папок (их может быть несколько), где на конце урла находится нужный файл:

Этот файлик идентифицируется по его названию и расширению, в нашем примере это «file.extension». Причем, расширение может быть самым различным (html, php, png и т.д.).

Но здесь надо иметь ввиду, что на серверах обычно используются Unix-подобные ОС, где, в отличие от Windows, расширения для файлов не являются обязательными и часто не используются, поэтому запись «file.extension» может вполне быть принята за название файлика с точкой посередине. Эта информация нам может пригодиться в дальнейшем.

Для полноты картины нужно еще упомянуть об адресах страниц сайтов в интернете. Чаще всего встречаются урлы трех основных видов (ЧПУ), которые наиболее предпочтительны при раскрутке веб-проекта:

Вроде бы, первый вариант больше всего отвечает разобранной нами схеме. Но в случае с URL страницы не все так однозначно. В теории это состоит следующим образом (попробую объяснить все на примере обычного блога, по-моему, он достаточно наглядный и понятный большинству).

Основываясь на приведенном мною в самом начале данного раздела статьи общем примере урла, можно было бы рассуждать следующим образом. В соответствии с иерархией в блоге роль подпапок играют разделы (рубрики или категории) ресурса, в которые включены отдельные страницы (файлы). Ну а главная страница — это основная папка (корень сайта в файловой структуре сервера), содержащая рубрики.

При стандартных серверных настройках каждый URL, соответствующий каталогу (папке), должен заканчиваться слэшем, в этом случае обработчик "поймет", что необходимо отобразить листинг всех файлов, которые там содержатся, а не какой-то конкретный объект, поиск которого будет осуществляться, если слеша не будет (таким образом вы экономите реурсы сервера).

В соответствии с этими рассуждениями локатор главной должен заканчиваться «/», поскольку домен является корневой директорией:

По этой же причине такой же вид урла соответствует рубрикам сайта:

А вот статические или страницы записей выводятся в таком обличье:

Помните, чуть выше я упоминал о двух легитимных вариантах существования файлов в Unix-подобных операционных системах (с расширением и без)?

Однако, подобные рассуждения не совсем корректны в том числе потому, что подавляющее большинство современных сайтов работают под управлением CMS, которые генерируют странички сайта динамически "на лету" на базе имеющихся шаблонов с расширением .php, включающих комплекс соответствующих функций.

Все шаблоны, отвечающие за формирование различных страничек сайта (главной, рубрик, вебстраниц записей и т.д.) входят физически в одну директорию текущей темы WordPress. Таким образом, содержание всех названных страниц в конечном виде существует лишь при просмотре в браузере, а не физически на сервере. К слову, с файловым строением темы вы можете познакомиться в этой статье, материал которой даст вам дополнительные сведения.

Кто привык копать глубоко и желает более подробно изучить этот архиважный аспект, отсылаю вас к очень качественному материалу, где он освещается на основе первоисточника в виде спецификации общего синтаксиса URL, и в котором красной нитью проходит утверждение, что урл вообще (вне зависимости от своего содержания) указывает на абстрактное местоположение ресурса, а не на его конкретное физическое расположение.

Резюмируя и суммируя все приведенные доводы, могу утверждать, что с точки зрения синтаксиса все образцы рассмотренных урлов для страниц сайта (со слешем на конце, без него и с расширением .html) вполне корректны и пригодны для использования.

Более того, ни один из них не имеет сколь-нибудь заметного преимущества в глазах поисковых систем. Единственное, для обеспечения правильной индексации надо также установить 301 редирект в случае применения URL со слешем или без в конце.

Надеюсь, что предоставленная информация поможет вам определиться с настройкой урлов на своем сайте. Для проектов, работающих на WordPress, например, постоянные ссылки сайта можно легко настроить в соответствующем разделе админ-панели.

Важное замечание! Настройку ссылок желательно производить в самом начале создания проекта, дальнейшие изменения могут замедлить или приостановить продвижение сайта, поскольку переиндексация у поисковиков не происходит мгновенно.

Выше мы рассмотрели частные случаи различных типов локаторов, ну а общая блок-схема, демонстрирующая структуру URL, выглядит следующим образом:

Пожалуй, следует дать некоторые разъяснения по отдельным составляющим.

Схема. Как я уже отмечал выше, не всегда средством передачи данные служит протокол, хотя это наиболее распространенный вариант. Эту роль вполне может играть псевдопротокол (например, тот же mailto, являющийся средством отправки сообщения по электронной почте):

Вообще, для полноты информации вы можете ознакомиться с перечнем используемых схем на соответствующей страничке Википедии.

Читайте также:  Как восстановить iphone из другой резервной копии

Кроме HTTP и HTTPS вебмастерами и разработчиками очень часто применяется на практике и FTP (тут об этом протоколе необходимые подробности), который очень удобен при работе с файлами своего проекта на сервере хостинга (что это такое и как купить место для сайта), если при этом воспользоваться помощью соответствующей программы (например, Файлзилла).

В таком случае для доступа к нужному файлу или папке понадобиться указать логин и пароль, а также порт (если он отличен от стандартного, применяемого по умолчанию):

Здесь в качестве хоста указано имя домена («goldbusinessnet.com»), но вполне может быть использован и IP-адрес, который идентифицирует устройство в сети интернет (тут о взаимодействии ай-пи адресов, ДНС и доменных имен). Ну а «folder1/file.extansion» — это уточняющий URL-путь до объекта.

Для вебмастеров еще один нюанс заключается в том, что любой движок может генерировать локаторы, в которых присутствуют так называемые GET-параметры, следующие после знака «?» в конце урлов. Если параметров несколько (каждый из них может иметь свое значение), то они разделяются знаком «&»:

Страниц с такими адресами на сайте может набраться достаточное количество, причем их контент может быть тождественным с основными вебстраницами. Те, кто имеет свои блоги на Вордпрессе, вполне могут столкнуться с ситуацией, когда наличие древовидных комментариев инициирует генерирование урлов с replytocom:

А это и есть самые настоящие дубли, большое количество которых способно существенно снизить скорость индексирования страничек, а, значит, и косвенным образом замедлить продвижение веб-ресурса. Поэтому, думаю, будет уместным в этом месте дать ссылку, перейдя по которой вы узнаете, как бороться с самым разнообразным дублированным контентом на Вордпресс.

Если есть цель улучшить навигацию и направить посетителя не просто на нужную страницу, но в определенное место на ней, где есть искомая информация, то используют якорь (по-английски anchor), с помощью которого создаются хеш-ссылки:

К выше сказанному следует добавить, что в стандартных урлах рекомендуется использовать лимитированную выборку знаков: буквы латинского алфавита в нижнем регистре [a-z], цифры [0-9], точку [.], нижнее подчеркивание [_], и дефис [-].

Такие ограничения действуют со времени зарождения интернета, но с некоторых пор ввиду развития глобальной сети появилась необходимость формировать URL с применением символов национальных языков, включая русский. Такая возможность появилась, но для ее реализации требуется кодировка (encoding) любых знаков в формате ASCII, который понимают браузеры.

Кодирование и декодирование URL

Итак, после некоторых предпринятых соответствующими международными организациями усилий любой сайт может использовать для адресов своих страниц локаторы, включающие буквы практически любого языка. Нас интересует русский, поэтому можете проверить сие утверждение, введя в адресную строку браузера урл одной из страниц Русской Википедии:

Адрес корректно отобразится:

А после нажатия кнопки «Enter» откроется соответствующая страничка. Теперь попробуйте скопировать этот адрес в буфер обмена и вставить его в любой документ (например, в блокнот Windows). Получится такой набор:

Это и есть закодированные русские буквы, которые web-браузер автоматически преобразует в читабельный текст на кириллице. Кстати, в сети есть немало сервисов, которые предлагают быстрое кодирование и декодирование содержания URL, например, вот этот:

Конечно, для пользователей рунета гораздо более привлекательным является текст на русском, содержащийся в локаторе (кстати, и доменное имя может быть кириллическим).

Однако, формировать урлы на кириллице для страниц своего сайта я все-таки советую только в том случае, если ваш проект имеет какие-то свои особенности, вследствие которых именно русские символы в URL будут эффективнее привлекать посетителей, особенно целевую аудиторию.

В других случаях все же оптимальнее будет применять латиницу (а для WordPress использовать плагины транслитерации для автоматического преобразования русских букв в постоянных ссылках в латинские), поскольку это исключает некоторые возможные ошибки, а поисковые системы не делают языковых предпочтений в этом аспекте при ранжировании.

Как узнать URL адрес изображения, видео или страницы сайта?

При работе в интернете да и просто во время сёрфинга или поиска информации в сети очень часто нужно просмотреть или скопировать адрес того или иного объекта. Где же взять нужный урл на открытой в браузере веб-страничке? Что касается URL страницы сайта, то его можно подсмотреть в адресной строке:

Правда, если данные передаются по обычному протоколу HTTP, то он, скорее всего, будет скрыт. Однако, если вы выделите урл, щелкните по нему правой кнопкой мышки и скопируете, выбрав из появившегося контекстного меню нужный пункт:

То после его вставки в нужное место он будет отображаться полностью (включая протокол «http://»). В случае использования владельцами веб-ресурса HTTPS локатора, соответствующего защищенному соединению, адрес страницы будет доступен в полном виде сразу же:

С помощью того же контекстного меню можно найти и скопировать также URL нужной вам гиперссылки, содержащейся в тексте:

Иногда нужно узнать урл размещенной в web-пространстве картинки. Для этого опять используйте тот же метод:

Только имейте ввиду, что если будете «Копировать картинку», то в буфер обмена поместите не ее URL, а само изображение, которое потом можете вставить в необходимое место.

Точно также есть возможность узнать и скопировать адрес видео. Ежели находитесь, например, в пределах Ютуба на странице с видеороликом, то это делается либо из адресной строки браузера, либо в разделе «Поделиться», находящемся чуть ниже ролика:

В случае присутствия видео в контенте веб-странички его URL- адрес можно получить с похожей легкостью (достаточно щелкнуть правой кнопкой мыши прямо по плейеру):

Таким вот образом вы легко можете получать и копировать URL-адрес практически любого объекта. Кстати, контекстное меню может принимать различный вид в зависимости от применяемого веб-браузера, но суть его опций остается практически идентичной.

admin

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *