В соответствии с Законом от 20 февраля 1995 г. № 224-ФЗ «Об информации, информатизации и защите информации» под термином «информация» понимаются сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Специалисты в области теории познания утверждают, что человек познает реальный мир через объекты, свойства и отношения. Лица, предметы, факты, события, явления и процессы являются классами объектов. Предметная область — это классы объектов, информация о которых необходима в данном виде деятельности человека. В каждой предметной области потребителей интересует четко определенный перечень свойств и глубина описания этих свойств. Очевидно, что перечни интересующих потребителя свойств о лице в экономике и в медицине будут различны.
Информация о предметной области, то есть об объектах и их связях, может быть представлена в Двух видах: формализованном и в виде текста на естественном языке.
Формализованное описание конкретного объекта включает имя свойства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает ту грамматическую роль, которую играет значение этого свойства по отношению к данному классу объектов.
Формализованное описание объекта во многом схоже с анкетной формой описания объекта.
Так, например, если описаны два объекта: фирма и товар, — то между ними устанавливается связь — отношение, указывающее, что данная фирма выпускает этот товар.
Формализованный язык описания предметной области выполняет следующие основные функции:
позволяет источнику отбирать лишь ту информацию и описывать ее так, как это необходимо потребителю;
позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста в данной предметной области;
позволяет в информационных системах по указанию потребителя производить автоматическую обработку формализованной информации;
существенно облегчает поиск необходимой информации в базах данных.
Другим видом информации о предметной области является информация, представленная в виде текста на естественном языке.
Представления — это чувственно наглядные образы объектов реального мира. Источником формирования представлений являются психологические процессы ощущения и восприятия, а также информация, получаемая от других членов общества в процессе общения.
Понятия образуются в результате логического осмысления представлений об объектах реального мира и являются формой абстрактного мышления, отражающей и фиксирующей существенные признаки данных объектов.
Язык — это средство, с помощью которого люди передают друг другу информацию о реальном мире.
Таким образом, общими недостатками естественного языка с позиций оценки эффективности поиска являются избыточность и недостаточность.
Избыточность проявляется в следующем:
1) активную роль в процессе передачи содержания текста играют только некоторые слова или словосочетания, так называемые ключевые слова. Другие можно отбросить практически без ущерба для понимания смысла;
2) в естественном языке используются синонимы, то есть слова, различающиеся по звучанию и написанию, но тождественные или близкие по смыслу;
3) имеет место неоднозначность выражения, то есть возможность выразить одну и ту же мысль словами, не являющимися синонимами (например, «уменьшение сопротивления» — «увеличение проводимости»).
Недостаточность выражения на естественном языке проявляется в следующем:
1) многозначность отдельных слов — омонимия (совпадение по звучанию и написанию разных по значению слов). Например, «ключ» (для двери), «ключ» (источник);
2) эллипсность естественного языка. Под эллипсностью понимается пропуск в тексте подразумеваемых слов.
Из-за недостатков естественного языка, отмеченных выше, документальные информационные системы не дают ответа на вопрос потребителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самому выявить смысловое содержание этих документов.
Структура Интернет.
Интернет состоит из множества локальных и глобальных сетей, принадлежащих различным компаниям и предприятиям, работающих по самым разнообразным протоколам, связанных между собой различными линиями связи, физически передающих данные по телефонным проводам, оптоволокну, через спутники и радиомодемы.
Локальные сети различных стран финансируются и управляются местными органами согласно политике данной страны.
Узлы Интернет, связанные высокоскоростными линиями связи, составляют базис Интернет. Как правило, это поставщики услуг (провайдеры). Оцифрованные данные пересылаются через маршрутизаторы, которые соединяют сети с помощью сложных алгоритмов, выбирая маршруты для информационных потоков.
Такой адрес называется IP-адресом.
IP-адрес бывает только у одного пользователя П:ОМКС 653941
Доменное имя - это уникальное имя, которое данный поставщик услуг избрал себе для идентификации, например: ic.vrn.ru или yahoo.com
Когда вводится доменное имя, например, www.mrsu.ru, компьютер должен преобразовать его в адрес. Чтобы это сделать, компьютер посылает запрос серверу DNS, начиная с правой части доменного имени и двигаясь влево. Его программное обеспечение знает, как связаться с корневым сервером, на котором хранятся адреса серверов имён домена первого уровня (крайней правой части имени, например, ru). Таким образом, сервер запрашивает у корневого сервера адрес компьютера, отвечающего за домен ru. Получив информацию, он связывается с этим компьютером и запрашивает у него адрес сервера mrsu. После этого от сервера mrsu он получает адрес www компьютера, который и был целью данной прикладной программы.
Для идентификации служб используются порты. Порт - это число, которое добавляется к адресу компьютера, которое указывает на программу, для которой данные предназначены. Каждой программе, запущенной на компьютере, соответствует определенный порт, и она реагирует только на те пакеты, которые этому порту адресованы.
В Интернет используются не просто доменные имена, а универсальные указатели ресурсов URL (Universal Resource Locator).
URL включает в себя:
- метод доступа к ресурсу, т.е. протокол доступа (http, gopher, WAIS, ftp, file, telnet и др.);
- сетевой адрес ресурса (имя хост-машины и домена);
- полный путь к файлу на сервере.
В общем виде формат URL выглядит так:
method://host.domain[:port]/path/filename,
где method - одно из значений, перечисленных ниже:
file - файл на локальной системе;
http - файл на World Wide Web сервере;
gopher - файл на Gopher сервере;
wais - файл на WAIS (Wide Area Information Server) сервере;
news - группа новостей телеконференции Usenet;
telnet - выход на ресурсы сети Telnet;
ftp – файл на FTP – сервере.
host.domain – доменное имя в сети Интернет.
port - число, которое необходимо указывать, если метод требует номер порта.
Сервер в сети Интернет - это компьютер, обеспечивающий обслуживание пользователей сети: разделяемый доступ к дискам, файлам, принтеру, системе электронной почты. Обычно сервер - это совокупность аппаратного и программного обеспечения.
Сайт - обобщенное название совокупности документов в Интернет, связанных между собой ссылками.
Шлюз (gateway)- это компьютер или система компьютеров со специальным программным обеспечением, позволяющая связываться двум сетям с разными протоколами.
Домашняя страница - это персональная Web-страница конкретного пользователя или организации.
Принципы выбора провайдера.
Если нужна только почта в небольших объемах, и задержка в десятки минут не критична, можно смело подключаться к любому провайдеру - большинство провайдеров вполне справятся с обменом электронной корреспонденцией. В этом случае важна легкость дозвона к провайдеру, этим будет в основном определяться оперативность обмена почтой.
У первичных провайдеров как правило качество работы выше, чем у вторичных.(у первичного провайдера есть внешний канал за пределы города, а вторичный провайдер не имеет своих внешних каналов, и сам подключен к первичному... AFAIK...).
Провайдер (первичный) почти всегда публикуют у себя на сайте *свои технические данные и даже открыто показывают свою статистику. И наоборот - вторичные провайдеры с неохотой рассказывают о своих каналах, а статистику загрузки скрывают...
Но кроме толщины каналов еще важна их реальная загрузка. К сожалению, четких критериев оценки качества со стороны нет. Единственным более менее надежным способом может быть только собственная проверка.
Многие провайдеры предоставляют желающим по просьбе тестовый вход бесплатно. Но тестировать провайдера желательно именно в те часы, когда собираемся реально работать. Качество работы очень сильно зависит от времени суток и даже дня недели. Самый лучший вариант - оплатить несколько тестовых часов и проверять работу в удобное время.
Загруженность телефонных линий провайдера легко проверить еще до подключения, просто позвони несколько раз на модемные телефоны провайдера в нужное время, если часто слышим "занято" вместо ответа модема - значит подключаться к такому провайдеру не стоит
Советы:
При выборе провайдера руководствоваться надо только собственными тестами, а не советами со стороны.
Не подключаться к провайдеру с единственным внешним каналом - в случае сбоев запасных вариантов не будет. Если провайдер скрывает информацию о своих каналах и статистику - это повод для сомнений.
Определяемся исходя из своих запросов с тарифным планом.