Персональная информация на русском языке. Формулы запросов. Кузнецов С.В. Кузнецов Сергей Валентинович
<<<<Кузнецов Сергей ВалентиновичИсследование рисков и поиск возможностей через Интернет. Введение Карта сайта ONLINECI.RU СловарьОбучение Консультирование >>>>

Формулы запросов …

Персональная информация на русском языке

1. Введение.
2. Параметры формулы.
3. Фамилия не известна.
4. Известна фамилия, имя и отчество не известны.
5. Известны фамилия и имя.
6. Известны фамилия, имя и отчество.
7. Досье на персону.

1. Введение. Формула запроса – элемент авторской системы программирования запросов для полнотекстового поиска. Формула запроса записывается в синтаксисе конкретной поисковой системы и фиксирует только логику запроса, решающего задачу нахождения необходимой текстовой информации. В отличие от поискового шаблона формула запроса не содержит никакой лексики, кроме подставляемой (т.н. параметры формулы). Все параметры в приведенных ниже формулах запросов начинаются со знака «решетка». Формулы заполняются значениями параметров в любом текстовом редакторе операцией «найти и заменить» все вхождения. Признак полного заполнения формулы - отсутствие знаков «решетка» в тексте. Дополнительно см. п.4.1.8. Статьи «Технологии управления знаниями».

2. Параметры формул. Установочные признаки персоны можно условно разделить на уникальные (фамилия имя отчество, номер и серия паспорта, номер сотового телефона, адреса электронной почты и т.п.) и дополнительные (дата рождения, место проживания, прописки, учебы, работы, профессия, ученая степень, квалификация, увлечения, связи, судимости, прозвища и клички и т.п.). В отличие от дополнительных установок уникальные признаки, как правило, сами по себе достаточны для точного поиска персональной информации. Все уникальные признаки включаются в запросы-досье.

Параметры формул запросов для поиска персональной информации:
1) #Фамилия – фамилия в именительном падеже единственного числа (первая буква - прописная), например, Ионов;

2) #Имя – имя в именительном падеже единственного числа (первая буква - прописная), например, Иуда;

3) #Отчество – отчество в именительном падеже единственного числа (первая буква - прописная), например, Вольфович;

4) #И1 – инициал-1 (прописная буква) имени, например, И;

5) #И2 – инициал-2 (прописная буква) отчества, например, В;

6) #ДУП – дополнительный установочный признак персоны, например, место работы и должность – менеджер по персоналу департамента корпоративных информационных систем IBS.

В случае «зацепления» конкретной поисковой системой неподходящих словоформ (например, для фамилии «Скалозубов» - это «Скалозубова», «Скалозуб», «Скалозубами» и т.п.), ищите только подходящую словоформу (лучше, единственное число именительный падеж).

Артефакт (http://www.integrum.ru)

#Фамилия

Рамблер (http://www.rambler.ru)

"#Фамилия"

Яндекс (http://www.yandex.ru)

!#Фамилия

3. Фамилия не известна.

Если даже фамилия интересующей персоны не известна, изучайте (ищите по аналогии) все известные ситуации, где она может появляться, установочные признаки и связи. Например, известна должность и название предприятия – применяем метод исчерпания лексических контекстов для построения реестра вероятных фамилий интересующего объекта. Из полученного списка кандидатов оставляем только лиц, имеющих наибольшее число известных дополнительных установочных признаков. Применяйте агентские технологии: если известно название предприятия и должность – уточните телефон секретаря и спросите у него ФИО интересующего сотрудника.

4. Известна фамилия, имя и отчество не известны.

4.1. Если фамилия очень редкая и не многозначная – можно начать с поиска без инициалов через метапоисковые системы (в поисковом запросе для любых поисковых систем задается только конкретная словоформа - фамилия с заглавной буквы в именительном падеже).

4.2. Если фамилия достаточно распространенная, ищите ее в контексте с дополнительными установочными признаками, например, Сидоров из отдела маркетинга ОАО «Лукойл Оверсиз». Пример многозначной фамилии – «Балашов» (фамилия и название города в Саратовской области РФ).

Google.com (ищет без морфологии, используйте генераторы словоформ)
#Фамилия #ДУП
Формулы для других поисковых систем не приводятся...

4.3. Поиск имени. Если фамилия достаточно распространенная, изучайте все варианты имени, используя приведенные ниже формулы и метод исчерпания лексических контекстов. Из полученного списка кандидатов оставляем только лиц, имеющих известные дополнительные установочные признаки.

Google.com (ищет без морфологии, используйте генераторы словоформ)

#Фамилия –имя1 –имя2 –имя3
Формулы для других поисковых систем не приводятся...

5. Известны фамилия и имя.

5.1. Если связка «фамилия имя» достаточно распространенная, ищите ее в контексте с дополнительными установочными признаками, например, Кулешов Анатолий - сотрудник ЗАО «Элкомсофт».

Google.com (ищет без морфологии, используйте генераторы словоформ)

#ДУП "#Фамилия #Имя" OR "#Фамилия #И1" OR "#Имя #Фамилия" OR "#И1 #Фамилия" OR "#Имя * #Фамилия" OR "#И1 * #Фамилия"

Формулы для других поисковых систем не приводятся...

5.2. Если фамилия в контексте с именем не многозначна, примените следующие формулы запросов:

Google.com (ищет без морфологии, используйте генераторы словоформ)

"#Фамилия #Имя" OR "#Фамилия #И1" OR "#Имя #Фамилия" OR "#И1 #Фамилия" OR "#Имя * #Фамилия" OR "#И1 * #Фамилия"

Формулы для других поисковых систем не приводятся...

5.3. Поиск отчества. Если фамилия в контексте с именем часто цитируется и многозначна, изучите все варианты отчества, используя приведенные ниже формулы и метод исчерпания лексических контекстов. Из полученного списка кандидатов оставляем только лиц, имеющих известные дополнительные установочные признаки.

Google.com (ищет без морфологии, используйте генераторы словоформ)

"#Фамилия #Имя" OR "#Фамилия #И1" OR "#Имя #Фамилия" OR "#И1 #Фамилия" OR "#Имя * #Фамилия" OR "#И1 * #Фамилия" -отчество1 -отчество2 -отчество3

Формулы для других поисковых систем не приводятся...

6. Известны фамилия, имя и отчество.

6.1. Если фамилия, имя, отчество широко распространены, ищите их в контексте с дополнительными установочными признаками.

Google.com (работает без морфологии)
"#Фамилия #Имя #Отчество" OR "#Имя #Отчество #Фамилия" OR "#Фамилия #И1 #И2" OR "#И1 #И2 #Фамилия" #ДУП

Формулы для других поисковых систем не приводятся...

6.2. Если связка «фамилия, имя и отчество» не многозначна, примените следующие формулы запросов:
Google.com (работает без морфологии)
"#Фамилия #Имя #Отчество" OR "#Имя #Отчество #Фамилия" OR "#Фамилия #И1 #И2" OR "#И1 #И2 #Фамилия"

7. Досье на персону. Для устранения дублирований при возможности все работоспособные запросы объединяются в минимальное количество запросов-досье. После этого для работы на любых русскоязычных поисковых системах и базах данных формируется универсальная поисковая спецификация. При необходимости готовится реестр проблемно-ориентированных баз данных и включается мониторинг персональной информации по открытым источникам.

Задание (выполняется на занятиях или дома):
  1. Найдите ошибки в приведенных выше формулах поисковых запросов.

  2. Изучите возможности иных поисковых систем русского сегмента Интернет и подготовьте формулы запросов для поиска персональной информации.

  3. Изучите возможности глобальных поисковых систем Интернет, работающих с кириллическими текстами, и подготовьте формулы запросов для поиска персональной информации.

  4. Разработайте шаблоны Яндекс, Рамблер, Convera и др. поисковых систем для нахождения биографий.

  5. Составьте перечень движимого и недвижимого имущества Леонида Леонтьевича Белуги (Петрозаводск).

  6. Соберите личные данные, подготовьте персональное досье и запустите систему мониторинга персональной информации о важном для Вас человеке (непосредственный начальник, представитель заказчика, секретоноситель, топ-менеджер Вашей или конкурирующей компании…). Для выполнения проекта можно использовать п.3 инструкции «Технология проверки предприятий и персон…». И помните, что сбор персональных данных наказуем и Вы это задание придумали сами!

<<<<Кузнецов Сергей ВалентиновичИсследование рисков и поиск возможностей через Интернет. Введение Карта сайта ONLINECI.RU СловарьОбучение Консультирование >>>>

Опубликовано по адресу: http://www.onlineci.ru/1125.htm
Дата последнего редактирования 28.10.2013
© Кузнецов Сергей Валентинович


Сайты (Сергей Кузнецов / Кузнецов С.В.):
Всепроникающее обучение
Невидимый Интернет для бизнеса
Технологии производства баз знаний
Юридические исследования через Интернет
Бесплатные сервисы (Сергей Кузнецов / Кузнецов С.В.):
Поиск рыночных ниш через Яндекс
Выявление проблем через Яндекс
Поиск определений через Яндекс
Прочие генераторы поисковых запросов
Услуги (Сергей Кузнецов / Кузнецов С.В.):
Тематический мониторинг открытых источников
Профессиональный поиск информации
Поиск и мониторинг ниш на рынках
Технологические исследования через Интернет
Очные компьютерные тренинги
Дистанционное обучение
Об авторе: Резюме Сергея Кузнецова
Фотогалерея Сергея Кузнецова
Публикации и работы Сергея Кузнецова
Правила Сергея Кузнецова
Мифы о Сергее Кузнецове
Технологические работы Сергея Кузнецова
В разработке