Logo Cover

#Глава 3 Инструменты для онлайн-поиска и техники расследований

Пол Майерс — специалист по интернет-поиску информации BBC. К BBC присоединился в 1995 году в качестве исследователя новостной информации. Он также ведет сайт The Internet Research Clinic, предлагающий журналистам ссылки на лучшие статьи, приложения и ресурсы по теме сбора информации. В BBC Academy Пол проводит учебные курсы, связанные с интернет-расследованиями, журналистикой данных, свободой информации, использованием статистики, социальными медиа, веб-дизайном и созданием иллюстраций. Работал с ведущими программами, такими как Panorama, Watch-dog, с национальными новостными программами, BBC Online, с местным и национальным радио и Всемирной Службой BBC. Является также постоянным блогером сайта BBC College of Journalism. Помогал в обучении персонала The Guardian, The Daily Telegraph, The Times, «4 Канал», CNN, Всемирного Банка и Программы развития ООН (ПРООН). Поисковые системы являются неотъемлемой частью арсенала стандартно используемых инструментов по работе с «открытыми источниками». Эффективный поиск в Интернете в сочетании с социальными медиа, проверкой доменных имен и более традиционные решения типа газетных и телефонных справочников помогут вам найти жизненно важную информацию для поддержки вашего расследования.

Многие считают, что поисковые системы показывают разочаровывающие результаты из сомнительных источников. Тем не менее, некоторые уловки могут гарантировать, что вы, все же, выловите те страницы, которые ищете, с сайтов, которым можно доверять. То же самое и в отношении поиска информации о людях в социальных сетях и иных источниках. Немного стратегии и понимания того, как извлечь искомое, — и результаты обязательно улучшатся.

Данная глава сосредоточена на трех областях онлайн-расследований:

  • 1. Эффективный поиск в Интернете.
  • 2. Онлайн-поиск людей.
  • 3. Определение прав собственности на домен.
    • 1. Эффективный поиск в Интернете

      Поисковые системы вроде Google на самом деле не знают, о чем рассказывается на веб-страницах. Тем не менее, они знают, какие именно слова на страницах присутствуют. Поэтому, чтобы заставить поисковик вести себя хорошо, вы должны для начала предположить, какие именно слова наверняка встретятся на страницах, которые вы ищете.

      Во-первых, выберите с умом ключевые слова для поиска. Каждое слово, которое вы добавляете в поиск, уточняет результаты за счет того, что отметает те страницы, на которых нет нужных вам слов.

      Одни слова фигурируют на каждой из страниц, которые вы ищете. Другие на целевой странице могут присутствовать или нет. Таких вариативных ключевых слов старайтесь избегать, так как они могут скрыть из результатов полезные для расследования страницы.

      Используйте расширенный синтаксис поиска.

      Большинство поисковых систем имеют полезные, но скрытые функции, которые существенно помогают сфокусировать ваш поиск и улучшить результаты.

      Дополнительные ключевые слова

      Если у вас нет четко определенных ключевых слов, вы можете использовать вариации искомых терминов, не вредя результатам поиска. Например, страницы обсуждения употребления героина в Техасе могут не включать слова «Техас», они могут содержать лишь названия различных городов штата. Вы можете встраивать их в свой поиск как дополнительные ключевые слова, разделяя их словом «ИЛИ» (пишите OR заглавными буквами).

      Тот же метод можно использовать для поиска различных вариантов написания имени физического лица, компании или организации.

      Поиск через домен

      Вы можете сосредоточить свой поиск на конкретном сайте, используя комбинацию site: в поисковой строке, где после двоеточия нужно написать доменное имя сайта, на котором вы будете искать информацию.

      Например, чтобы ограничить поиск только результатами из Twitter:

      Чтобы добавить к поиску Facebook, просто используйте снова «ИЛИ» (OR):

      Этот прием можно использовать, чтобы сфокусироваться, например, на сайте конкретной компании. В таком случае Google будет показывать вам результаты поиска только с этого сайта.

      Можно также использовать его, чтобы сосредоточить свой поиск только на муниципальных и академических источниках. Это особенно эффективно при исследовании в странах, использующих уникальные типы доменов для сайтов государственных и образовательных организаций (как это делается в Великобритании, где домены формата ac.uk используются исключительно университетами, а gov.uk доступны только для сайтов государственных служб — прим. ред.).

      При работе с академическими веб-сайтами обязательно проверьте, кто наполняет контентом конкретный ресурс. Делает ли это университетская служба, кто-то из профессоров или студент. Как всегда, важен конкретный источник информации.

      Поиск по типу файлов

      Некоторая информация упакована в определенные типы форматов файлов. Например, статистические данные, цифры и данные часто представлены в электронных таблицах Excel. Профессионально созданные отчеты могут часто быть найдены в PDF-документах. Вы можете указать в поисковой строке конкретный формат, используя оператор «Тип файла» (filetype:), за которым следует нужное расширение файла данных (xls для электронных таблиц, docx для документов Word и т. д.).

      2. Поиск людей

      Группы людей можно легко найти в онлайне, но найти отдельного человека зачастую бывает сложнее. Начните с создания досье на человека, которого вы пытаетесь найти, узнайте о нем больше. Досье может включать в себя следующее:

      • Имя человека, учитывая: — разные вариации (зовет ли себя Джеймс «Джеймсом», «Джимом», «Джимми» или «Джеми»?);

      • написание иностранных имен на латинице (Yusef пишется как Yousef («Юсеф») или Yusuf («Юсуф»)?);

      • изменилось ли имя/фамилия с женитьбой/замужеством человека;

      • известно ли вам второе имя, отчество или инициалы.

      • Город, в котором человек живет или родился.

      • Должность этого человека и название его компании.

      • Имена его друзей и членов семьи, так как они могут фигурировать в списках друзей и фолловеров в социальных сетях.

      • Номер телефона, который сегодня можно найти на Facebook и который может появиться на веб-страницах, найденных поисковыми системами.

      • Любой из логинов, пользовательских имен этого человека, так как они часто проходят константой по различным соцсетям.

      • Адреса электронной почты человека. Они могут быть введены в Facebook, чтобы выявить связанные аккаунты. Если у вас есть данные о домене, который человек использует, его адрес электронной почты помогают найти сайты типа email-format.com.

      • Фотография, которая помогает найти нужного человека, если его фамилия типична.

      Расширенный поиск в социальных медиа: Facebook

      Недавно запущенный Facebook поисковый инструмент просто удивителен. Он позволяет находить людей по различным критериям, включая, прежде всего, страницы, на которых человек оставил свой «лайк». Новый поиск позволяет искать и по ключевым словам на страницах социальной сети.

      Поиск по ключевым словам, к сожалению, не предусматривает фильтров расширенного поиска (во всяком случае, пока). Похоже, поиск также ограничивается постами из вашего круга общения, их любимых страниц и некоторых заметных аккаунтов.

      Помимо ключевых слов в постах, поиск может быть направлен на людей, страницы, фотографии, события, места, группы и приложения. Результаты поиска для каждого доступны через кликабельные вкладки.

      Например, простой поиск «Челси» откроет привязанные страницы и посты во вкладке Posts:

      Вкладка People показывает результаты поиска людей по имени Челси. Как и в других вкладках, порядок результатов взвешивается в пользу соединений с вашими друзьями и любимыми страницами.

      Вкладка Photos содержит фотографии, так или иначе связанным со словом «Челси» (такие как Челси Клинтон, футбольный клуб Chelsea или друзья на одну ночь в лондонском районе Челси).

      Реальная расследовательская ценность Facebook-поиска становится очевидной, когда вы начинаете фокусироваться на поиске того, что вам действительно нужно.

      Например, если вы расследуете связи между экстремистскими группировками и футболом, вы могли бы захотеть найти людей, которым нравятся «Английская лига защиты» и «Футбольный клуб Chelsea». Не забудьте нажать на вкладку People.

      Этот поисковый инструмент является новым, и Facebook пока еще полирует его, поэтому вам может понадобиться несколько попыток с различными формулировками поисковых запросов. Здесь ваше терпение будет вознаграждено.

      Facebook позволяет добавлять к вашему поиску людей всевозможные фильтры. Например, вы можете конкретизировать в отношении определенных людей их семейное положение, сексуальную ориентацию, вероисповедание, политические взгляды, наиболее популярные веб-страницы, группы, к которым они присоединились, где они живут или выросли. Можете конкретизировать, где они учились, какую работу выполняют и где именно работают. Можете даже найти комментарии о том, что кто-то из них добавил загрузку фото. Вы можете найти кого-то по имени или найти фото человека, кторый был вами отмечен. Можете перечислить людей, которые участвовали в мероприятии или посетили определенные места. Кроме того, вы можете объединить все эти факторы в сложные, неординарные, своеобразные, тонко продуманные поисковые запросы и найти результаты, о существовании которых даже не догадывались.

      И конечно же, вы по-прежнему можете уточнить результаты своего поиска, использовав Google с фильтром по конкретному сайту (добавьте в поле поиска site:facebook.com).

      Расширенный поиск социальных медиа: Twitter

      Многие другие социальные сети позволяют расширенный поиск, который зачастую выходит далеко за рамки простого «ключевого слова на странице». В Twitter расширенный поиск позволяет отслеживать разговоры между пользователями и добавлять диапазон дат, когда разговор мог состояться.

      Twitter позволяет сторонним сайтам использовать свои данные и проводить их собственные захватывающие поиски. Followerwonk, например, позволяет осуществлять поиск в биографиях пользователей и сравнивать их. Topsy имеет большой архив твитов, а также другие уникальные функциональные возможности.

      Передовые поиски социальных медиа: LinkedIn

      LinkedIn позволит вам осуществлять поиски по различным параметрам, включая местоположение, учебу в вузе, нынешнее место работы, бывшее место работы, а также стаж.

      В социальную сеть LinkedIn вы должны войти для того, чтобы воспользоваться расширенным поиском, поэтому не забудьте проверить свои настройки конфиденциальности. Не хотите же вы оставить прослеживаемые следы на профиле того, кого вы расследуете.

      В расширенный поиск LinkedIn вы можете войти, нажав на ссылку рядом с полем поиска. Также обязательно выбрать в категории «Отношения» вариант «3-й + все остальные». В противном случае ваш поиск будет включать в себя только ваших друзей, коллег и их друзей.

      LinkedIn, в первую очередь, предназначен для налаживания связей в сфере бизнеса. Его расширенный поиск, похоже, предназначен в основном для рекрутеров, но это также очень полезно для расследователей и журналистов. Персональные данные существуют в четко определенных полях анкеты, поэтому каждый элемент вашего поиска легко определить.

      Вы можете вводить обычные ключевые слова, фамилии, имена, места, названия текущих и предыдущих работодателей, университеты. Подписчики на премиум-сервис могут конкретизировать при поиске размеры компании и значимость должности.

      LinkedIn позволит вам поиск в различных областях, включая местоположение, учебу в вузе, теперешнее место работы, прошлое место работы и стаж.

      (17 ноября 2016 г. Федеральная служба по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор) внесла Linkedin в Реестр нарушителей законодательства РФ в области персональных данных и заблокировала доступ к сайту, - примечание переводчика).

      Другие опции

      Сайты вроде Geofeedia и Echosec позволяют вам находить твиты, посты Facebook, видеоролики с YouTube, снимки Flickr и Instagram, которые были отправлены с определенных мест. Обрисуйте периметр района или здания и выявите активность пользователей социальных медиа. Geosocialfootprint.com наносит активность пользователя Twitter на карту (правда, пользователь должен сам активировать функцию поиска по местоположению).

      В дополнение к этому, профессиональные инструменты «поиска по людям», такие как Pipl и Spokeo, могут при расследовании проделать за вас львиную долю «работы ногами», выискивая объект поиска разом на нескольких базах данных, в соцсетях и даже на сайтах знакомств. Просто введите имя, адрес электронной почты или имя пользователя, а все остальное пускай делает профессиональный поисковик. Еще один вариант — использование инструмента multisearch сервиса Storyful. Это плагин для браузера Chrome, позволяющий вводить искомое слово, например, имя пользователя, и получать результаты из Twitter, Instagram, YouTube, Tumblr и Spokeo. Каждый сайт открывается в новой вкладке браузера с соответствующими результатами.

      Поиск по «аватарке»

      В качестве изображения профиля для разных соцсетей люди часто используют одно и то же фото. В таком случае обратный поиск изображений на сайтах вроде TinEye и Google Images поможет вам определить аккаунты, использующие одно и то же фото.

      3. Определение права собственности на домен

      Многие журналисты попадают впросак, используя информацию с подставных сайтов. Так как любой пользователь легко купится на анонимный сайт, адрес которого заканчивается на .com, .net или .org, по одежке мы их встречать не будем. Даже внешне добротный веб-сайт с аутентично звучащим доменным именем может на поверку оказаться политической уловкой, подставной фирмой или пранкерским приколом.

      Некоторого уровня верификации вы можете достичь, проверив непосредственно доменное имя. «Погуглите» его и посмотрите, что говорят об этом сайте другие. Важное значение имеет и поиск через whois. Одним из многих сайтов, предоставляющих возможность выполнять поиск whois, является DomainTools.com. Он поднимет регистрационные данные, указанные владельцем сайта при покупке.

      В качестве примера: Всемирной Торговой Организации предшествовало Генеральное Соглашение по Тарифам и Торгам (ГАТТ). Так что, похоже, существуют два сайта, представляющие ВТО. Есть wto.org (подлинный) и gatt.org (обман). Один лишь взгляд на сайт, размещенный на gatt.org, скажет большинству исследователей, что что-то здесь не так, но журналисты неоднократно попадались на информацию с подставного сайта.

      Поиск whois рассеивает любые сомнения по выявлению регистрационной информации доменного имени. Wto.org зарегистрирован в Международном вычислительном центре Организации Объединенных Наций. Ну, а Gatt.org зарегистрирован на Энди Бичлбаума отъявленными пранкерами, именующими себя Тhe Yes Men.

      Whois — не панацея для проверки. Ложь в форме регистрации доменных имен часто сходит людям с рук. Некоторые для сокрытия информации используют службы анонимизации, такие как Domains by Proxy. Однако совмещение инструментов поиска по whois с другими доменными именами и IP-адресами образует ценное оружие в бою за предоставление полезного материала из достоверных источников.


Published on: 15 April 2015
Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.