Парсер email адресов и других контактов (инструкции)

Установка программы

1. Скачайте парсер на свой компьютер и произведите инсталляцию.
2. Запустите программу, перейдите в раздел "Активация программы"
3. Введите ключ активации (полученный при покупке) и свой email, нажмите на кнопку "Активировать программу" – после чего программа должна активироваться.

Запуск сканирования

1. Перейдите в раздел "Настройки проекта" - "База URL" - укажите в графе "База адресов" путь к базе данных url адресов сайтов для сканирования и нажмите "Ок".

2. Перейдите в раздел "Настройки проекта" - "Вывод" - укажите в графе "Выходной файл" - файл, куда парсер будет производить запись собранных результатов (в него будут записаны все данные: email, телефоны, сайты и т.п.).

3. Перейдите в раздел "Настройки проекта" - "Основные" - укажите опции сохранения информации если Вам необходимо чтобы сохранялись например только организации определенного региона или только конкретной сферы деятельности.

4. Перейдите в главную панель программы и нажмите на кнопку "Старт", если Вы все сделали правильно - должно начаться сканирование сайтов (а также парсинга email адресов и других на них) и отображение результатов в "Статистике" и "Мониторе".

Настройка скорости сканирования сайтов

Перейдите в раздел "Общие настройки" - "Основные" - во вкладке "Системные" находится опция "Число потоков" - чем больше это число - тем больше парсер будет одновременно сканировать сайтов (и выявлять email адреса и другие контакты на страницах этих сайтов).

Как добавить свой регион в "маски"

1. Перейдите в раздел "Маски контактов" - "Регионы", нажмите на кнопку "Добавить" укажите название региона и нажмите "Ок".

2. Во вкладке "Маска" у этого региона укажите ключевые слова этого региона, это могут быть: коды телефонных номеров, почтовый индекс города или название самого города. Ключевые слова необходимо указывать через знак "|", например: ключ1|ключ2|ключ3.

Как добавить свою категорию в "маски"
Ручное добавление:

1. Перейдите в раздел "Маски контактов" - "Категории", во вкладке "Категории" нажмите на кнопку "Добавить" укажите название региона и нажмите "Ок".

2. Во вкладке "Обучение" нажмите на кнопку "Добавить", в появившемся поле впишите ключевое слово относящиеся к данной категории, и таким образом добавляйте ключевые слова.

Пакетное добавление одной категории

1. Скомпонуйте нужные тексты в один текстовый файл (формата .txt), источником текстов могут быть сайты или статьи нужной Вам тематики.
2. Перейдите в раздел "Маски контактов" - "Категории", откройте нужную Вам категорию - во вкладке "Обучение" нажмите на кнопку "Загрузить текст для обучение", а потом нажмите на "анализировать текст", далее нажмите на "Обучить".
3. Если Вы все сделали правильно - парсер отобразит ключевые слова в нижем окне.
4. Далее Вы можете просмотреть ключевые слова и удалить вручную те, которые Вы считаете неподходящими для этой категории при помощи вкладки "Исключения".

Пакетное добавление нескольких категорий

1. В директорию программы (по умолчанию это C:\Users\Admin\AppData\Local\StandartSoft\StandartHarvester\), в папку "data\batchlearn" разместите текстовые файлы (формата .txt) со ссылками на сайты, каждый файл должен содержать ссылки определенной тематики, например файл называется "Агентства недвижимости.txt" - в нем должны содержаться ссылки на сайты агентств недвижимости и так остальные файлы по каждой категории (ссылки должны располагаться друг под другом в столбик через перенос строки, с http://).
2. Перейдите в раздел "Маски контактов" - "Категории" - "Обучение", опция "Автообработка" должна быть включена и нажмите на кнопку "Старт" - дождитесь пока парсер обработает все ссылки в файлах и нажмите на кнопку "Ок".
3. Если Вы все сделали правильно - в списке категорий парсера должны будут появиться новые категории по названию текстовых файлов.
4. Далее Вы можете просмотреть ключевые слова в каждой категории и удалить вручную те, которые Вы считаете неподходящими для этой категории при помощи вкладки "Исключения".

Обратите внимание! По умолчанию парсер будет обрабатывать по 300 первых верхних url адреса в каждом файле - Вы можете изменить это количество, перейдя раздел "Настройки" - параметр "Ограничить число документов для обучения".