индексированный файл pdf что это
SEO оптимизация PDF-файлов
Продвигать в органической выдаче можно не только HTML-страницы, но и PDF-файлы – они отлично сканируются и ранжируются поисковыми системами. Такие документы чаще всего используются для публикации научной и деловой информации, содержат в себе массу полезного контента, а потому охотно открываются пользователями. Поэтому не стоит упускать возможностей поисковой оптимизации PDF-файлов.
Отображение PDF-файлов в поисковой выдаче
Формат PDF является разработкой компании Adobe Systems, созданный изначально для хранения информации о полиграфической продукции. Далее, стал активно использоваться в университетской и деловой среде для публикации различных отчетов, научных докладов и прочих статей такого плана.
Еще начиная с 2001 года, Google начал индексировать PDF-файлы и отображать их в поисковой выдаче, российский поисковик Яндекс тоже «научился» это делать, но гораздо позже. В любом случае, если на сайте находятся подобного типа файлы, то стоит задуматься над их SEO-оптимизацией.
Изначально PDF-файлы можно было открыть только после скачивания на компьютер с помощью специального софта (например, Adobe Reader). На сегодняшний день они открываются (в том числе) через браузеры, т.е. по сути, для этого не нужно покидать сайт.
Если вернутся к теме индексации, то поисковые боты также хорошо умеют сканировать PDF, как и HTML. В поисковой выдаче страницы PDF помечаются специальной сноской.
Выдача Яндекса
Выдача Google
Правила поисковой оптимизации PDF
В процессе оптимизации потребуется редактирование PDF-файлов, сделать это можно с помощью специальных программ:
Все вышеназванные программы позволяют создавать и редактировать PDF-файлы, готовые к поисковому продвижению. Если будет использоваться какой-либо графический редактор, по типу Photoshop, то на выходе все содержимое документа будет представлять собой сплошное изображение. Продвинуть подобное в поисковых системах невозможно.
Имя файла
При создании файла, обратите внимание на его название. В идеале оно должно раскрывать тему содержимого, а также включать в себя одно из основных релевантных ключевых слов из семантики. Кроме того, название будет отображаться в сниппете поисковой выдачи, но до определенного количества символов, если их много, то часть срежется.
Чтобы максимально оптимизировать название PDF-файла, рекомендуется изучить аналоги у конкурентов, которые уже хорошо ранжируются. При этом не забываем, что название должно быть написано латинскими буквами, без пробелов (вместо них лучше использовать дефис).
Текстовая составляющая
Это наиболее важный пункт, на который стоит обратить внимание оптимизатору при подготовке файла к продвижению. Как отмечалось выше, PDF-файлы чаще всего используются для публикации различных докладов и прочего массива информации. Поэтому, если в таком файле содержится больше количество текстового контента, то лучше поделить его на несколько частей.
Что касается самой оптимизации, тот тут действуют примерно такие же правила, как при продвижении HTML-страниц. То есть, в тексте должны присутствовать ключевые слова из семантического ядра сайта. Важно учитывать уровень плотности ключей (до 5%) и следить за переспамом.
Текст должен быть уникальным, как и в случае с обычными веб-страницами, проверить это можно на одном из сервисов:
Отдельное внимание стоит уделить структуре текста. В нем должны присутствовать заголовки и подзаголовки, в которых рекомендуется употреблять ключевые слова. Кроме этого, они помогают структурировать текст, делая его удобным для чтения. Заголовки, также, как и в HTML, бывают h1-h6 (или более, уровня).
К слову, работая с ключевыми фразами, избегайте их использования в неестественных формах – это негативно скажется на продвижении. Поисковики «не любят» накрутки в любом их проявлении.
Наиболее «горячие» ключевые фразы постарайтесь разместить как можно ближе к началу текста, лучше самый основной запрос употребить в первом абзаце.
И самое главное, текст должен представлять ценность для читателя, а также необходимо следить за его качеством в целом. Если это будет откровенно плохой рерайт или текст содержащий большое количество грамматических ошибок, то при продвижении возникнет масса сложностей.
Не стоит забывать про юзабилити файла. Для удобства пользователя, можно создать оглавление, разместив его вначале файла с активными ссылками навигации по документу. Это поможет улучшить поведенческие факторы, а они, как известно, имеют колоссальное влияние на поисковое ранжирование.
Метатеги файла
PDF-файл может содержать метатеги, которые поисковики умеют сканировать. Для их редактирования, необходимо зайти в свойства файла (в нашем примере это будет программа Adobe Acrobat) и заполнить необходимые поля:
Заходим в «File» Adobe Acrobat Pro DC и переходим в «Properties»
Заполняем нужные поля
Основная задача – заполнить как можно больше релевантной служебной информации. Часть из нее не влияет на ранжирование напрямую, но имеет косвенное влияние на поведенческие факторы.
Изображения
Изображения являются наиболее тяжеловесными элементами PDF, а так как в большинстве случаев открытие файла происходит в онлайн-режиме, то следует позаботиться о его конечном весе, и не добавлять в один файл много изображений. Перед размещением в PDF, оптимизируйте их по качеству и размеру.
Если говорить про SEO-оптимизацию картинок в PDF, то к ним можно прописывать атрибут alt – краткое описание содержимого изображения. Именно по нему поисковый робот способен правильно распознавать и индексировать такого типа контент. Конечно, сейчас алгоритмы поисковиков способны считывать содержимое изображений и другими способами, но в идеале alt должен быть прописан.
К формированию описания нужно подходить также, как и к заголовкам: кратко, емко, используя ключевые слова в естественном вхождении.
Ссылки
На перелинковке страниц, в том числе PDF-файлов, построен весь интернет. Для них также существуют понятия внутренних и внешних ссылок. Т.е. авторитетность документа определяется поисковыми системами по количеству и качеству таких ссылок.
В большинстве случаев, занимаясь наращиванием внешней ссылочной массы, неважно, для PDF-документа или любой другой части сайта, стоит следить за соотношением анкорных и безанкорных ссылок. Примерно, в 50-70% случаев, ссылка должна быть безанкорной. В противном случае, такая ссылочная масса может быть воспринята поисковиками как попытка манипулирования факторами ранжирования.
Не забывайте о внутренней перелинковке сайта, о наличии ссылок со страниц на PDF-документ. Кстати, сам документ тоже имеет вес (Page Rank) и способен его передавать посредством ссылок.
Отслеживание просмотров PDF-документов
Для выстраивания эффективной маркетинговой стратегии, необходимо постоянно вести аналитику сайта. С обычными HTML-страницами все понятно, счетчики Яндекс Метрики или Google Analyics, а как быть с PDF-файлами?
Для передачи данных об открытии PDF-файлов в эту систему аналитики, необходимо настроить отслеживание этого события через Google Tag Manager:
Создаем новый тег в Google Tag Manager
Пример заполнения полей
После создаем Триггер, по которому будет происходить активация созданного события:
Создание Триггера
Выбираем тип триггера
Пример настройки триггера
После опубликовываем в GTM все настройки и проверяем, если все сделано правильно, то в Аналитику (при условии, что она принимает события из GTM) будет передаваться факт открытия PDF-файлов на сайте.
SEO-оптимизация PDF-файлов имеет сходство оптимизацией обычных HTML-страниц, на них также можно получать хорошую долю трафика.
Документ формата PDF и его индексация поисковыми системами
Формат PDF был разработан фирмой Adobe Systems, чтобы решить проблему единства отображения и обработки полиграфической продукции в различных информационных средах (его кроссплатформенность) и довольно успешно справляется с этой задачей и по сегодняшний день. Однако со временем у этого формата появилось и иное предназначение. Универсальность этого формата спровоцировала рост его популярности, а, следовательно, увеличилось и количество публикаций, доступных в этом формате в электронном виде в Интернете.
В этой статье я старался систематизировать информацию, осветив как можно больше фактов, влияющих на индексацию поисковыми системами документов этого формата в Интернете, а также ответив на самые распространённые вопросы, которые возникают у веб-мастеров, использующих эти файлы на своих сайтах.
ПРОГРАММЫ ДЛЯ РАБОТЫ С ФАЙЛАМИ PDF
Вот небольшой список таких конвертеров :
Теперь, я думаю, самое время поделиться с вами секретами оптимизации файла PDF для поисковых систем.
Не используйте слишком много изображений или изображения большого размера. Картинки хоть и улучшают внешний вид, однако также увеличивается размер файла и время его загрузки. Как и на HTML-странице, если вы поставите много изображений (особенно неоптимизированных), то это потребует больше времени для их загрузки в браузер. Но помимо оптимизации размера изображений PDF-документа, необходимо также оптимизировать и подписи (альтернативный текст) к ним. У каждого изображения документа должна быть своя подпись, как к картинкам обычной HTML-страницы.
Старайтесь избегать большого количества текста в одном файле PDF, дробите один файл на несколько файлов, причём, линкуйте их ссылками внутри каждого такого документа (так, как бы вы это делали с обычными HTML-документами).
Сделайте оглавление (поисковую карту документа), каждый пункт этого оглавления оформите ссылкой (закладкой) внутри PDF документа, для каждой ссылки пропишите ключевые слова в описании ссылки. Этот приём наиболее эффективен для документов, состоящих из нескольких логический частей и с большим количеством страниц – он обеспечивает качественную внутреннюю перелинковку документа, позволяющую эффективно индексировать документ поисковым роботам.
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ (МЕТАПОЛЯ)
КОДИРОВКА, ШРИФТЫ И РАСПОЛОЖЕНИЕ ФАЙЛА
Несколько слов нужно сказать и про оптимизацию шрифтов. Не забывайте включать в сам файл все необходимые (нестандартные) шрифты. Довольно часто для декоративных целей используются самые разнообразные и редкие полиграфические шрифты, которые могут плохо восприниматься поисковыми системами, поэтому, по возможности, старайтесь пользоваться стандартными шрифтами ( Arial, Helvetica, Sans-Serif, Times New Roman и другими), которые хорошо индексируются поисковыми системами. Их плюс в том, что они присутствуют по умолчанию в любой операционной системе, поэтому из документа PDF их можно спокойно исключить, уменьшив тем самым размер файла.
Шрифты, которые не были добавлены в PDF-документ или отсутствуют в операционной системе, будут отображаться тем шрифтом, который имеется (самым близким по значению), что может привести к нежелательным последствиям, а именно к увеличению или уменьшению числа страниц, количества символов в строках, межстрочного интервала и других проблем метрики.
Напоследок, предоставлю вам пару ссылок, которые могут быть полезны в связи с опубликованным материалом:
Оптимизация PDF-файлов для SEO
21.05.2018 Время прочтения: 3 минуты
PDF-файлы сканируются, индексируются и ранжируются в поисковой выдаче (SERP), но когда дело доходит до SEO, о PDF часто забывают. Предлагаем несколько простых шагов, которые помогут ранжировать ваши PDF-файлы по ключевым словам.
Индексация PDF-файлов началась в 2001 году, они имеют собственный тег в поисковой выдаче. SEO-продвижение PDF осуществляется так же, как и оптимизация веб-страниц, если не считать небольшие различия.
Выберите имя, описывающее содержимое файла
Для наилучшей оптимизации PDF-файла название документа должно соответствовать теме, раскрываемой в PDF-документе. Это один из первых элементов, который будут сканировать Google spiders, поэтому релевантное название документа позволит им понять суть его содержимого.
Прежде чем вы определитесь с названием документа, возможно, стоит провести анализ среди конкурентов, чтобы понять, что ищут пользователи. Учитывайте объем поиска.
Также рекомендуется использовать дефисы для разделения слов в имени файла, чтобы избежать символов «%20» между словами в адресе, когда пользователи загружают PDF.
Настройте ссылки
Речь идёт о двух типах ссылок: во-первых, ссылки с вашего сайта на PDF будут сообщать Google, что документ – это релевантный фрагмент контента, который нужно сканировать. Здесь применяется правило соответствующего якорного текста.
Во-вторых, ссылки из самого PDF (логотипы или копии), ведущие на страницы вашего сайта. Преимущество заключается в двух аспектах: так вы не только покажете Google, что PDF соответствует контенту на вашем веб-сайте, но и любые обратные ссылки в PDF затем приведут на страницы вашего сайта через deep links (глубинные, или внешние ссылки). Если для пользователя ваш PDF будет полезен и он захочет разместить его на своем веб-сайте, читатели будут по-прежнему перенаправляться на ваш сайт для получения более подробной информации.
Не забывайте защищать документ, чтобы никто не мог изменить ваши ссылки и заменить их своими.
Оптимизируйте заголовок PDF
Заголовок PDF эквивалентен тегу заголовка HTML, поэтому он будет отображаться в выдаче. Чтобы заголовок не был обрезан, в названии должно быть не более 60 символов. Самые важные ключевые слова должны быть в начале заголовка. Отредактировать заголовок можно в «Настройках документа» в Adobe Acrobat или File –> Info в Microsoft Word.
Поскольку PDF-файлы обычно затрагивают только часть вопроса (темы, проблемы), они имеют тенденцию ранжироваться по long-tail запросам (низкочастотным и низкоконкурентным). Поэтому поисковая оптимизация по ним лучше подходит для PDF-файлов.
Оптимизируйте
Как и в случае с метатегом для обычных страниц, PDF будет отображаться под заголовком в поисковой выдаче. Включите в него главные ключевые слова и проследите, чтобы количество символов не превышало 300. В то же время название должно быть привлекательным и полезным, чтобы повысить кликабельность.
Создайте текстовую копию
Заполните все поля метаданных PDF в настройках
Несмотря на то, что это не факторы ранжирования, дополнительные поля метаданных в PDF-файлах способствуют успешному сканированию. Как изменить метаданные PDF: чем больше данных вы дадите ботам, тем лучше они поймут ваш контент и определят, как его оценивать.
Нужно правильно редактировать метаданные PDF: обязательно добавьте информацию в поля сохранения в «Файл» –> «Свойства» в Adobe Acrobat. Для узнаваемости вашего бренда впишите его в поле автора. Введите ключевые слова в поле ключевых слов.
Свойства документа в Adobe Acrobat
Сделайте то же самое в Word в Document Info.
Свойства документа в Microsoft Word
Оптимизируйте копию
Используйте ключевые слова, которые вы хотите присвоить для всей копии, – в оглавлении, заголовках и параграфах. Первый заголовок должен совпадать с основным заголовком и именем файла.
Оптимизируйте файл для мобильных устройств
Не секрет, что Google предпочитает мобильный оптимизированный контент. PDF-файлы могут быть длинными и сложными для восприятия на маленьком экране, но есть несколько способов упростить чтение с экранов мобильных устройств. Например, выровняйте текст влево, используйте маркированные списки и полужирное начертание, а также.
…сожмите изображения
Скорость загрузки страницы – это фактор ранжирования. PDF-файлы могут содержать довольно много изображений и графиков, поэтому сожмите изображения, прежде чем добавлять их в свой документ. Для этой цели существует несколько онлайн-инструментов, которые вы можете использовать.
Остерегайтесь…
…дублирования контента! Важно, чтобы у вас не было одинакового контента и на веб-странице, и в документе PDF. Для SEO-продвижения в Google это важно: Google не любит дублированный контент и может наказать за это ваш сайт. Как этого избежать: создайте краткое изложение содержимого PDF на вашем веб-сайте, а копируйте его.
Напоследок
PDF-файлы – это уникальные активы для бренда, которые могут выгодно отличить вас от ваших конкурентов, а также привести больше потенциальных клиентов и увеличить продажи. Если вы будете следовать вышеприведенным рекомендациям, SEO ваших PDF пройдёт успешно и файлы будут ближе к верхним позициям на страницах поиска, привлекая внимание бо́льшего количества людей, заинтересованных в том, что вы делаете. Если у вас возникли проблемы с оптимизацией ваших документов, позвоните нашим экспертам по SEO
Индексирование файлов PDF
Можно уменьшить затрачиваемое на поиск большого файла PDF время путем встраивания индекса слов документа. Acrobat производит поиск по индексу значительно быстрей, чем по документу. Встроенный индекс включается в распространяемые копии файлов PDF. Поиск по файлам PDF со встроенными индексами происходит точно так же, как если бы индексов не было, — никаких дополнительных шагов не требуется.
Начиная с выпуска Acrobat DC и Acrobat Reader DC за декабрь 2018 г. для поиска по PDF больше не используется встроенных индекс. Если вы все же хотите использовать индексы для поиска, смотрите статью Включение встроенных индексов в PDF для поиска.
Добавление индекса в файл PDF
В документе, открытом в Acrobat, выберите Инструменты > Индекс.
На дополнительной панели инструментов отобразится набор инструментов «Индекс».
На дополнительной панели инструментов выберите Управление встроенным индексом.
В диалоговом окне «Управление встроенным индексом» нажмите Встроить индекс.
Прочитайте появившиеся сообщения и нажмите OK.
В Outlook и Lotus Notes есть возможность встраивания индекса при преобразовании в PDF сообщений электронной почты или папок. Особенно это рекомендуется для папок, содержащих много сообщений электронной почты.
Обновление или удаление встроенного индекса в документе PDF
Выберите Инструменты > Индекс.
На дополнительной панели инструментов отобразится набор инструментов «Индекс».
На дополнительной панели инструментов выберите Управление встроенным индексом.
Нажмите Обновить индекс или Удалить индекс.
О функции «Каталог» (Acrobat Pro)
Можно сделать определенную группу документов PDF каталогом и создать общий индекс для всех входящих в него документов. Индекс позволяет гораздо быстрее осуществлять процедуру поиска определенных данных в каталогизированных документах PDF.
Индекс можно поместить вместе с документами PDF в коллекцию файлов, распространяемую на компакт-диске.
Каталогизировать можно документы, написанные латинскими, китайскими, японскими или корейскими символами. Каталогизируемыми элементами могут быть: текст документа, комментарии, закладки, поля форм, теги, метаданные объектов или документа, вложения, сведения о документе, цифровые подписи, метаданные изображений XIF (расширенный формат файлов-изображений) и пользовательские свойства документа.
Подготовка документов PDF к индексации (Acrobat Pro)
Сначала необходимо создать папку, в которой будут храниться индексируемые файлы PDF. Все файлы PDF должны содержать данные содержимого и электронных свойств, таких как ссылки, закладки и поля форм. Если индексируемые файлы содержат сканированные документы, убедитесь, что текст этих документов распознан и может быть использован при поиске. Для повышения производительности поиска разбейте длинные документы на небольшие документы размером с одну главу. Для улучшения поиска к свойствам документа можно добавить соответствующие сведения.
Перед индексированием коллекции документов важно установить структуру документа на диске или томе сетевого сервера и проверить имена межплатформенных файлов. Имена файлов могут оказаться урезанными, а межплатформенный поиск вследствие этого — затруднительным. Чтобы избежать этой проблемы, следуйте дальнейшим указаниям.
Переименуйте файлы, папки и индексы в соответствии с соглашением об именовании файлов в MS-DOS (восемь или менее символов, за которыми следует файловое расширение из трех символов). Это тем более необходимо сделать, если планируется поставлять коллекцию документов вместе с индексом на компакт-диске формата ISO 9660.
Удалите из имен файлов и папок символы расширенного набора, например символы ударений или неанглийские символы. (Шрифт, используемый функцией «Каталог», не поддерживает коды символов с 133 по 159.)
Не используйте папки с глубоким уровнем вложения или с длиной пути к файлу, превышающей 256 символов, в индексах, которые будут использоваться для Mac OS.
При использовании Mac OS на сервере OS/2 LAN настройте IBM® LAN Server Macintosh (LSM) так, чтобы использовались имена файлов MS-DOS, или индексируйте только тома FAT. (Тома HPFS [High Performance File System ] могут содержать длинные неизвлекаемые имена файлов).
Если структура документа включает в себя подпапки, не предназначенные для индексирования, их можно исключить из процесса индексирования.
Добавление метаданных к свойствам документа (Acrobat Pro)
Чтобы облегчить поиск документа PDF, можно добавить сведения о файле, называемые метаданными, в свойства документа (свойства открытого в настоящий момент документа PDF можно просмотреть, выбрав меню Файл > Свойства и перейдя на вкладку Описание).
При добавлении данных в свойства документа придерживайтесь следующих рекомендаций:
Для информации подобного рода всегда используйте одно и то же поле. Например, не рекомендуется добавлять важный термин в поле Тема для одного документа и тот же термин в поле Ключевые слова для другого документа.
Используйте единообразные, согласованные термины для одинаковых данных. Например, не рекомендуется использовать слово биология для одних документов и термин наука о жизни для других.
Если вы используете номера для обозначения различных частей документа, добавьте их в качестве ключевых слов. Например, добавление в ключевые слова doc#=m234 может обозначать определенный документ из нескольких сотен документов на заданную тематику.
Для классификации документов по типу используйте поля Тема и Ключевые слова либо по отдельности, либо в сочетании друг с другом. Например, для одного документа в поле «Тема» можно указать отчет о состоянии, а в поле «Ключевые слова» внести слова ежемесячный или еженедельный.
Создание индекса для коллекции (Acrobat Pro)
Выберите Инструменты > Индекс.
На дополнительной панели инструментов отобразится набор инструментов «Индекс».
На дополнительной панели инструментов выберите Полнотекстовый индекс с каталогом.
Отобразится диалоговое окно «Каталог».
В диалоговом окне Каталог нажмите Создать индекс.
Появится диалоговое окно «Новое определение индекса».
В поле Заголовок индекса введите имя файла индекса.
В поле Описание индекса введите несколько слов, описывающих тип индекса и его назначение.
Нажмите кнопку Параметры и выберите дополнительные параметры, которые необходимо применить к индексу. Затем нажмите кнопку ОК.
В области Включить эти папки нажмите кнопку Добавить, выберите папку, содержащую некоторые или все файлы PDF для индексирования, и затем нажмите кнопку ОК. Чтобы добавить другие папки, повторите этот шаг.
В процесс индексирования будут включены все подпапки выбранной папки. Если не планируется перемещать индекс или любые элементы коллекции документов, к данному списку можно добавлять папки, расположенные на разных серверах или дисковых накопителях.
В области Исключить эти папки нажмите кнопку Добавить и выберите любую вложенную папку, содержащую файлы PDF, которые необходимо исключить из процесса индексирования. Нажмите кнопку OK и при необходимости повторите действия.
Просмотрите выбранные папки. Для внесения изменений в список включаемых и исключаемых из индексирования папок выберите папку, которую вы хотите удалить, и нажмите кнопку Удалить.
Нажмите кнопку Создать и укажите местоположение файла индекса. Нажмите кнопку Сохранить и затем выполните следующие действия.
Нажмите кнопку Закрыть по окончании процесса индексирования.
Нажмите кнопку Остановить для отмены процесса индексирования.
При остановке процесса индексирования возобновить тот же сеанс индексирования нельзя, однако повторять все предварительные действия уже не нужно. Выбранные параметры и папки сохраняются. Можно выполнить команду «Открыть индекс», выбрать частично завершенный индекс и исправить его.
Если при использовании параметров «Включить эти папки» и «Исключить эти папки» длинные имена путей окажутся усеченными, наведите указатель на символ многоточия (. ) и подождите, пока не появится подсказка, отображающая полный путь к включенной или исключенной папке.
Диалоговое окно «Параметры индексирования»
При выборе этого параметра из индекса исключаются все числа, входящие в текст документа. Исключение из индекса чисел может существенно сократить размер индекса и ускорить поиск.
Добавлять идентификаторы к файлам Adobe PDF версии 1.0
Этот параметр устанавливается, если коллекция документов содержит файлы PDF, созданные в программе Acrobat версии ниже 2.0, в которых идентификаторы не добавлялись автоматически. Идентификаторы необходимы, когда длинные имена файлов в Mac OS сокращаются при их переводе в имена файлов DOS. Программа Acrobat 2.0 и более поздних версий автоматически добавляет эти идентификаторы.
Не предупреждать об измененных документах в процессе поиска
Если этот параметр не выбран, при поиске в документах, изменившихся с момента последнего построения индекса, появляется соответствующее сообщение.
При создании в приложении Microsoft Office пользовательских полей, для которых в приложении PDFMaker установлен параметр «Преобразование сведений о документе», поля будут преобразовываться для любых создаваемых PDF-файлов.
Этот параметр используется для включения пользовательских полей XMP. Пользовательские поля XMP индексируются и отображаются во всплывающих меню дополнительных критериев поиска для включения в поиск по выбранным индексам.
Этот параметр используется для исключения отдельных слов (максимум 500) из результатов поиска по индексу. Введите слово, нажмите кнопку «Добавить». При необходимости повторите это действие. Исключение слов может привести к уменьшению размеров индекса на 10–15%. Стоп-слово может содержать до 128 символов и является чувствительным к регистру.
Чтобы пользователи напрасно не вводили поисковые запросы, содержащие эти слова, список неиндексируемых слов приведен в файле Readme каталога.
Этот параметр используется для обеспечения возможности поиска по узлам тегов в документах, имеющих тегированную логическую структуру.
Параметры «Заказные свойства», «Исключения» и «Теги структуры» применяются только к текущему индексу. Чтобы применить эти параметры для всех создаваемых индексов, можно изменить настройки по умолчанию для пользовательских полей, стоп-слов и тегов в панели «Каталог» диалогового окна «Установки».
Файлы Readme каталога (Acrobat Pro)
Зачастую хорошим решением оказывается создать отдельный файл Readme и поместить его в папку с индексом. В файле Readme могут содержаться полезные сведения об индексе, например, следующие:
Типы индексируемых документов.
Поддерживаемые параметры поиска.
Контактные данные (имя, номер телефона) лица, которое может ответить на интересующие вопросы.
Список чисел или слов, исключаемых из индекса.
Список папок, содержащих документы, которые включены в индекс, построенный в локальной сети, или список документов, которые включены в индекс, построенный по отдельному диску. Сюда можно также включить краткое описание содержимого каждой папки или документа.
Список значений по каждому документу, если заполнены поля «Сведения о документе».
Если каталог содержит очень большое число документов, в файл Readme можно включить таблицу, описывающую значения, присвоенные каждому документу. Эта таблица может входить в состав файла Readme, либо ее можно сохранить в отдельном документе. При разработке индекса эту таблицу можно использовать для сохранения согласованности.
Изменение индекса (Acrobat Pro)
Существующий индекс можно обновить, перестроить или удалить.
Выберите Инструменты > Индекс.
На дополнительной панели инструментов отобразится набор инструментов «Индекс».
На дополнительной панели инструментов выберите Полнотекстовый индекс с каталогом.
Отобразится диалоговое окно «Каталог».
В диалоговом окне Каталог нажмите Открыть индекс.
Найдите и выберите файл определения индекса (PDX), затем нажмите кнопку Открыть.
Если индекс был создан в программе Acrobat версии 5.0 или более ранней, для создания индекса выберите команду Создать копию (не перезаписывая поверх более ранней версии) или команду Заменить старый индекс, чтобы записать новый индекс поверх старого.
В диалоговом окне Определение индекса внесите необходимые изменения, затем выберите действие, которое хотите выполнить в Acrobat:
Создает новый IDX-файл с существующими данными и обновляет его, добавляя новые элементы и отмечая измененные или устаревшие элементы как недействительные. Если количество таких изменений велико или если часто выполнять такие изменения, вместо создания нового индекса, время поиска может увеличиться.
Создает новый индекс, переписывая существующую индексную папку и все ее содержимое (то есть IDX-файлы).
Удаляет содержимое индекса (IDX-файлы), не удаляя сам индексный файл (PDX).
Установки каталога (Acrobat Pro)
Можно задать установки индексирования, которые будут применяться глобально ко всем создаваемым впоследствии индексам. Некоторые из этих установок можно переопределить для конкретного индекса, выбрав для него новые параметры во время построения индекса.
В диалоговом окне Установки в разделе Категории выберите Каталог. Многие параметры совпадают с теми, которые были описаны для процесса построения индекса.
Параметр «Принудительная совместимость с ISO 9660 для папок» полезно использовать, если при подготовке документов для индексирования нет необходимости менять длинные имена документов PDF на имена файлов MS-DOS. Тем не менее имена папок должны быть преобразованы в стандарт именования файлов MS-DOS (8 символов или меньше), даже если такое преобразование не является необходимым для имен файлов.
Обновления индекса по расписанию (Acrobat Pro)
Чтобы использовать файлы BPDX, в диалоговом окне «Установки» в подразделе «Каталог» выберите « Разрешить запуск пакетных файлов каталога (.bpdx)».
Перемещение коллекций и их индексов (Acrobat Pro)
Разработанную и протестированную на локальном жестком диске индексированную коллекцию документов можно затем переместить в виде законченной коллекции на сетевой сервер или диск. Определение индекса содержит относительные пути от файла определения индекса (PDX) к папкам, содержащим индексированные документы. Если эти относительные пути не изменятся, перестраивать индекс после перемещения коллекции документов не потребуется. Если PDX-файл и папки, содержащие индексированные документы, расположены в одной папке, сохранение относительного пути достигается простым перемещением этой папки.
Если относительный путь изменится, то после перемещения индексированной коллекции документов необходимо создать новый индекс. Однако в любом случае можно использовать исходный PDX-файл. Чтобы использовать исходный PDX-файл, вначале следует переместить индексированные документы. Затем необходимо скопировать PDX-файл в папку, в которой планируется создать новый индекс, и при необходимости изменить списки включенных или исключенных папок и подпапок.
Если индекс располагается на сетевом диске или сервере отдельно от любой части файлов коллекции, то перемещение либо коллекции, либо индекса приведет к повреждению индекса. Если коллекция документов перемещается в другое сетевое местоположение или на компакт-диск, индекс для нее необходимо создавать и строить в том же месте, куда перемещается коллекция.