Ваше благополучие зависит от ваших собственных решений.

Джон Дэвисон Рокфеллер

Меню сайта
  • Компьютеры
  • Телефоны
  • Бизнес
  • Свое дело
  • Решение проблем
  • Интернет
  • Новости
  • Новости
    Реклама
    Реклама

    Сделайте так, чтобы ваши PDF-файлы хорошо работали с Google (и другими поисковыми системами)

    1. Узнайте, как использовать Acrobat 9, чтобы максимизировать эффективность документов PDF, которые вы...
    2. Насколько серьезна проблема?
    3. Каждому PDF нужен заголовок
    4. Другие соображения
    5. А как насчет других двигателей?
    6. Заключение

    Из этого туториала Вы узнаете, как работать с функциями создания PDF-файлов в Acrobat 9. Посмотрите, что может сделать для вас совершенно новый Acrobat DC.

    Загрузите бесплатную пробную версию нового Acrobat.

    Узнайте, как использовать Acrobat 9, чтобы максимизировать эффективность документов PDF, которые вы делаете доступными в Интернете.

    Я, наверное, пользуюсь Google каждый час, если не чаще. Я также ищу локальные и сетевые жесткие диски в поисках предложений, справочных материалов и так далее. Думаю я об этом или нет, полнотекстовый поиск - большая часть того, как я делаю свою работу и живу своей жизнью.

    Во многих поисках, особенно для справочного, официального или печатного содержимого, в моих результатах поиска появляется много файлов PDF. Что касается Google, PDF-документ - это просто еще одна веб-страница, поэтому поисковые системы индексируют PDF-файлы, которые представляют большой объем глобальных просмотров страниц. PDF - это фактор SEO (поисковая оптимизация) сайта, прямо пропорциональный объему PDF-контента на этом сайте.

    Так что внимательно посмотрите на списки файлов PDF на страницах результатов поиска. В конце концов, во многих случаях именно так люди решают, нажимать или нет на ваш сайт.

    Хотите сосредоточиться на PDF-файлах в результатах поиска
    Хотите сосредоточиться на PDF-файлах в результатах поиска? Просто добавьте «filetype: pdf» к своему поиску, используя Google, Yahoo или Bing.

    При просмотре через призму результатов поиска многие PDF-файлы кажутся непрофессиональными и контрпродуктивными - в лучшем случае. Авторам PDF и менеджерам контента следует потратить время на то, чтобы их файлы PDF работали правильно с поисковыми системами. Не только PDF-файлы, оптимизированные для SEO, получают больше кликов, но и для пользователей, которые ищут этот файл в будущем, они также экономят время.


    Насколько серьезна проблема?

    Большинство корпоративных и государственных веб-сайтов содержат PDF-файлы, и эти файлы часто представляют собой наиболее важный контент на сайте, что важно в том смысле, что их легко найти и они должны хорошо выглядеть при обнаружении. Каталоги продукции, прайс-листы, отчеты, брошюры, руководства, документация, заполняемые формы, архивные записи - вы называете это, а файлы PDF играют жизненно важную роль в коммуникации, доставке продуктов и услуг, а также в управлении бизнесом.

    Я выполнил следующий простой эксперимент, и вы тоже можете это сделать.

    Я провел ряд поисков, используя обычные бизнес-термины, ограничивая поиск в каждом случае только файлами PDF. Пример: «тип файла белой книги сервера форм: pdf» или «тип файла исследования листовой стали: pdf». Затем я перешел прямо к 10-й странице результатов Google (чтобы избежать «самого лучшего» контента в Интернете) и начал искать оттуда.

    Ваш пробег может отличаться, но я рад сообщить, что общее качество результатов поиска в PDF, похоже, значительно улучшилось с тех пор, как я последний раз проверял этот вопрос. Еще в начале 2006 года около 60 процентов общедоступных файлов PDF имели бессмысленные заголовки, которые никогда не вызывали бы щелчка. Сегодня я вижу около 30 процентов файлов PDF в том же состоянии. Конечно, результаты сильно различаются в зависимости от выбранных вами поисковых терминов, но очевидно, что понимание того, что PDF-файлы являются частью веб-контента - так же, как HTML - завоевывает популярность.

    Как сегодня выглядят файлы PDF на вашем сайте? Расширенный поиск Google делает это легко. Тестировать свой сайт просто; просто Google следующим образом: site: yoursite.com тип файла: pdf . Вот как файлы PDF на сайте Appligent Document Solutions появиться сегодня (тск, тск).

    Давайте посмотрим, как вы можете максимизировать эффективность документов PDF, которые вы делаете доступными в Интернете.


    Каждому PDF нужен заголовок

    Что касается файлов PDF, синий подчеркнутый текст в результатах поиска Google происходит из одного из двух мест. Сначала Google просматривает информационное поле «Заголовок» документа. Если он ничего не находит, индексатор Google пытается угадать заголовок документа, сканируя текст на первых страницах. Это обычно не работает, производя неправильные и неправильно отформатированные результаты.

    Конечно, если индексатор находит текст в поле заголовка, он будет его использовать - независимо от того, является ли этот текст мусором или нет. В результате в сети появились миллионы файлов PDF с великолепно информативными заголовками, такими как: «Brkg2RechBrntGrtA122a. QXD ». Ну, кроме того факта, что дизайнер использовал Quark, я ничего не знаю (или хочу знать) об этом документе, глядя на результаты поиска.

    Убедитесь, что информационные поля документа PDF-файлов правильно представляют ваш документ
    Убедитесь, что информационные поля документа PDF-файлов правильно представляют ваш документ.

    Чтобы проверить информацию о заголовке PDF-файла в Acrobat, введите Control-D или перейдите в меню « Файл»> «Свойства документа» , а затем перейдите на вкладку « Описание », где можно добавить или исправить заголовок PDF, автора и другие метаданные по своему усмотрению. Существует множество сторонних серверных инструментов для чтения и записи метаданных PDF для поддержки или обработки больших коллекций файлов PDF.

    Хотя авторам PDF проще всего включить содержательный заголовок, результаты реального поиска ясно демонстрируют, что многие из них оставляют свои поля заголовков пустыми, фальшивыми или просто не беспокоятся вообще. Как и в приведенном выше примере, многие авторские приложения просто помещают информацию об имени файла в поле «Заголовок», предоставляя результаты поиска, которые варьируются от загадочных до совершенно бессмысленных.

    Что бы вы ни делали при публикации файлов PDF для публичного просмотра, важно иметь качественные метаданные заголовка.

    Обеспечение того, чтобы каждый PDF-файл содержал действительный и значимый заголовок, - это самый простой способ гарантировать, что результаты поиска будут отображать информацию, которая жизненно важна для получения пользователями того места, куда они хотят. Оставьте заголовки PDF без присмотра, и определенный результат - более медленный и менее надежный поиск для каждого пользователя при каждом поиске.


    Другие соображения

    Спецификация PDF: В начале 2006 года Google не мог индексировать файлы PDF выше спецификации 1.5. По состоянию на июль 2009 года Google индексирует контент даже из последней версии спецификации Adobe - 1.7 Adobe Extension Level 3 (Acrobat 9.x).

    Ограничения размера файла: нет поисковой системы. Я знаю, что индексирует каждое слово в каждом файле PDF. Хотя в 2006 году Google не индексировал файлы PDF размером более пары мегабайт, сегодня я наблюдаю, как Google индексирует текст из файлов PDF размером до 10 МБ. Однако гораздо больше, и Google просто полностью игнорирует PDF-файл.

    Конечно, также возможно, что ограничивающий фактор Google для файлов PDF основан на времени, необходимом для загрузки файла с данного сервера. Если это так, то более быстрые веб-сайты с более крупными каналами будут проиндексированы большим количеством своих больших файлов PDF, чем файлы того же размера, что и плохо работающий сервер.

    Ограничения объема текста. Размер файла является одним из способов ограничения содержимого, но для поисковых систем важен сам текст. PDF-файлы могут быть заполнены мегабайтами чистого текста.

    Несмотря на то, что я не знаю текущий верхний предел Google для текста, который он желает индексировать, я протестировал Отчет Комиссии 911, один из самых популярных отчетов на основе PDF в Интернете. На 585 страницах простой текст составляет 1,3 мегабайта, и каждое слово индексируется. Если ваши файлы намного больше, сначала опубликуйте и протестируйте их, выполнив поиск уникальной текстовой строки в конце документа.

    Если вы публикуете большие PDF-файлы (например, из-за размера включенных изображений) и очень важно, чтобы Google проиндексировал весь контент, рассмотрите возможность публикации по главам. Таким образом, Google с меньшей вероятностью прекратит индексацию, скажем, на странице 57 документа на 112 страницах. OCR: Многие PDF-файлы - это просто отсканированные страницы без текста для поиска. До недавнего времени эти файлы PDF были фактически невидимы для поисковых систем, потому что, ну, нет текста для поиска.

    По состоянию на ноябрь 2008 года Google OCR считывает загружаемые файлы на основе изображений PDF без дополнительной оплаты. Это означает, что даже простые отсканированные страницы будут доступны для поиска, даже если владелец явно не сделал их таковыми. Насколько я знаю, Google (пока) является единственной поисковой системой, предлагающей эту функцию.

    Теперь OCR Google не самый лучший; он оптимизирован для скорости, а не точности. Вы можете сделать это самостоятельно и получить лучшие результаты поиска, запустив и контролируя качество своего собственного OCR, а затем публикуя результаты.

    Безопасность . Существует множество причин защитить PDF-файлы от нежелательных изменений или запретить извлечение содержимого. Если все сделано неправильно, возможно непреднамеренное блокирование поисковыми системами индексации текста в защищенном документе. Чтобы обеспечить возможность поиска в защищенных файлах PDF, установите флажок «Включить текстовый доступ для программ чтения с экрана» при шифровании файлов. Кроме того, при выборе совместимости с Acrobat 6.0 или выше обязательно «Зашифруйте все содержимое документа, кроме метаданных», чтобы обеспечить доступность метаданных PDF для поисковых систем.

    Порядок чтения содержимого. Внимательно посмотрите на результаты поиска, показывающие условия поиска в контексте, и вы можете найти странно разнесенный, дублированный или перемешанный текст. Если вы принимаете предложение Google «Просмотр в формате HTML», как я часто это делаю, текст часто выглядит ДЕЙСТВИТЕЛЬНО плохим, с разрозненными абзацами, заголовками, пониженными до текста и таблиц, столбцами и боковыми панелями, безнадежно запутанными.

    Если для вас имеет значение то, как поисковые системы извлекают и отображают результаты поиска, или если вы должны придерживаться специальных требований или стандартов Раздела 508 для веб-контента, планируйте ознакомиться с порядком чтения в PDF-содержимом и тегами, структурной информацией (заголовки, списки, таблицы и т. д.) файлов PDF.

    Чтобы обеспечить качественное представление результатов поиска, создатели PDF (как программное обеспечение, так и персонал) должны убедиться, что текст правильно упорядочен для целей извлечения. Вообще говоря, файлы PDF со сложными макетами, шрифтами и текстовыми эффектами (т. Е. Типичная маркетинговая литература или ценные отчеты), скорее всего, будут иметь проблемы с упорядочиванием и структурированием контента, тогда как более простые документы, созданные в Word, InDesign и т.п., имеют тенденцию иметь действительную (или, по крайней мере, лучше) структуру.

    Глубокое погружение в порядок содержимого и тегирование в файлах PDF выходит за рамки этой статьи, поскольку обеспечение правильного порядка содержимого не является простой опцией флажка. Однако, уделение внимания порядку содержимого может значительно улучшить способ отображения результатов поиска. Как порядок содержимого, так и теги могут быть рассмотрены в Adobe Acrobat Professional. ( Вид> Панели навигации> Теги и Вид> Панели навигации> Порядок )

    Чтобы начать определение порядка содержимого в Acrobat Professional, сначала выясните, помечен ли ваш файл. (Сочетание клавиш Control-D, затем проверьте вкладку «Описание») ....

    Этот небольшой рассказ - первоочередное свидетельство недоступного содержания
    Этот небольшой рассказ - первоочередное свидетельство недоступного содержания. Теги должны не только сказать «Да», но и теги также должны быть проверены.

    Если ваш PDF не структурирован и не помечен, вы можете быстро пометить его, используя команду « Дополнительно»> «Специальные возможности»> «Добавить метки в документ» . После добавления тегов просмотрите порядок упорядочения содержимого на панели «Содержимое» или откройте « Дополнительно»> «Специальные возможности»> «Порядок чтения TouchUp». Чтобы сделать ваши PDF-файлы действительно доступными и максимизировать их ценность для SEO, проверьте теги, убедитесь, что изображения имеют хороший альтернативный текст (также проиндексированный поисковыми системами) и убедитесь, что таблицы, списки и другие элементы структуры находятся в хорошем порядке.

    Получите правильный порядок чтения, как и Google
    Получите правильный порядок чтения, как и Google. Почему этот файл нуждается в помощи?

    Содержание . Как и любая веб-страница, документы PDF повышают ценность вашего сайта для SEO, если они содержат ключевые слова на видных местах и ​​заключены в заголовки (H1, H2) в файлах PDF. Не забудьте включить ссылки в PDF-файлы обратно на ваш собственный сайт. Пользователи, которые размещают ваши PDF-файлы на других серверах, будут публиковать ссылки на ваш собственный сайт - насколько это аккуратно?

    В общем, думайте о PDF-файлах как о веб-страницах, которые пользователи могут использовать в автономном режиме, и вы начнете получать множество идей о том, как заставить ваши PDF-файлы работать на вашем сайте, где бы они ни находились.

    Назовите этот файл ! Имя файла PDF часто является важной частью стратегий управления контентом. Чтобы имя файла также отвечало интересам поисковой оптимизации, попробуйте дать своим файлам осмысленные имена, включающие ключевые слова или отражающие заголовок файла.


    А как насчет других двигателей?

    Google - не единственная поисковая система, и хотя она (в настоящее время) доминирует, другие игроки могут похвастаться различными преимуществами. Yahoo, следующий по величине игрок, также индексирует PDF-файлы и отображает результаты поиска, используя почти тот же внешний вид, что и Google, включая опцию «Просмотреть как HTML». В кратком обзоре я не смог разглядеть существенную разницу между тем, как Google и Yahoo отображают результаты поиска в формате PDF.

    Поисковая система Bing от Microsoft стоит всего более восьми процентов поисков по всему миру в течение первого полного месяца после запуска. Как и Google, Bing индексирует PDF-файлы независимо от версии. В отличие от Google и Yahoo, Bing не предоставляет опцию «Просмотр в формате HTML» для содержимого на основе PDF.

    Как и следовало ожидать. все три движка ранжируют файлы PDF, используя очень разные алгоритмы. Правильно структурированные PDF-файлы должны повысить эффективность поиска в любой поисковой системе, а не только в Google.


    Заключение

    Большинство организаций, публикующих документы в своих внутренних сетях или на веб-сайтах, хотят, чтобы эти документы были легко найдены другими. Корпоративные интрасети полагаются на поисковые системы для ежедневного индексирования и извлечения всевозможных внутренних документов.

    В той степени, в которой PDF-файлы составляют значимый объем вашего контента с возможностью поиска (и вы бы не читали так далеко, если бы они этого не делали), вы обязаны убедиться, что ваши PDF-файлы будут выглядеть наилучшим образом под неустанным взглядом поисковые системы.

    Ключевые выносы:

    • Проверьте каждое описание PDF-файла (в свойствах документа) перед публикацией. Убедитесь, что все PDF-файлы имеют значимые заголовки, если не больше.
    • Добавьте структуру и соответствующие теги в файлы PDF, чтобы улучшить качество и внешний вид результатов поиска.
    • Могут применяться ограничения на размер файла. Постарайтесь сделать так, чтобы PDF-файлы, размещаемые в сети, были как можно меньше, чтобы минимизировать вероятность того, что поисковые системы сдадутся и не смогут проиндексировать документ.
    • Если вы публикуете отсканированные документы, распечатайте их до публикации.

    Вы знали?

    • Вы можете Задайте вопрос и получите ответ от одного из наших экспертов.
    • Вы можете искать в нашей базе данных более 800 уроков по продукту и / или теме.
    • Вы можете оставить комментарий ниже для автора этого урока.
    Насколько серьезна проблема?
    Хотите сосредоточиться на PDF-файлах в результатах поиска?
    Насколько серьезна проблема?
    Как сегодня выглядят файлы PDF на вашем сайте?
    Почему этот файл нуждается в помощи?
    Пользователи, которые размещают ваши PDF-файлы на других серверах, будут публиковать ссылки на ваш собственный сайт - насколько это аккуратно?
    А как насчет других двигателей?
    Вы знали?
    Профиль
    Реклама
    Деловой календарь
    Пн Вт Ср Чт Пт Сб Вс
     
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    Реклама
       
    Sti.lg.ua © 2016